Cómo Amazon Alexa aísla las palabras de activación

Cuando algunas personas escucharon que los empleados de Amazon escuchan lo que se graba en Alexa, asumieron que pueden escuchar todo lo que sucede en sus hogares. Esto no es verdad. Alexa no puede grabar sin usar una palabra de activación.

los Amazon Echo y otros asistentes de voz que utilizan palabras de activación solo pueden grabar los comandos de voz realizados después de la palabra de activación. En el caso de Amazon, esa palabra es Alexa. Pero, ¿cómo reconoce el dispositivo la palabra Alexa en medio de las otras voces y ruidos de fondo en nuestros hogares?

Tres tecnologías trabajando juntas

Hay tres tecnologías en el sistema Alexa que, cuando funcionan juntas, permiten que el dispositivo reconozca la palabra de activación. Nada más comenzará la grabación. Estas tecnologías son los micrófonos de la máquina, un búfer de memoria de tres segundos y entrenamiento de redes neuronales.

Micrófonos

El Amazon Echo tiene un sistema de múltiples micrófonos que le permite captar el sonido de la palabra de activación. Estos micrófonos pueden identificar la palabra de activación entre todos los demás sonidos que se encuentran en el fondo. Cuando el dispositivo escucha la palabra, comienza a grabar y verá un anillo de luz azul oscuro en la parte superior.

Micrófonos Alexa Wake Word

Los micrófonos también determinan la dirección de donde proviene la palabra para que puedan enfocarse en esa dirección. Cuando el dispositivo determina la dirección, una luz de color azul más claro seguirá el sonido de su voz.

Memoria limitada

La memoria integrada en el dispositivo Echo solo retiene tres segundos de datos a la vez. Luego, los datos se borran y se sobrescriben. Para aquellos de ustedes que tengan la edad suficiente para recordar cintas de casete, sería como grabar durante tres segundos y luego rebobinar hasta el principio y grabar durante tres segundos nuevamente. Alexa no transmite datos hasta que reconoce la palabra de activación.

Entrenamiento de redes neuronales

Sin entrar en detalles técnicos alucinantes, una red neuronal es una serie de conexiones artificiales diseñadas para funcionar de manera similar al cerebro humano. Amazon usa esta tecnología para entrenar a Alexa a reconocer la palabra de activación sin importar cuán alta o baja sea la voz o el acento con el que el usuario la diga.

Entrenamiento de red neuronal de Alexa Wake Word

Cada palabra que escucha Alexa pasa por varias capas de pruebas. Esta prueba determina si la palabra es la palabra de activación. Después de que la palabra pasa a través de varias capas de verificación, y el dispositivo Echo determina que efectivamente fue la palabra de activación, Alexa comienza a grabar.

Precisión del reconocimiento de palabras de activación

A la gente le preocupa que Alexa comience a grabar sin escuchar realmente la palabra de activación. Por lo tanto, es vital que Alexa no comience a grabar sin que alguien le hable directamente. Reconocer la palabra y no confundirla con otras palabras es una prioridad absoluta.

El software se basa en datos que representan todas las formas posibles de decir la palabra Alexa. Estos datos ayudan al dispositivo a determinar cuándo el usuario está hablando con el dispositivo. Amazon también usa otros datos que recibe para asegurarse de que no se active al escuchar la palabra en una conversación casual o ruido de fondo.

Las empresas que usan la palabra Alexa en sus comerciales envían ese comercial a Amazon. Suben el sonido de la palabra de activación en el anuncio a la red neuronal. Estos datos le enseñan a Alexa a ignorar ese sonido.

Al usar la red, Amazon se asegura de que el dispositivo no comience a grabar cuando la palabra Alexa se encuentre en el ruido de fondo. Si alguien dice “Alexa” durante un programa de televisión, la cadena entiende que no es probable que una gran cantidad de dispositivos escuchen la misma palabra, en el mismo tono, exactamente al mismo tiempo. Ignorará el sonido y no comenzará a grabar.

Borrar conversaciones almacenadas

Si no desea que Alexa escuche la palabra de activación, lo más simple que puede hacer es presionar el botón de silencio en la parte superior del dispositivo. No escuchará hasta que vuelva a encender los micrófonos.

Alexa Wake Word Mute

Puede cambiar su configuración para mantener sus datos privados. En la aplicación móvil, abra la configuración y luego seleccione “Administrar cómo mejoran sus datos a Alexa”, luego cambie los interruptores a la posición de apagado.

Ahora incluso puedes decirle a Alexa que olvide todo lo que dijiste ese día. Primero, habilite la habilidad abriendo la configuración, luego Revise el historial de voz. Encienda el interruptor. Luego, cuando dices, “Alexa, borra todo lo que dije hoy”, el servidor borra todos los datos de ese día.

Amazon está realizando mejoras en el sistema Alexa. Tienen nueva tecnología en la matriz de micrófonos y la red neuronal para hacer que el sistema sea aún más preciso. Mientras tanto, si le preocupa la privacidad, tome medidas para mantener sus datos fuera de los servidores.

¿Es útil este artículo?

¡Ayúdanos a correr la voz!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *