¡Increíble! Unos audífonos que traducen voces múltiples en tiempo real están aquí.

Un nuevo sistema de traducción de AI llamado Spatial Speech Translation ha sido desarrollado para audífonos y está revolucionando la forma en que nos comunicamos en entornos multilingües. Este sistema aborda el desafío de la traducción automática al permitir la traducción simultánea de múltiples voces en tiempo real. Imagina disfrutar de una cena con amigos que hablan diferentes idiomas, y poder entender cada palabra sin esfuerzo. Esta tecnología promete mejorar la comunicación entre personas que, de otro modo, tendrían barreras lingüísticas.

La clave de los audífonos es su capacidad para rastrear la dirección y características vocales de cada hablante, facilitando al usuario identificar quién dice qué. Esta innovación, presentada en la Conferencia ACM CHI en Japón, es especialmente significativa para quienes suelen enfrentarse a dificultades al interactuar en un nuevo idioma. Shyam Gollakota, uno de los creadores, señala que este sistema podría transformar la vida de personas como su madre, que tiene excelentes ideas en su lengua materna pero lucha por comunicarse en el extranjero.

Spatial Speech Translation utiliza dos modelos de AI para dividir el espacio que rodea al usuario y identificar los hablantes, logrando así que la traducción suene natural y similar a las voces originales, en contraste con traducciones mecánicas tradicionales. Mientras los desarrolladores trabajan en disminuir el tiempo de espera para que la traducción se inicie, la meta es lograr menos de un segundo de latencia en la conversación, manteniendo el flujo natural de la comunicación entre personas de diferentes lenguas.

¡Increíble! Unos audífonos que traducen voces múltiples en tiempo real están aquí.

Comments

Leave a Reply Cancel reply