
Un nuevo sistema de traducción AI ha sido desarrollado para auriculares, permitiendo la traducción simultánea de múltiples voces en tiempo real. Llamado Spatial Speech Translation, este sistema aborda uno de los mayores desafíos de la traducción automática: la dificultad de comunicarse cuando varias personas hablan al mismo tiempo. Imagínate disfrutar de una cena con amigos que cambian entre diferentes idiomas y aun así comprender lo que dicen, gracias a esta innovadora tecnología.
Este sistema, diseñado para funcionar con auriculares canceladores de ruido y requerido un chip de silicio M2 de Apple, utiliza dos modelos de inteligencia artificial. El primero divide el espacio alrededor del usuario en regiones, identificando la dirección de los hablantes, mientras que el segundo traduce el habla de francés, alemán o español al inglés, utilizando bases de datos de acceso público. Una parte impresionante es que el sistema logra ‘clonar’ las voces de los hablantes, haciendo que las traducciones suenen naturales y auténticas, en lugar de robóticas.
Mientras los modelos de lenguaje han mejorado en los últimos años, aún existen desafíos. Principalmente, el tiempo que tarda la traducción en iniciarse después de que un hablante se expresa, es crucial para mantener la fluidez de la conversación. El equipo sigue trabajando para reducir esta latencia, buscando equilibrar rapidez y precisión para conseguir una experiencia conversacional más natural, independientemente del idioma que se hable.
Leave a Reply