
Un nuevo sistema de traducción de IA para auriculares ha sido desarrollado, capaz de clonar múltiples voces simultáneamente. Este avance, conocido como Traducción Espacial de Voz, enfrenta uno de los mayores desafíos de la traducción automática: múltiples personas hablando a la vez. Imagina poder disfrutar de una cena con amigos que conversan en distintos idiomas, pero aún así entender lo que dicen sin barreras lingüísticas. Esto es justo lo que busca lograr esta nueva tecnología.
El sistema utiliza micrófonos integrados en auriculares con tecnología de cancelación de ruido, conectados a un ordenador con un potente chip Apple M2, lo que permite la implementación de redes neuronales. A diferencia de otros sistemas de traducción que se enfocan en un solo hablante, esta tecnología rastrea la dirección y las características vocales de cada persona en una conversación, proporcionando traducciones en tiempo real que suenan más naturales y menos robóticas.
El equipo detrás de este proyecto está trabajando en reducir la latencia en las traducciones para facilitar conversaciones más fluidas. La meta es lograr que las traducciones se realicen en menos de un segundo, lo que permitiría mantener el ritmo natural de una conversación multilingüe. Aunque el desafío es considerable, los resultados iniciales son prometedores y podrían transformar la comunicación global en diversos entornos.
Leave a Reply