
Un nuevo sistema de traducción por IA, llamado Spatial Speech Translation, ha sido diseñado para auriculares capaces de clonar múltiples voces simultáneamente. Este avance busca resolver uno de los mayores desafíos de la traducción automática: entender a varias personas hablando al mismo tiempo. Imagina una cena donde amigos cambian entre diferentes idiomas; ahora podrías comprender todo lo que dicen gracias a este innovador sistema.
El sistema detecta la dirección y las características vocales de cada hablante, permitiendo al usuario identificar quién dice qué en entornos grupales. Shyam Gollakota, profesor de la Universidad de Washington, explica que superar las barreras del lenguaje podría empoderar a personas como su madre, que tiene grandes ideas, pero lucha por comunicarse cuando visita EE. UU. Este sistema puede ser transformador para muchos.
Spatial Speech Translation utiliza dos modelos de IA para interpretar y traducir voces de diferentes idiomas como francés, alemán y español a texto en inglés. Al hacerlo, también clona la voz del hablante, haciendo que la traducción suene natural. Aunque se han logrado avances significativos, el equipo continúa trabajando para reducir el tiempo de respuesta de la traducción, haciendo que las conversaciones sean más fluidas y naturales entre hablantes de diferentes idiomas.
Leave a Reply