Meta presenta Seamless M4T: traducción multimodal en tiempo real a casi 100 idiomas
La compañía tecnológica Meta, conocida por ser la propietaria de plataformas como Instagram, WhatsApp y Facebook, ha lanzado recientemente un sistema revolucionario de traducción basado en Inteligencia Artificial (IA) denominado Seamless M4T. Este sistema, presentado el martes, ofrece una solución de traducción que opera sin la necesidad de convertir audios en texto previo a la traducción. Además, es compatible con una impresionante variedad de casi 100 idiomas.
El anuncio de Meta destaca que este nuevo producto ha sido lanzado en modalidad abierta, lo que permite que investigadores y desarrolladores de todo el mundo puedan contribuir y trabajar en la mejora de lo que la compañía ya ha creado.
Leer también: Obras de IA no pueden ser protegidas por derechos de autor en EE. UU.
Según lo detallado en una publicación en el blog oficial de Meta, este nuevo sistema de traducción, denominado “el primer modelo de traducción de IA multimodal y multilingüe todo en uno”, ofrece reconocimiento de voz y traducción de voz a texto para casi 100 idiomas distintos. Además, tiene la capacidad de interpretar tanto voz como texto para ofrecer palabras traducidas en 36 idiomas diferentes en el caso de voz y 35 en el caso de texto.
Paco Guzmán, director de investigación científica en Meta, subrayó la agilidad de Seamless M4T al no necesitar de un modelo intermedio para generar resultados, en contraste con otros sistemas que operan en cascada. Guzmán explicó en una entrevista a Axios que este sistema permite cambiar de idioma sobre la marcha, siendo especialmente útil para aquellas poblaciones que naturalmente combinan lenguajes en su comunicación diaria.
El modelo Seamless M4T de Meta es capaz de realizar diversas funciones, como:
- Reconocimiento de voz para casi 100 idiomas.
- Traducción de voz a texto para casi 100 idiomas en la entrada y la salida.
- Traducción de voz a voz, compatible con casi 100 idiomas en la entrada y 36 (incluido el inglés) en la salida.
- Traducción de texto a texto para casi 100 idiomas.
- Traducción de texto a voz, compatible con casi 100 idiomas en la entrada y 35 (incluido el inglés) en la salida.
La compañía enfatizó que este lanzamiento se basa en avances obtenidos tanto por sus propios equipos como por otros externos a lo largo de los últimos años, con el objetivo de construir un “traductor universal”.
Es importante mencionar que el año pasado, Meta lanzó “No Language Left Behind (NLLB)”, un modelo de traducción automática de texto a texto que admite 200 idiomas, y desde entonces se ha integrado en Wikipedia como uno de los proveedores de traducción. Además, la compañía ya había compartido una demostración de su traductor universal de voz, y a principios de este año presentaron “Massively Multilingual Speech”, que ofrece reconocimiento de voz, identificación de idiomas y tecnología de síntesis de voz en más de 1.100 idiomas.
LEER: Capacitación de rescate con cuerdas reúne a bomberos de la región en la costanera de San Nicolás