Meta presenta Voicebox, una inteligencia artificial generativa con voz entrenada con audiolibros

Meta ha presentado Voicebox, un nuevo modelo de inteligencia artificial (IA) con capacidad para realizar tareas de generaciĆ³n del lenguaje, incluso aquellas para las que no ha sido entrenado con un aprendizaje contextualizado.

Voicebox es el primer paso para una herramienta que pueda dotar de voz natural a los asistentes virtuales y a los personajes no jugables del metaverso, pero tambiƩn para ayudar a las personas con discapacidad auditiva los mensajes que reciben.

La compaƱƭa tecnolĆ³gica considera que se trata de Ā«un gran avanceĀ» en la IA generativa para lenguaje, dado que este modelo puede realizar tareas como editar, crear muestras y estilizar, e incluso aquellas para las que no fue entrenado especĆ­ficamente mediante aprendizaje contextualizado.

Voicebox puede producir clips de audio de alta calidad a partir de una muestra de dos segundos, y editar audio pregrabado para recuperar en Ć©l la voz entrecortada por un ruido ambiente, como el ladrido de un perro.

Meta tambiĆ©n ha destacado que se trata de un modelo multilingĆ¼e, lo que permite la producciĆ³n de voz en seis idiomas (inglĆ©s, francĆ©s, alemĆ”n, espaƱol, polaco o portuguĆ©s), segĆŗn recoge en su blog oficial.

Para el entrenamiento Voicebox, los investigadores de Meta han empleado mƔs de 50.000 horas de grabaciones de audio y transcripciones procedentes de audiolibros de dominio gratuito en los seis idiomas mencionados.

ApĆŗntate a nuestra newsletter y recibe en tu correo las Ćŗltimas noticias sobre tecnologĆ­a.

Explore additional categories

Ponete al dĆ­a con series, cine y mĆŗsica