Elai, para crear videos con voz realista a partir de texto

Crear una presentación con una voz narrando nuestro texto, sin necesidad de abrir la boca, es el sueño de mucha gente.

Hoy en día las aplicaciones de generación de voz a partir de texto ya son muy sofisticadas, y hoy nos han presentado una que lo demuestra.



Se trata de Elai.io, una plataforma en la que podemos crear slides con texto y dejar que una voz de fondo se encargue de leerlo. Es compatible con 65 idiomas, y el resultado es realmente natural. Hay varias voces disponibles para cada idioma, por lo que los resultados pueden ser muy flexibles. Mirad el resultado en nuestro TikTok, se puede ver como la presentadora mueve los labios de forma relativamente sincronizada con el audio.

@wwwhatsnewelai.io – Creación de voz artificial a partir de texto♬ sonido original – Wwwhatsnew

Solo tenemos que diseñar la presentación como si fuera cualquier aplicación tipo Powerpoint. En cada una pondremos un texto debajo, indicando el idioma correspondiente de la lectura. La versión gratuita permite presentaciones de hasta 3 slides, y una narración de voz de hasta 5 minutos. Podemos también subir nuestro archivo de audio, e incluir silencios para que el resultado sea más natural.

Elai tiene un modelo de negocio basado en la cantidad de vídeo generado, más diapositivas y más audio generado, representará más coste.

Una vez tenemos el texto y la presentación diseñada, pulsaremos en el botón render para que se genere el vídeo. El resultado, después de la moderación (no permiten cualquier tipo de contenido, ya que hay una política de uso basada en el sentido común), llegará en formato de vídeo, listo para divulgarse en cualquier plataforma o reproducirse en cualquier dispositivo.

He notado que el renderizado tarda bastante para un ejemplo de solo 7 segundos, principalmente por causa de la moderación, que tarda mucho, por lo que hay que tener paciencia en ese sentido. Leer con nuestra voz y juntar el resultado con la presentación muda puede ser una opción más viable para muchos, aunque requiera más trabajo y más edición.

Fuente: Link