Usted esta aquí
Inicio > Regionales >

Competencia china: la impresionante IA capaz de generar videos de retratos

Competencia china: la impresionante IA capaz de generar videos de retratos

La inteligencia artificial ha alcanzado un nuevo nivel de sofisticación con la creación de EMO, una IA generativa desarrollada por Alibaba. Esta impactante tecnología es capaz de generar videos de retratos que emulan cantar o hablar, a partir de un archivo de audio y una imagen de referencia.

El equipo detrás de EMO, compuesto por Linrui Tian, Qi Wang, Bang Zhang y Liefeng Bo, pertenecientes al Instituto de Inteligencia Computacional del Grupo Alibaba, ha logrado resultados asombrosos. La sincronización labial es impecable y las expresiones faciales se ajustan de manera natural al tono de voz, según informa la empresa.

Un ejemplo notable de las capacidades de EMO es la representación de Audrey Hepburn cantando «Perfect» de Ed Sheeran. Este ejemplo demuestra la capacidad de la inteligencia artificial para generar contenido audiovisual expresivo y convincente, adaptando las expresiones faciales al contenido del habla.

A pesar de su impresionante desempeño, EMO aún se encuentra en etapa de investigación y no está disponible públicamente para su uso general. Sin embargo, se han compartido varios ejemplos que ilustran las diversas posibilidades de esta herramienta.

Además de reproducir escenas de personas cantando o hablando, EMO también demuestra su versatilidad al generar videos que representan emociones como enfado, felicidad o reflexión, a partir de una única imagen de referencia. Esto amplía aún más las posibilidades de aplicación de esta increíble tecnología.

Otro aspecto destacado de EMO es su capacidad para ajustar la duración de los videos de retratos de acuerdo con el archivo de audio proporcionado. A lo largo de todo el video, el personaje mantiene su consistencia, ofreciendo resultados coherentes y expresivos.

Alibaba ha logrado crear una IA generativa de alto impacto con EMO, una herramienta que promete revolucionar la forma en que se genera contenido audiovisual. Aunque aún se encuentra en desarrollo, se vislumbra un futuro donde la creatividad y la expresividad de la inteligencia artificial serán inigualables.


Ir arriba