La última IA de OpenAI puede crear vídeos a partir de textos

La última herramienta de inteligencia artificial de la compañía es Sora, un modelo capaz de crear secuencias de vídeo de elevada fidelidad a partir de una simple descripción de texto.

«Sora es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo. El modelo entiende no sólo lo que el usuario ha pedido, sino también cómo son las cosas en el mundo real», explican desde OpenAI.

No es el primer motor generativo que trata de conseguir escenas en movimiento pero hasta ahora los resultados de las alternativas dejaban bastante que desear. Aunque herramientas como Dall-E. Midjourney o Imagen son capaces de crear imágenes estáticas muy realistas, es difícil para una inteligencia artificial mantener la coherencia de los diferentes elementos en una secuencia de vídeo.

Los resultados llegan a ser cómicos, carne de memes. A las manos les crecen dedos, la ropa cambia de color e incluso de talla y corte. Un vídeo especialmente gracioso que circula por la red muestra una recreación del actor Will Smith comiendo espagueti en el que la pasta parece tener vida propia.

Sora tiene fallos también pero logra escenas mucho más realistas que la inmensa mayoría y, tal vez más importante, de mayor duración, hasta de un minuto. Los vídeos tienen también una buena resolución, equivalente a 1080p. Algunos de los ejemplos que OpenAI muestra en su web son realmente sorprendentes y si uno no se fija en los detalles, prácticamente indistinguibles de un vídeo real.

El motor consigue también crear escenas convincentes de animación tridimensional o mezclar objetos realistas con otros claramente generados por ordenador.

El realismo de los resultados vuelve a poner el foco en el potencial de estas herramientas en campañas de desinformación. Es relativamente sencillo crear escenas que pueden parecer reales pero que son imaginarias, mucho más de lo que era posible conseguir hasta ahora con avanzadas herramientas de edición de vídeo y audio.

Fuente: www.elmundo.es


Comentarios

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *