El pasado 20 de mayo, Google celebraba su evento anual de desarrolladores, el Google I/O. Como parte de esta presentación, la compañía ha sorprendido al mundo presentando a Veo 3, la versión más actualizada de su modelo de generación de vídeos Veo. La principal novedad que ofrece es que el contenido generado ahora cuenta con música e incluso voz, no solo haciendo mucho más sencillo y llevadero el proceso para los usuarios, sino además garantizando mejores resultado.
Se trata de un grandísimo hito en el terreno de la IA. A primera vista, no hay problemas en la generación como cambios en la anatomía o la morfología del sujeto —el marinero—, quien se mueve de manera natural. Además, la breve narración cuenta con una sincronización labial prácticamente perfecta, por lo que da la impresión de que estamos ante un pequeño clip de vídeo procedente de alguna serie, película o documental. Es algo más relevante de lo que parece, y no es descabellado afirmar que estamos ante un pequeño gran hito en el terreno de las inteligencias artificiales y modelos de lenguaje.
Según Google, Veo 3 “excede las expectativas” a la hora de plasmar vídeos a partir de entradas de texto e imágenes. Su entendimiento a la hora de crear lo que el usuario le pide es enorme, y las físicas son lo suficientemente convincentes como para ofrecer un resultado solvente. Veo 3 está disponible desde el 20/05/2025 para los suscriptores Ultra de la app Gemini en Estados Unidos, y también está disponible para empresas a través de Vertex AI.
Deja una respuesta