Google lanza Veo, su IA para hacer vídeos ultrarrealistas y de alta resolución

 Google lanza Veo, su IA para hacer vídeos ultrarrealistas y de alta resolución

Unsplash

Google ha lanzado Veo, su modelo de inteligencia artificial más avanzado para generar vídeos, marcando un hito en la producción de contenido audiovisual. Este innovador sistema promete transformar la forma en que se crean vídeos, ofreciendo herramientas accesibles tanto para profesionales del cine como para creadores de contenido y educadores.

¿Qué es Google Veo?

Veo es el modelo de generación de videos más sofisticado de Google hasta la fecha. Es capaz de crear videos en alta definición, con una resolución de 1080p, y puede producir secuencias que superan el minuto de duración. Lo que distingue a Google Veo es su habilidad para capturar la esencia y el tono de un prompt textual, ofreciendo un nivel de control creativo sin precedentes. La IA puede interpretar comandos para efectos cinematográficos específicos, como time lapses o tomas aéreas de paisajes.

Funcionalidades clave

  1. Creación de vídeo a partir de texto: Veo permite generar vídeos de alta calidad a partir de descripciones textuales. Esta capacidad abre un abanico de posibilidades para contar historias y compartir conocimientos de manera visual y dinámica.
  2. Edición de vídeo precisa: Con Google Veo, es posible modificar videos existentes mediante comandos textuales, como agregar elementos a una toma aérea de una costa. También soporta la edición con máscara, permitiendo cambios específicos en áreas seleccionadas del video.
  3. Consistencia en los cuadros: Uno de los mayores desafíos en la generación de vídeos es mantener la coherencia visual entre cuadros. Veo utiliza transformadores de difusión latente para reducir inconsistencias, asegurando que personajes y objetos permanezcan estables a lo largo del video.
  4. Integración de imágenes: Veo puede generar videos utilizando imágenes como referencia junto con un prompt textual, adaptando el estilo del video a la imagen proporcionada.
  5. Extensión de clips: Este modelo es capaz de crear y extender clips hasta 60 segundos o más, ya sea a partir de un solo prompt o una secuencia de ellos que narren una historia.

Tecnología y desarrollo

Google Veo se basa en años de investigación en modelos de generación de videos, incluyendo el Generative Query Network (GQN), DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet y Lumiere. Estos modelos, combinados con la arquitectura Transformer y las capacidades de Gemini, forman el núcleo de Veo.

Para mejorar la precisión en la interpretación de prompts, Google ha enriquecido las descripciones de video en los datos de entrenamiento de Veo y utiliza representaciones comprimidas de alta calidad para hacer el modelo más eficiente. Estos avances no solo mejoran la calidad general, sino que también reducen el tiempo necesario para generar videos.

Disponibilidad de Veo

En las próximas semanas, algunas de las funciones de Google Veo estarán disponibles para creadores seleccionados a través de VideoFX, una nueva herramienta experimental en labs.google. Además, Google planea integrar algunas capacidades de Veo en productos como YouTube Shorts, ampliando su alcance y utilidad.

Google enfatiza la importancia de la responsabilidad en la implementación de tecnologías como Veo. Los videos generados por esta IA estarán marcados con SynthID, una herramienta avanzada para identificar y marcar contenido creado por IA. Además, todos los videos pasarán por filtros de seguridad y procesos de verificación para mitigar riesgos relacionados con privacidad, derechos de autor y sesgos.

El desarrollo futuro de Google Veo se verá influenciado por la colaboración con creadores y cineastas líderes, cuya retroalimentación ayudará a mejorar estas tecnologías generativas y garantizar su beneficio para la comunidad creativa en general.

Google Veo representa un avance significativo en la creación y edición de videos mediante inteligencia artificial. Con sus avanzadas capacidades de interpretación de texto y generación de contenido visual, promete democratizar la producción de videos, permitiendo a más personas explorar y expandir su creatividad.

También te puede interesar: Imagen 3, la nueva IA de Google para crear imágenes

Pierangela Morillo

Soy Pierangela, redactora especializada en reviews de software. Te ofrezco análisis detallados de aplicaciones para administrar empresas.

Quizás te interese...

Dejar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

¡Prueba Nuestra Nueva Herramienta!

Suscríbete a nuestro Newsletter y desbloquea por completa nuestra herramienta de optimización de imágenes. Sube hasta 50 imágenes simultaneas para convertir, optimizar y geolocalizar con nuestra herramienta.