¡Sigue innovando! Google presenta Gemini Omni: modelo de IA para crear videos

Estados Unidos.- Google presentó este martes Gemini Omni, un modelo de inteligencia artificial diseñado para crear y editar videos a partir de múltiples formatos de entrada. El sistema permite generar contenido multimedia mediante texto, imágenes, audio y video como fuentes de información.

La plataforma incorpora funciones avanzadas de edición conversacional que facilitan la modificación de material audiovisual. Los usuarios pueden interactuar con la herramienta mediante diálogos para ajustar, refinar y personalizar el contenido generado según sus necesidades específicas.

¿Cuáles son las principales capacidades de Gemini Omni?

El modelo ofrece la posibilidad de crear videos desde cero utilizando descripciones textuales como punto de partida. La inteligencia artificial traduce instrucciones escritas en contenido visual, permitiendo a los usuarios materializar ideas sin necesidad de conocimientos avanzados en edición de video o producción audiovisual.

Gemini Omni también puede procesar imágenes estáticas y convertirlas en secuencias de video animadas. Esta capacidad amplía las opciones creativas disponibles para profesionales de contenido, creativos digitales y desarrolladores que requieren generar material multimedia rápidamente.

La integración de audio como entrada permite que la inteligencia artificial sincronice elementos visuales con pistas de sonido. El sistema analiza las características del audio y genera imágenes o videos que se corresponden temporalmente con el material acústico proporcionado.

¿Cómo funciona la edición conversacional del sistema?

Los usuarios pueden mantener diálogos con Gemini Omni para solicitar cambios en el contenido ya generado. Este enfoque conversacional elimina la necesidad de interfaces complejas o comandos técnicos, haciendo la herramienta más accesible para usuarios sin experiencia en softwares de edición profesional.

La capacidad de edición iterativa permite refinar el material en múltiples rondas de interacción. Un usuario puede solicitar ajustes de color, movimiento, duración o composición visual mediante conversación natural, y la inteligencia artificial implementa los cambios automáticamente.

Google señaló que Gemini Omni combina capacidades de procesamiento de múltiples formatos dentro de una única plataforma. Esta integración elimina la necesidad de cambiar entre diferentes herramientas o servicios para completar tareas complejas de producción audiovisual.

La presentación de Gemini Omni marca un avance en la evolución de los modelos de inteligencia artificial generativa enfocados en contenido multimedia. El acceso a esta tecnología podrá expandir las opciones disponibles para creadores de contenido en México y otras regiones que utilicen servicios de Google.

Fuente: Tribuna del Yaqui

¿Cuáles son las principales capacidades de Gemini Omni?

¿Cómo funciona la edición conversacional del sistema?

Te puede interesar

Arsenal se corona campeón de la Premier League y rompe sequía de 22 años sin el título

Refuerzan operativos de vigilancia para ordenar comercio y liberar banquetas en Cajeme

Mhoni Vidente: Horóscopos y PREDICCIONES de HOY domingo 17 de mayo de 2026 para tu signo zodiacal

Trump cambia su postura sobre Taiwán: Advierte de riesgos en caso de intentar su independencia de China