La edición de video acaba de entrar en una nueva etapa. Google presentó Gemini Omni Flash, un modelo de Inteligencia Artificial capaz de crear y modificar videos utilizando únicamente lenguaje natural, sin necesidad de software especializado ni conocimientos avanzados de edición.
La herramienta fue desarrollada por Google DeepMind y representa uno de los movimientos más ambiciosos de la compañía en el terreno de la IA generativa multimodal.
Editar videos ahora funciona como una conversación
La principal novedad de Gemini Omni es que permite editar contenido audiovisual mediante instrucciones escritas como si se tratara de un chat.
El usuario puede subir un video y escribir comandos simples como:
- “Cambia la mariposa por una abeja”
- “Haz que la escena se vea estilo anime”
- “Aplica un zoom cinematográfico”
- “Convierte la iluminación en nocturna”
El sistema procesa las instrucciones y modifica el video manteniendo coherencia visual entre escenas y personajes.
A diferencia de modelos anteriores como Google Veo, Omni puede interpretar contexto, recordar cambios previos y completar detalles automáticamente utilizando razonamiento basado en conocimiento visual, físico y narrativo.
Omni combina video, audio, imágenes y texto
Google explicó que Gemini Omni es el primer modelo de la empresa capaz de trabajar simultáneamente con distintos tipos de entradas:
- Texto
- Video
- Audio
- Imágenes
- Storyboards
Esto permite, por ejemplo, subir un video, agregar una imagen de referencia y sincronizarlo con música o narración de voz.
Según la documentación técnica publicada por Google DeepMind, Omni puede interpretar terminología cinematográfica profesional como:
- “Dolly zoom”
- “Push in”
- “Locked off”
- “Film camera”
- “Webcam style”
El modelo ajusta automáticamente movimientos de cámara, iluminación, encuadres y estilos visuales.
Cómo escribir mejores prompts en Gemini Omni
Google recomienda incluir detalles específicos para obtener resultados más precisos.
La guía técnica señala cinco elementos clave:
1. Movimiento de cámara
Definir si la escena requiere primer plano, plano abierto, cámara fija o movimientos dinámicos.
2. Estilo visual
Indicar si el resultado debe verse cinematográfico, documental, animado, realista o experimental.
3. Iluminación
Describir el tipo de luz y ambiente: cálido, frío, nocturno, natural o futurista.
4. Locación
Explicar el entorno donde ocurre la escena, como ciudades, interiores o paisajes ficticios.
5. Acción
Detallar qué sucede dentro de la escena y cómo interactúan personajes u objetos.
¿Dónde puede usarse en México?
Gemini Omni Flash ya comenzó a desplegarse en México mediante varias plataformas de Google.
Disponible en:
- YouTube Shorts
- YouTube Create
Estas opciones tienen acceso gratuito para usuarios generales.
Disponible con suscripción:
- Gemini
- Google Flow
En estos casos, algunas funciones requieren planes Google AI Pro o Google AI Ultra.
Google adelantó que las APIs para desarrolladores y empresas llegarán durante las próximas semanas.
Videos con marca de agua invisible
Todos los videos creados con Omni incluyen SynthID, una tecnología desarrollada por Google para identificar contenido generado mediante IA.
La compañía señaló que esta medida busca ayudar a detectar material sintético y reducir riesgos relacionados con desinformación o manipulación audiovisual.
Además, Google confirmó que trabaja en nuevas funciones como:
- Generación nativa de audio
- Creación de imágenes
- Avatares digitales personalizados
- Edición avanzada de voz
La carrera global por la IA creativa
El lanzamiento de Gemini Omni ocurre en medio de una competencia acelerada entre gigantes tecnológicos como OpenAI, Meta y Adobe por liderar el mercado de herramientas creativas impulsadas por Inteligencia Artificial.
Expertos consideran que estas plataformas podrían modificar industrias completas como publicidad, cine, marketing digital, creación de contenido y producción audiovisual independiente.
Para creadores mexicanos, agencias y medios digitales, la posibilidad de editar videos mediante texto reduce tiempos de producción y facilita procesos que antes requerían equipos especializados.
