Guía de Prompts de Veo 3.1: Domina la Generación de Video IA Con Técnicas Expertas

Guía de Prompts de Veo 3.1: Domina la Generación de Video IA Con Técnicas Expertas
Veo 3.1 es el modelo de generación de video IA más avanzado de Google, capaz de producir video cinematográfico en 1080p con audio sincronizado, diálogos y efectos de sonido. Pero la calidad de tu resultado depende completamente de cómo escribas tus prompts. Después de pruebas exhaustivas, el equipo de AI Video Lab ha compilado esta guía completa de prompts de Veo 3.1 que cubre desde estructura básica hasta técnicas cinematográficas avanzadas.
- Estructura cada prompt con cinco elementos centrales: sujeto, acción, escena, estilo y audio
- Usa terminología cinematográfica (ángulos de cámara, tipos de lentes, iluminación) para resultados de calidad profesional
- Mantén las instrucciones de cámara simples y evita apilar movimientos competitivos
- Agrega diálogos entre comillas y describe efectos de sonido explícitamente para generación de audio nativo
- Comienza con clips de 4 segundos a 720p para iterar, luego escala una vez que tu prompt funcione
Prueba los Prompts de Veo 3.1 Ahora
Pon estas técnicas de prompts en práctica al instante. Los nuevos usuarios obtienen créditos gratis para comenzar a generar videos.
Cada prompt efectivo de Veo 3.1 debe incluir cinco dimensiones centrales que juntas construyen la lógica espacial-temporal del video. Piensa en estos como bloques de construcción que el modelo usa para entender exactamente qué quieres.
| Elemento | Qué Controla | Ejemplo |
|---|---|---|
| Sujeto | Quién o qué aparece en el encuadre | "Una mujer de 30 años con un suéter suave" |
| Acción | Qué hace el sujeto | "toma su primer sorbo de café" |
| Escena | Ambiente, tiempo, clima | "pequeño balcón con vista a una calle tranquila al amanecer" |
| Estilo | Estética visual y atmósfera | "estética de estilo de vida cálida, profundidad de campo reducida" |
| Audio | Diálogos, sonidos, música | "pájaros cantando suavemente, murmullo distante de la ciudad" |
Aquí tienes un ejemplo que combina los cinco elementos:
Close-up shot of a woman in her 30s taking first sip of coffee on small balcony overlooking quiet city street. Wrapped in soft sweater, morning light grazing her face. Birds chirping softly in the background. TV commercial style, warm color grading.
La percepción clave es que Veo 3.1 lee tu prompt de manera holística. Cada elemento que incluyes (o dejas fuera) moldea el resultado final.
La terminología de cámara es donde Veo 3.1 realmente sobresale. El modelo tiene un entendimiento excepcional del lenguaje cinematográfico, y especificar longitud focal, ángulo y trayectoria de movimiento mejorará dramáticamente tus resultados por encima de prompts genéricos.
| Tipo de Toma | Cuándo Usar | Palabra Clave del Prompt |
|---|---|---|
| Plano general | Establecer escenas, paisajes | "wide shot", "establishing shot" |
| Plano medio | Conversaciones, acción general | "medium shot", "waist-up" |
| Primer plano | Emociones, detalle del producto | "close-up", "tight shot" |
| Primer plano extremo | Textura, micro-detalle | "macro shot", "extreme close-up" |
| POV | Inmersivo, primera persona | "POV shot", "first-person view" |
Veo 3.1 sigue acciones de cámara claras y simples mucho mejor que instrucciones apiladas y competitivas. Usa un movimiento primario de cámara por prompt para mejores resultados.
- Dolly in / Dolly out - La cámara se mueve hacia o lejos del sujeto. Excelente para construir tensión o revelar contexto.
- Pan shot - La cámara rota horizontalmente. Usar para escanear ambientes o seguir movimiento lateral.
- Tracking shot - La cámara sigue al sujeto. Crea inmersión y conexión con el espectador.
- Crane shot - La cámara se eleva o desciende verticalmente. Perfecto para revelaciones épicas.
- Dolly zoom (Efecto Vértigo) - Hacer dolly con la cámara mientras se hace zoom en dirección opuesta. Crea desorientación dramática.
Aquí tienes un prompt que demuestra movimiento efectivo de cámara:
Crane shot starting low on a lone hiker standing at the edge of a massive canyon, then ascending high above to reveal the colossal mist-filled canyon at sunrise. Gentle wind building into swelling orchestral score as camera rises.
Agregar terminología de lentes te da control sobre profundidad y sensación visual:
- "Shallow depth of field" - Difumina el fondo, aísla el sujeto
- "Bokeh" - Crea desenfoque suave y circular del fondo
- "Rack focus" - Cambia el enfoque entre sujetos dentro de una sola toma
- "Wide-angle lens" - Expande el campo de visión, agrega ligera distorsión
- "Macro lens" - Primer plano extremo con plano de enfoque estrecho
- "35mm film" - Agrega grano orgánico y calidez cinematográfica
Una de las características destacadas de Veo 3.1 es la generación de audio nativo. El modelo puede producir diálogos sincronizados, efectos de sonido y audio ambiental -- pero solo si lo solicitas explícitamente.
Coloca el habla de los personajes entre comillas dentro de tu prompt. Sé específico sobre tono y entrega:
Medium shot of a detective behind a desk in a dimly lit office. He looks up and says in a weary voice, "Of all the offices in this town, you had to walk into mine." Film noir aesthetic with dramatic shadows.
Consejos para prompts de diálogo:
- Describe la calidad vocal ("weary voice", "excited whisper", "calm monotone")
- Mantén el diálogo corto -- una o dos oraciones funciona mejor
- Haz coincidir el tono del diálogo con el estilo visual
Describe sonidos explícitamente y conéctalos con acciones visibles:
Wide shot of narrow alley glowing under pulsating neon signage as cold drizzle falls. Distant alarm blares, neon buzzes softly, static crackles, electrical hum pulses beneath rain.
Establece el ambiente sonoro para coincidir con tu escena:
A lone cabin in heavy snowfall at night. Wind howling through pine trees, fire crackling inside, occasional creaking of wooden beams. Cozy isolation mood.
Genera Videos Con Audio
Veo 3.1 genera audio sincronizado, diálogos y efectos de sonido. Pruébalo con tus propios prompts.
Veo 3.1 responde bien a la dirección artística. Puedes guiar el estilo visual a través de referencias de género, descripciones de gradación de color y terminología de técnicas cinematográficas.
| Género | Palabras Clave a Usar |
|---|---|
| Cinematográfico | "cinematic", "shot on 35mm film", "anamorphic lens" |
| Documental | "documentary style", "handheld camera", "natural lighting" |
| Terror | "desaturated colors", "heavy grain", "low-angle", "flickering light" |
| Ciencia ficción | "neon-lit", "futuristic", "holographic", "cyberpunk atmosphere" |
| Comercial | "TV commercial style", "clean aesthetic", "professional lighting" |
| Anime | "Japanese anime style", "cel-shaded", "vibrant colors" |
Sé específico sobre el aspecto que quieres:
- Gradación de color: "cyan-magenta color grading", "warm golden tones", "muted pastel palette"
- Dirección de iluminación: "dramatic side lighting", "overhead natural light", "backlit silhouette"
- Hora del día: "golden hour", "blue hour", "harsh midday sun", "overcast diffused light"
Aquí tienes un ejemplo combinando elementos de estilo:
Medium shot of a rain-soaked detective in long coat standing under flickering neon sign in dark alley. He lights a cigarette, the flame briefly illuminating his weathered face. Cold drizzle falls steadily. Film noir aesthetic with cyan-magenta color grading.
Veo 3.1 admite hasta tres imágenes de referencia por generación. Esto es crítico para mantener consistencia de personaje y escena a través de múltiples clips. Puedes usar imágenes de referencia para:
- Fijar la apariencia del personaje a través de diferentes tomas
- Mantener un ambiente o ubicación consistente
- Preservar detalles específicos de objetos (productos, props, vestuario)
Al combinar referencias con prompts de texto, el texto guía la acción y la cámara mientras las imágenes guían la identidad visual.
La función de primer-y-último-cuadro de Veo 3.1 te permite definir exactamente dónde comienza y termina una toma. El modelo luego genera movimiento natural entre los dos cuadros. Esto es particularmente efectivo para:
- Secuencias de transformación suaves
- Movimientos de cámara controlados entre dos composiciones específicas
- Transiciones de escena con estados de inicio y final precisos
Puedes especificar elementos a evitar en tu generación. Al escribir prompts negativos, describe lo que quieres excluir sin usar palabras como "no" o "don't":
- "Avoid watermarks, text overlays, subtitles"
- "Exclude lens flare, overexposure, motion blur"
Aquí tienes prompts probados que puedes copiar, modificar y usar inmediatamente con Veo 3.1.
Close shot of a sleek smartwatch on rugged rock near mountain cliff edge. Camera begins close then pulls back in smooth continuous drone shot. As it rises, vast alpine landscape unfolds. Product commercial style with dramatic natural lighting.
Medium shot of a confident speaker at a podium in a modern conference hall. She gestures naturally while saying, "The future of AI is not about replacement -- it is about collaboration." Soft stage lighting, professional corporate aesthetic.
Wide shot tracking a lone wolf moving through fresh snow in dense forest at dusk. Tracking shot follows from the side. Snow crunching under paws, wind whispering through pines. Documentary style, natural lighting, 35mm film grain.
Low-angle wide shot of a lone figure at the end of a long empty hospital hallway with flickering fluorescent lights. The figure slowly walks toward camera, footsteps echoing. Desaturated colors, heavy grain, horror aesthetic.
POV shot from motorcycle helmet cam racing down winding coastal highway. Camera tilts into curves showing cliff edges and ocean below. Golden hour lighting with sun flares. High-energy action sports style.
Medium shot of chef's hands arranging fresh ingredients on marble counter, working deliberately. Camera tilts up to reveal chef's focused expression. Overhead natural light, warm lifestyle aesthetic.
Slow dolly-in on a model walking through an empty art gallery wearing flowing silk dress. Each step sends subtle ripples through the fabric. Soft diffused gallery lighting, high-fashion editorial style.
Medium shot of elderly man on park bench feeding pigeons, warm afternoon light through autumn trees. He pauses, looks up with gentle smile as leaves drift past. Emotional nostalgic tone, shallow depth of field.
Close-up of hands interacting with a transparent holographic display, swiping and pinching to manipulate 3D data visualizations. Blue-white interface glow illuminates the face. Futuristic sci-fi aesthetic, clean minimal design.
Macro close-up of luxury perfume bottle on reflective black surface with dramatic spotlight creating golden highlights. Bottle slowly rotates revealing elegant design details. Premium commercial aesthetic.
El flujo de trabajo más efectivo de Veo 3.1 sigue un proceso de iteración estructurado.
Empieza con un prompt corto y claro a 4 segundos y resolución 720p. Esto te permite probar rápidamente con costo mínimo.
Wide shot of woman walking through rain on city street at night.
Una vez que la generación base se vea correcta, agrega cámara, iluminación y detalles de estilo:
Wide shot of woman in red coat walking through rain on city street at night. Tracking shot follows from across the street. Neon reflections on wet pavement, moody cyan-orange color grading.
Agrega diseño de sonido para dar vida a la escena:
Wide shot of woman in red coat walking through rain on city street at night. Tracking shot follows from across the street. Neon reflections on wet pavement, moody cyan-orange color grading. Rain pattering on concrete, distant traffic hum, her heels clicking rhythmically.
Cuando el prompt entregue resultados consistentes, aumenta a 8 segundos y 1080p para el resultado final. Usa la variante Estándar de Veo 3.1 para resultados de calidad de producción, o Rápido para continuar iterando.
- Cambia una variable a la vez entre iteraciones (cámara O iluminación, no ambas)
- Usa duraciones más cortas (4-6 segundos) para escenas con mucha acción
- Ejecuta el mismo prompt múltiples veces -- cada generación produce resultados ligeramente diferentes
- Usa parámetros de semilla para explorar variaciones de prompts que funcionen bien
Comienza a Generar Con Veo 3.1
Aplica estas técnicas de prompts con Veo 3.1 directamente en tu navegador. Créditos gratuitos disponibles para nuevos usuarios.
| Error | Por Qué Falla | Solución |
|---|---|---|
| Apilar múltiples movimientos de cámara | Las instrucciones competitivas confunden el modelo | Un movimiento primario de cámara por prompt |
| Descripciones vagas del sujeto | El modelo llena detalles aleatorios | Sé específico sobre apariencia, ropa, edad |
| Ignorar audio | Pierde una de las mejores características de Veo 3.1 | Siempre incluye dirección de audio |
| Prompts excesivamente largos | Los detalles clave se diluyen | Mantén prompts enfocados y estructurados |
| Saltarse la iteración | El primer intento rara vez es perfecto | Comienza simple, refina progresivamente |
| Estilo inconsistente entre clips | Rompe la continuidad visual | Reutiliza paleta y descriptores de estilo en prompts relacionados |
Escribir prompts efectivos de Veo 3.1 es una habilidad aprendible. La fórmula de cinco ingredientes (sujeto, acción, escena, estilo, audio) te da un marco inicial confiable, mientras que la terminología cinematográfica para control de cámara, efectos de lente e iluminación desbloquea resultados de calidad profesional. Comienza simple, itera metódicamente, y aprovecha la generación de audio nativo de Veo 3.1 para crear videos que realmente se destaquen.
La mejor manera de dominar estas técnicas es la práctica directa. Cada prompt te enseña algo sobre cómo el modelo interpreta tus instrucciones.
AI Video Lab
AI video generation expert and content creator.