El modelo de video de nueva generación de ByteDance

Seedance2.0

Cuatro modalidades de entrada. Sincronización audiovisual nativa. Reproducción de cámara cinematográfica. Narrativa multicorte con extrema consistencia de personajes — todo en resolución de hasta 2K.

Available Now

Empieza a crear con Seedance 2.0→Explorar capacidades

3,482,705+ happy users

Resolución

Archivos de entrada

Idiomas de sincronización labial

30%

Más rápido

Ejemplos de video

Mira Seedance 2.0 en acción

Resultados reales generados por Seedance 2.0 — desde tomas de seguimiento cinematográficas en una sola toma hasta narrativas sincronizadas con audio y escenas con múltiples personajes.

Toma de seguimiento continua

Cámara continua siguiendo a los sujetos a través de múltiples ubicaciones urbanas

Cinematográfico con audio nativo

Cinematografía al atardecer con auto clásico, foley y sonido ambiental

Composición de escenas de acción

Escena de lucha bajo un cielo estrellado con efectos de polvo y cámara dinámica

Narrativa emocional

Historia generada a partir de referencias de imagen y audio con expresión de personajes

Reemplazo de personajes

Presentación de banda con cambio de personajes sin interrupciones preservando el movimiento

Extensión multicorte

Escena extendida a través de múltiples tomas con personajes consistentes

Modos de creación

Cuatro formas de crear

Seedance 2.0 acepta texto, imágenes, referencias de video y audio como entradas — de forma individual o combinada para un máximo control creativo.

T2V

Texto a video

Describe cualquier escena en lenguaje natural y Seedance 2.0 le da vida con diálogo sincronizado, foley y audio ambiental — todo generado de forma nativa.

Control detallado de escena y acción mediante indicaciones
Generación de audio nativa (diálogo + SFX + ambientación)
Las 6 relaciones de aspecto compatibles
Duración de salida de 4 a 12 segundos

I2V

Imagen a video

Sube una imagen fija y observa cómo se anima con movimiento realista mientras conserva cada detalle — rasgos faciales, ropa, fondo e iluminación.

Animación que preserva la identidad
Usa hasta 9 imágenes de referencia para personajes y escenas
Generación automática de movimiento de cámara
Estilo consistente entre fotogramas

V2V

Referencia de video

Sube videos de referencia para extraer movimientos de cámara, movimiento de personajes y temporización. Seedance 2.0 reproduce inteligentemente técnicas cinematográficas sin indicaciones complejas.

Extracción y reproducción de trayectoria de cámara
Transferencia de expresiones faciales desde material de referencia
Duplicación de movimiento con nuevos personajes/escenas
Hasta 3 videos de referencia (15s en total)

A2V

Video impulsado por audio

Usa voces en off, bandas sonoras o narración como señal de control principal. El modelo genera visuales que coinciden con el ritmo, la emoción y la temporización de tu audio.

Generación visual sincronizada con el ritmo
Sincronización labial desde voz en off cargada
Transiciones de escena impulsadas por música
Hasta 3 archivos de audio (15s en total)

Entrada multimodal

Hasta 12 archivos. Una generación.

Anteriormente, obtener movimientos de cámara complejos o videos multiescena con personajes consistentes requería escribir indicaciones elaboradas. Con Seedance 2.0, simplemente subes archivos de referencia y el modelo extrae inteligentemente lo que necesita.

Hasta 9 imágenesPersonajes, ubicaciones, accesorios, referencias de estilo

Hasta 3 videosMovimientos de cámara, patrones de movimiento, expresiones (15s máx.)

Hasta 3 archivos de audioVoz en off, música, efectos de sonido para sincronización (15s máx.)

Diagrama de flujo de entrada

Text PromptText Prompt

@Image1 — Character@Image1

@Image2 — Location@Image2

@Image3 — Style ref@Image3

@Video1 — Camera@Video1

@Audio1 — Voiceover@Audio1

Video + Audio sincronizado

Hasta 2K · 4–12s · Diálogo + Foley + Ambientación

Control de cámara cinematográfico

Técnicas de cámara de Hollywood

Describe movimientos de cámara en tu indicación o sube un video de referencia — Seedance 2.0 extrae y reproduce técnicas de cinematografía profesional automáticamente.

Hitchcock Zoom

El clásico efecto dolly-zoom que crea un cambio de perspectiva desorientador — perfecto para revelaciones dramáticas y momentos de pánico del protagonista.

Tomas de seguimiento

Sigue a los sujetos a través de entornos con seguimiento trasero, lateral y frontal suave. Se admiten variantes de ángulo bajo y ángulo alto.

Giro / Órbita

Órbita multiángulo alrededor de los sujetos con aceleración y desaceleración natural. Crea revelaciones dinámicas de 180° y 360°.

Grúa y pluma

Movimientos verticales de cámara que ascienden desde el nivel del suelo o descienden desde perspectivas aéreas con movimiento fluido.

Panorámica e inclinación

Panorámica precisa basada en grados (90°, 180°) con control de pausa y reanudación. Sigue la dirección de la mirada del sujeto de forma natural.

Zoom de acercamiento / alejamiento

Zoom suave hacia primeros planos o alejamiento para revelar escenas más amplias. Controla el ritmo del zoom para un efecto dramático o sutil.

Avance

Sincronización audiovisual nativa

A diferencia de otros modelos que agregan audio como paso de posprocesamiento, Seedance 2.0 genera audio de alta fidelidad como parte del proceso de generación principal. Tres capas de audio inteligentes se sincronizan con el contenido visual a nivel de fotograma.

Diálogo — Sincronización labial a nivel de fonema en más de 8 idiomas
Foley — Efectos de sonido sincronizados con la acción (pasos, impactos, puertas)
Ambientación — Audio ambiental (viento, multitudes, lluvia, tráfico)
Sincronización rítmica — Sincronización audiovisual del ritmo para música

Pruébalo ahora

Pila de capas de audio

Diálogo90% precisión

Habla con sincronización labial · Más de 8 idiomas · Precisión a nivel de fonema

Foley82% precisión

Pasos · Impactos · Interacciones con objetos · SFX ambientales

Ambientación75% precisión

Atmósfera de fondo · Clima · Multitudes · Audio espacial

Flujo de trabajo

Cómo funciona

Elige tus entradas

Comienza con una indicación de texto, sube imágenes de referencia para personajes y escenas, agrega videos de referencia para movimientos de cámara o proporciona audio para sincronización labial y sincronización rítmica.

Configura la salida

Select your aspect ratio (16:9, 9:16, 1:1, etc.), video duration (4–12 seconds), and desired visual style — from photorealistic to anime to film noir.

Referencia con @Tags

En tu indicación, usa la notación @Image1, @Image2, @Video1 para indicar al modelo exactamente cómo cada archivo de referencia debe influir en la salida.

Genera e itera

Seedance 2.0 procesa tus entradas multimodales y genera video con audio sincronizado. Refina tu indicación o intercambia referencias para iterar.

Guía de indicaciones

Consejos para mejores resultados

Saca el máximo provecho de Seedance 2.0 con estas técnicas de indicaciones de usuarios avanzados y la documentación oficial.

Usa lenguaje de cámara

Include specific cinematography terms: "Hitchcock zoom", "tracking shot following the subject", "slow 180° pan", "low-angle crane rising". Seedance 2.0 understands professional film vocabulary.

Ejemplo de indicación

“Un hombre con traje oscuro camina por un pasillo iluminado con neón. La cámara comienza con una toma de seguimiento trasero, luego transiciona a una órbita circular cuando llega al ascensor.”

Referencia tus archivos subidos

Usa la notación @Image y @Video en las indicaciones para asignar archivos específicos a roles. Asigna imágenes a personajes, ubicaciones o referencias de estilo, y videos a referencias de cámara o movimiento.

Ejemplo de indicación

“@Image1 es el personaje principal. @Image2 es la ubicación de la oficina. @Video1 proporciona el movimiento de cámara. El personaje se sienta en un escritorio, toma un teléfono y mira por la ventana.”

Describe emoción y movimiento

Ve más allá de las descripciones visuales. Incluye estados emocionales, patrones de respiración, microexpresiones y lenguaje corporal para una animación de personajes más realista.

Ejemplo de indicación

“La mujer levanta la vista de su libro, con los ojos abriéndose de sorpresa. Se pone de pie lentamente, con las manos temblando ligeramente, y da un paso vacilante hacia adelante.”

Dirección de capas de audio

Describe the soundscape you want: dialogue content, ambient sounds, and action-specific foley. The model generates all three audio layers natively.

Ejemplo de indicación

“Una escena de cafetería concurrida. Conversaciones de fondo y tintineos de tazas. Un barista anuncia un pedido. La lluvia golpea contra la ventana. El protagonista suspira y revuelve su café.”

Estilos visuales

Cualquier estética que puedas imaginar

Especifica el estilo visual en tu indicación o deja que el modelo lo infiera de las imágenes de referencia.

Fotorrealista

Calidad fiel a la realidad

Película cinematográfica

Gradación de color de Hollywood

Anime

Estilo de animación japonesa

Animación 3D

Renderizado con calidad Pixar

Animación 2D

Estilo de ilustración plana

Acuarela

Bordes suaves pictóricos

Film Noir

Drama en blanco y negro de alto contraste

Abstracto

Arte no representativo

Especificaciones

Detalles técnicos

Resolución máxima

1080p standard

Duración

4–12s

Por generación

Relaciones de aspecto

16:9 · 9:16 · 4:3 · 3:4 · 21:9 · 1:1

Modalidades de entrada

Texto · Imagen · Video · Audio

Archivos de entrada máximos

Combinados entre modalidades

Imágenes de referencia

Personajes, objetos, escenas

Videos de referencia

15 segundos máximo en total

Archivos de audio

15 segundos máximo en total

Idiomas de sincronización labial

EN · ZH · KO · JA · ES · ID y más

Capas de audio

Diálogo · Foley · Ambientación

Velocidad vs v1.5

+30%

Generación más rápida

Estilos visuales

De fotorrealista a abstracto

Comparación

2.0 vs 1.5 Pro

Todas las dimensiones mejoradas — resolución, audio, entradas, velocidad y control creativo.

Característica	Seedance 2.0	Seedance 1.5 Pro
Resolución	Hasta 2K	1080p
Audio nativo	Diálogo + Foley + Ambientación	Sincronización de audio básica
Sincronización labial	Más de 8 idiomas, nivel de fonema	Soporte de idiomas limitado
Modalidades de entrada	Texto + Imagen + Video + Audio	Solo texto + imagen
Archivos de entrada máximos	12 archivos simultáneamente	1–2 archivos
Consistencia de personajes	Extrema — continuidad de IP multicorte	Buena — toma única
Narrativa multicorte	Sí — transiciones de escena automáticas	No soportado
Control de cámara	Extracción de video de referencia	Solo por indicación
Edición de video	Edición en lenguaje natural	No soportado
Velocidad de generación	30% más rápido	Base de referencia

Casos de uso

Lo que puedes crear

📱

Contenido para redes sociales

Crea videos que detengan el scroll para TikTok, Instagram Reels y YouTube Shorts. La generación de audio nativa significa que tu contenido está listo para publicar — sin necesidad de edición de audio.

🛍️

Marketing de productos

Genera revelaciones cinematográficas de productos con movimientos de cámara profesionales. Sube una foto del producto, agrega un video de referencia para la técnica de cámara y obtén un comercial pulido.

🎞️

Cortometrajes y narrativas

Produce secuencias narrativas multicorte con personajes consistentes entre escenas. Las transiciones automáticas y la persistencia de identidad de personajes permiten la creación de contenido episódico.

📚

Contenido educativo

Crea explicaciones atractivas con sincronización labial de voz en off en más de 8 idiomas. Sube el audio de narración y deja que el modelo genere visuales que coincidan.

🎶

Videos musicales

Genera visuales sincronizados con el ritmo a partir de entrada de audio. El modelo sincroniza transiciones de escena, movimiento de personajes y cortes de cámara al ritmo de tu música.

💎

Narrativa de marca

Construye series de contenido episódico con extrema consistencia de personajes. Tu mascota de marca, portavoz o producto mantiene su identidad en cada toma.

🎯

Previsualización cinematográfica

Usa videos de referencia para prototipar movimientos de cámara complejos antes de la producción real. Prueba Hitchcock zooms, tomas de grúa y secuencias de órbita virtualmente.

🌍

Contenido multilingüe

Genera el mismo video con sincronización labial en inglés, mandarín, coreano, japonés, español, indonesio y más — desde una sola indicación con diferente audio.

Empieza a crear con Seedance 2.0

Como se presenta en

Testimonios

Lea los comentarios que la gente ha hecho en plataformas públicas.

Preguntas frecuentes

Todo lo que necesitas saber sobre Seedance 2.0

¿Qué es Seedance 2.0?

Seedance 2.0 is ByteDance's next-generation AI video model. It generates video with native audio (dialogue, foley, and ambience) from four input types: text, images, video references, and audio. It outputs up to 2K resolution with extreme character consistency and professional camera techniques.

¿Qué hace diferente a Seedance 2.0 de otros modelos de video con IA?

Three key differentiators: (1) Native audio-visual generation — audio isn't post-processed but generated jointly with video, enabling true lip-sync and beat matching. (2) Reference video input — upload existing videos to extract and reproduce camera movements and character motion without complex prompting. (3) Multi-shot storytelling with extreme character consistency across scenes.

¿Cómo funciona el sistema de entrada multimodal?

You can combine up to 12 files: up to 9 images (for characters, locations, style references), up to 3 video clips (for camera movements and motion references, 15s total), and up to 3 audio files (for voiceover and music, 15s total). Use @Image1, @Video1 notation in your prompt to assign roles to each file.

¿Qué técnicas de cámara soporta Seedance 2.0?

Seedance 2.0 understands professional cinematography language including: Hitchcock zoom (dolly-zoom), tracking shots (rear, side, frontal), orbiting/circling shots, crane and boom movements, pan and tilt with precise degree control, push/pull zoom, and robotic arm multi-angle effects. You can describe these in text or upload a reference video.

¿Qué resoluciones y formatos son compatibles?

Output: up to 2K resolution (1080p standard), 4–12 second duration, 6 aspect ratios (16:9, 9:16, 4:3, 3:4, 21:9, 1:1). The model supports photorealistic, anime, 2D/3D animation, watercolor, film noir, and abstract visual styles.

¿Cómo funciona la generación de audio nativa?

Seedance 2.0 generates three audio layers simultaneously with the video: Dialogue (with phoneme-level lip-sync in 8+ languages), Foley (action-matched sound effects like footsteps, impacts, and environmental interactions), and Ambience (background audio like wind, crowds, rain). All layers are synchronized with the visual content.

¿Puedo controlar la apariencia de los personajes en múltiples tomas?

Sí. Seedance 2.0 presenta extrema consistencia de personajes — rasgos faciales, detalles de ropa, accesorios y estilo visual se mantienen uniformes a lo largo de narrativas multicorte. Sube imágenes de referencia de personajes y el modelo mantiene la persistencia de identidad a lo largo de la secuencia generada.

¿Cómo funciona la entrada de video de referencia?

Sube hasta 3 videos de referencia (15s en total). El modelo extrae trayectorias de cámara, patrones de movimiento de personajes y expresiones faciales del material de referencia, luego los aplica a tu video generado con nuevos personajes y escenas. Esto reemplaza la dirección de cámara compleja basada en texto.

¿Qué idiomas son compatibles para la sincronización labial?

Seedance 2.0 supports phoneme-level lip-sync in 8+ languages: English, Mandarin Chinese, Cantonese, Korean, Japanese, Spanish, Indonesian, and more. You can generate the same scene with lip-sync in different languages by changing the audio input.

¿Cuántos créditos cuesta Seedance 2.0?

Seedance 2.0 usa precios por segundo. Los costos de créditos escalan con la duración — los clips más cortos cuestan menos, los clips más largos cuestan más. Visita la página de generación de video para las tarifas de créditos actuales.

¿Puedo usar los videos de Seedance 2.0 comercialmente?

Sí. Los videos generados con Seedance 2.0 en Easy-Peasy.AI pueden usarse con fines comerciales incluyendo marketing, publicidad, redes sociales, videos de productos y creación de contenido, sujeto a nuestros términos de servicio.

¿Qué tan rápido es Seedance 2.0 en comparación con versiones anteriores?

Seedance 2.0 es un 30% más rápido que Seedance 1.5 Pro ofreciendo mayor resolución (hasta 2K vs 1080p), más modalidades de entrada y generación de audio nativo multicapa. La generación típica se completa en menos de 60 segundos para clips estándar.

Crea más rápido con AI.
Pruébalo sin riesgo.

Deja de perder tiempo y comienza a crear contenido de alta calidad de inmediato con el poder de la AI generativa.

Comienza gratis

Seedance2.0

Mira Seedance 2.0 en acción

Toma de seguimiento continua

Cinematográfico con audio nativo

Composición de escenas de acción

Narrativa emocional

Reemplazo de personajes

Extensión multicorte

Cuatro formas de crear

Texto a video

Imagen a video

Referencia de video

Video impulsado por audio

Hasta 12 archivos. Una generación.

Técnicas de cámara de Hollywood

Hitchcock Zoom

Tomas de seguimiento

Giro / Órbita

Grúa y pluma

Panorámica e inclinación

Zoom de acercamiento / alejamiento

Sincronización audiovisual nativa

Cómo funciona

Elige tus entradas

Configura la salida

Referencia con @Tags

Genera e itera

Consejos para mejores resultados

Usa lenguaje de cámara

Referencia tus archivos subidos

Describe emoción y movimiento

Dirección de capas de audio

Cualquier estética que puedas imaginar

Detalles técnicos

2.0 vs 1.5 Pro

Lo que puedes crear

Contenido para redes sociales

Marketing de productos

Cortometrajes y narrativas

Contenido educativo

Videos musicales

Narrativa de marca

Previsualización cinematográfica

Contenido multilingüe

Como se presenta en

Preguntas frecuentes

Crea más rápido con AI.Pruébalo sin riesgo.

Crea más rápido con AI.
Pruébalo sin riesgo.