El modelo de video de nueva generación de ByteDance

Seedance2.0

Cuatro modalidades de entrada. Sincronización audiovisual nativa. Reproducción de cámara cinematográfica. Narrativa multicorte con extrema consistencia de personajes — todo en resolución de hasta 2K.

Disponible el 24 de febrero

2,182,705+ happy users

2K
Resolución
12
Archivos de entrada
8+
Idiomas de sincronización labial
30%
Más rápido
Ejemplos de video

Mira Seedance 2.0 en acción

Resultados reales generados por Seedance 2.0 — desde tomas de seguimiento cinematográficas en una sola toma hasta narrativas sincronizadas con audio y escenas con múltiples personajes.

Toma de seguimiento continua

Cámara continua siguiendo a los sujetos a través de múltiples ubicaciones urbanas

Cinematográfico con audio nativo

Cinematografía al atardecer con auto clásico, foley y sonido ambiental

Composición de escenas de acción

Escena de lucha bajo un cielo estrellado con efectos de polvo y cámara dinámica

Narrativa emocional

Historia generada a partir de referencias de imagen y audio con expresión de personajes

Reemplazo de personajes

Presentación de banda con cambio de personajes sin interrupciones preservando el movimiento

Extensión multicorte

Escena extendida a través de múltiples tomas con personajes consistentes

Modos de creación

Cuatro formas de crear

Seedance 2.0 acepta texto, imágenes, referencias de video y audio como entradas — de forma individual o combinada para un máximo control creativo.

T2V

Texto a video

Describe cualquier escena en lenguaje natural y Seedance 2.0 le da vida con diálogo sincronizado, foley y audio ambiental — todo generado de forma nativa.

  • Control detallado de escena y acción mediante indicaciones
  • Generación de audio nativa (diálogo + SFX + ambientación)
  • Las 6 relaciones de aspecto compatibles
  • Duración de salida de 4 a 12 segundos
I2V

Imagen a video

Sube una imagen fija y observa cómo se anima con movimiento realista mientras conserva cada detalle — rasgos faciales, ropa, fondo e iluminación.

  • Animación que preserva la identidad
  • Usa hasta 9 imágenes de referencia para personajes y escenas
  • Generación automática de movimiento de cámara
  • Estilo consistente entre fotogramas
V2V

Referencia de video

Sube videos de referencia para extraer movimientos de cámara, movimiento de personajes y temporización. Seedance 2.0 reproduce inteligentemente técnicas cinematográficas sin indicaciones complejas.

  • Extracción y reproducción de trayectoria de cámara
  • Transferencia de expresiones faciales desde material de referencia
  • Duplicación de movimiento con nuevos personajes/escenas
  • Hasta 3 videos de referencia (15s en total)
A2V

Video impulsado por audio

Usa voces en off, bandas sonoras o narración como señal de control principal. El modelo genera visuales que coinciden con el ritmo, la emoción y la temporización de tu audio.

  • Generación visual sincronizada con el ritmo
  • Sincronización labial desde voz en off cargada
  • Transiciones de escena impulsadas por música
  • Hasta 3 archivos de audio (15s en total)
Entrada multimodal

Hasta 12 archivos. Una generación.

Anteriormente, obtener movimientos de cámara complejos o videos multiescena con personajes consistentes requería escribir indicaciones elaboradas. Con Seedance 2.0, simplemente subes archivos de referencia y el modelo extrae inteligentemente lo que necesita.

Hasta 9 imágenesPersonajes, ubicaciones, accesorios, referencias de estilo
Hasta 3 videosMovimientos de cámara, patrones de movimiento, expresiones (15s máx.)
Hasta 3 archivos de audioVoz en off, música, efectos de sonido para sincronización (15s máx.)
Diagrama de flujo de entrada
Text Prompt
@Image1
@Image2
@Image3
@Video1
@Audio1
Video + Audio sincronizado
Hasta 2K · 4–12s · Diálogo + Foley + Ambientación
Control de cámara cinematográfico

Técnicas de cámara de Hollywood

Describe movimientos de cámara en tu indicación o sube un video de referencia — Seedance 2.0 extrae y reproduce técnicas de cinematografía profesional automáticamente.

Hitchcock Zoom

El clásico efecto dolly-zoom que crea un cambio de perspectiva desorientador — perfecto para revelaciones dramáticas y momentos de pánico del protagonista.

Tomas de seguimiento

Sigue a los sujetos a través de entornos con seguimiento trasero, lateral y frontal suave. Se admiten variantes de ángulo bajo y ángulo alto.

Giro / Órbita

Órbita multiángulo alrededor de los sujetos con aceleración y desaceleración natural. Crea revelaciones dinámicas de 180° y 360°.

Grúa y pluma

Movimientos verticales de cámara que ascienden desde el nivel del suelo o descienden desde perspectivas aéreas con movimiento fluido.

Panorámica e inclinación

Panorámica precisa basada en grados (90°, 180°) con control de pausa y reanudación. Sigue la dirección de la mirada del sujeto de forma natural.

Zoom de acercamiento / alejamiento

Zoom suave hacia primeros planos o alejamiento para revelar escenas más amplias. Controla el ritmo del zoom para un efecto dramático o sutil.

Avance

Sincronización audiovisual nativa

A diferencia de otros modelos que agregan audio como paso de posprocesamiento, Seedance 2.0 genera audio de alta fidelidad como parte del proceso de generación principal. Tres capas de audio inteligentes se sincronizan con el contenido visual a nivel de fotograma.

  • Diálogo — Sincronización labial a nivel de fonema en más de 8 idiomas
  • Foley — Efectos de sonido sincronizados con la acción (pasos, impactos, puertas)
  • Ambientación — Audio ambiental (viento, multitudes, lluvia, tráfico)
  • Sincronización rítmica — Sincronización audiovisual del ritmo para música
Pruébalo ahora
Pila de capas de audio
Diálogo90% precisión

Habla con sincronización labial · Más de 8 idiomas · Precisión a nivel de fonema

Foley82% precisión

Pasos · Impactos · Interacciones con objetos · SFX ambientales

Ambientación75% precisión

Atmósfera de fondo · Clima · Multitudes · Audio espacial

Flujo de trabajo

Cómo funciona

01

Elige tus entradas

Comienza con una indicación de texto, sube imágenes de referencia para personajes y escenas, agrega videos de referencia para movimientos de cámara o proporciona audio para sincronización labial y sincronización rítmica.

02

Configura la salida

Select your aspect ratio (16:9, 9:16, 1:1, etc.), video duration (4–12 seconds), and desired visual style — from photorealistic to anime to film noir.

03

Referencia con @Tags

En tu indicación, usa la notación @Image1, @Image2, @Video1 para indicar al modelo exactamente cómo cada archivo de referencia debe influir en la salida.

04

Genera e itera

Seedance 2.0 procesa tus entradas multimodales y genera video con audio sincronizado. Refina tu indicación o intercambia referencias para iterar.

Guía de indicaciones

Consejos para mejores resultados

Saca el máximo provecho de Seedance 2.0 con estas técnicas de indicaciones de usuarios avanzados y la documentación oficial.

Usa lenguaje de cámara

Include specific cinematography terms: "Hitchcock zoom", "tracking shot following the subject", "slow 180° pan", "low-angle crane rising". Seedance 2.0 understands professional film vocabulary.

Ejemplo de indicación

Un hombre con traje oscuro camina por un pasillo iluminado con neón. La cámara comienza con una toma de seguimiento trasero, luego transiciona a una órbita circular cuando llega al ascensor.

Referencia tus archivos subidos

Usa la notación @Image y @Video en las indicaciones para asignar archivos específicos a roles. Asigna imágenes a personajes, ubicaciones o referencias de estilo, y videos a referencias de cámara o movimiento.

Ejemplo de indicación

@Image1 es el personaje principal. @Image2 es la ubicación de la oficina. @Video1 proporciona el movimiento de cámara. El personaje se sienta en un escritorio, toma un teléfono y mira por la ventana.

Describe emoción y movimiento

Ve más allá de las descripciones visuales. Incluye estados emocionales, patrones de respiración, microexpresiones y lenguaje corporal para una animación de personajes más realista.

Ejemplo de indicación

La mujer levanta la vista de su libro, con los ojos abriéndose de sorpresa. Se pone de pie lentamente, con las manos temblando ligeramente, y da un paso vacilante hacia adelante.

Dirección de capas de audio

Describe the soundscape you want: dialogue content, ambient sounds, and action-specific foley. The model generates all three audio layers natively.

Ejemplo de indicación

Una escena de cafetería concurrida. Conversaciones de fondo y tintineos de tazas. Un barista anuncia un pedido. La lluvia golpea contra la ventana. El protagonista suspira y revuelve su café.

Estilos visuales

Cualquier estética que puedas imaginar

Especifica el estilo visual en tu indicación o deja que el modelo lo infiera de las imágenes de referencia.

Fotorrealista
Calidad fiel a la realidad
Película cinematográfica
Gradación de color de Hollywood
Anime
Estilo de animación japonesa
Animación 3D
Renderizado con calidad Pixar
Animación 2D
Estilo de ilustración plana
Acuarela
Bordes suaves pictóricos
Film Noir
Drama en blanco y negro de alto contraste
Abstracto
Arte no representativo
Especificaciones

Detalles técnicos

Resolución máxima
2K
1080p standard
Duración
4–12s
Por generación
Relaciones de aspecto
6
16:9 · 9:16 · 4:3 · 3:4 · 21:9 · 1:1
Modalidades de entrada
4
Texto · Imagen · Video · Audio
Archivos de entrada máximos
12
Combinados entre modalidades
Imágenes de referencia
9
Personajes, objetos, escenas
Videos de referencia
3
15 segundos máximo en total
Archivos de audio
3
15 segundos máximo en total
Idiomas de sincronización labial
8+
EN · ZH · KO · JA · ES · ID y más
Capas de audio
3
Diálogo · Foley · Ambientación
Velocidad vs v1.5
+30%
Generación más rápida
Estilos visuales
8+
De fotorrealista a abstracto
Comparación

2.0 vs 1.5 Pro

Todas las dimensiones mejoradas — resolución, audio, entradas, velocidad y control creativo.

CaracterísticaSeedance 2.0Seedance 1.5 Pro
ResoluciónHasta 2K1080p
Audio nativoDiálogo + Foley + AmbientaciónSincronización de audio básica
Sincronización labialMás de 8 idiomas, nivel de fonemaSoporte de idiomas limitado
Modalidades de entradaTexto + Imagen + Video + AudioSolo texto + imagen
Archivos de entrada máximos12 archivos simultáneamente1–2 archivos
Consistencia de personajesExtrema — continuidad de IP multicorteBuena — toma única
Narrativa multicorteSí — transiciones de escena automáticasNo soportado
Control de cámaraExtracción de video de referenciaSolo por indicación
Edición de videoEdición en lenguaje naturalNo soportado
Velocidad de generación30% más rápidoBase de referencia
Casos de uso

Lo que puedes crear

📱

Contenido para redes sociales

Crea videos que detengan el scroll para TikTok, Instagram Reels y YouTube Shorts. La generación de audio nativa significa que tu contenido está listo para publicar — sin necesidad de edición de audio.

🛍️

Marketing de productos

Genera revelaciones cinematográficas de productos con movimientos de cámara profesionales. Sube una foto del producto, agrega un video de referencia para la técnica de cámara y obtén un comercial pulido.

🎞️

Cortometrajes y narrativas

Produce secuencias narrativas multicorte con personajes consistentes entre escenas. Las transiciones automáticas y la persistencia de identidad de personajes permiten la creación de contenido episódico.

📚

Contenido educativo

Crea explicaciones atractivas con sincronización labial de voz en off en más de 8 idiomas. Sube el audio de narración y deja que el modelo genere visuales que coincidan.

🎶

Videos musicales

Genera visuales sincronizados con el ritmo a partir de entrada de audio. El modelo sincroniza transiciones de escena, movimiento de personajes y cortes de cámara al ritmo de tu música.

💎

Narrativa de marca

Construye series de contenido episódico con extrema consistencia de personajes. Tu mascota de marca, portavoz o producto mantiene su identidad en cada toma.

🎯

Previsualización cinematográfica

Usa videos de referencia para prototipar movimientos de cámara complejos antes de la producción real. Prueba Hitchcock zooms, tomas de grúa y secuencias de órbita virtualmente.

🌍

Contenido multilingüe

Genera el mismo video con sincronización labial en inglés, mandarín, coreano, japonés, español, indonesio y más — desde una sola indicación con diferente audio.

Testimonios

Our Trustpilot score

Lea los comentarios que la gente ha hecho en plataformas públicas.

Preguntas frecuentes

Preguntas frecuentes

Todo lo que necesitas saber sobre Seedance 2.0

¿Qué es Seedance 2.0?

Seedance 2.0 is ByteDance's next-generation AI video model. It generates video with native audio (dialogue, foley, and ambience) from four input types: text, images, video references, and audio. It outputs up to 2K resolution with extreme character consistency and professional camera techniques.

¿Qué hace diferente a Seedance 2.0 de otros modelos de video con IA?

Three key differentiators: (1) Native audio-visual generation — audio isn't post-processed but generated jointly with video, enabling true lip-sync and beat matching. (2) Reference video input — upload existing videos to extract and reproduce camera movements and character motion without complex prompting. (3) Multi-shot storytelling with extreme character consistency across scenes.

¿Cómo funciona el sistema de entrada multimodal?

You can combine up to 12 files: up to 9 images (for characters, locations, style references), up to 3 video clips (for camera movements and motion references, 15s total), and up to 3 audio files (for voiceover and music, 15s total). Use @Image1, @Video1 notation in your prompt to assign roles to each file.

¿Qué técnicas de cámara soporta Seedance 2.0?

Seedance 2.0 understands professional cinematography language including: Hitchcock zoom (dolly-zoom), tracking shots (rear, side, frontal), orbiting/circling shots, crane and boom movements, pan and tilt with precise degree control, push/pull zoom, and robotic arm multi-angle effects. You can describe these in text or upload a reference video.

¿Qué resoluciones y formatos son compatibles?

Output: up to 2K resolution (1080p standard), 4–12 second duration, 6 aspect ratios (16:9, 9:16, 4:3, 3:4, 21:9, 1:1). The model supports photorealistic, anime, 2D/3D animation, watercolor, film noir, and abstract visual styles.

¿Cómo funciona la generación de audio nativa?

Seedance 2.0 generates three audio layers simultaneously with the video: Dialogue (with phoneme-level lip-sync in 8+ languages), Foley (action-matched sound effects like footsteps, impacts, and environmental interactions), and Ambience (background audio like wind, crowds, rain). All layers are synchronized with the visual content.

¿Puedo controlar la apariencia de los personajes en múltiples tomas?

Sí. Seedance 2.0 presenta extrema consistencia de personajes — rasgos faciales, detalles de ropa, accesorios y estilo visual se mantienen uniformes a lo largo de narrativas multicorte. Sube imágenes de referencia de personajes y el modelo mantiene la persistencia de identidad a lo largo de la secuencia generada.

¿Cómo funciona la entrada de video de referencia?

Sube hasta 3 videos de referencia (15s en total). El modelo extrae trayectorias de cámara, patrones de movimiento de personajes y expresiones faciales del material de referencia, luego los aplica a tu video generado con nuevos personajes y escenas. Esto reemplaza la dirección de cámara compleja basada en texto.

¿Qué idiomas son compatibles para la sincronización labial?

Seedance 2.0 supports phoneme-level lip-sync in 8+ languages: English, Mandarin Chinese, Cantonese, Korean, Japanese, Spanish, Indonesian, and more. You can generate the same scene with lip-sync in different languages by changing the audio input.

¿Cuántos créditos cuesta Seedance 2.0?

Seedance 2.0 usa precios por segundo. Los costos de créditos escalan con la duración — los clips más cortos cuestan menos, los clips más largos cuestan más. Visita la página de generación de video para las tarifas de créditos actuales.

¿Puedo usar los videos de Seedance 2.0 comercialmente?

Sí. Los videos generados con Seedance 2.0 en Easy-Peasy.AI pueden usarse con fines comerciales incluyendo marketing, publicidad, redes sociales, videos de productos y creación de contenido, sujeto a nuestros términos de servicio.

¿Qué tan rápido es Seedance 2.0 en comparación con versiones anteriores?

Seedance 2.0 es un 30% más rápido que Seedance 1.5 Pro ofreciendo mayor resolución (hasta 2K vs 1080p), más modalidades de entrada y generación de audio nativo multicapa. La generación típica se completa en menos de 60 segundos para clips estándar.