Seedance2.0
4つの入力モダリティ。ネイティブ音声映像同期。映画的カメラ再現。極めて高いキャラクター一貫性を持つマルチショットストーリーテリング — すべて最大2K解像度で。
2,182,705+ happy users
Seedance 2.0の実際の動作を見る
Seedance 2.0で生成された実際の出力 — 映画的なワンテイクトラッキングショットから音声同期ナラティブ、マルチキャラクターシーンまで。
ワンテイク・トラッキングショット
複数の都市ロケーションを通じて被写体を連続的に追うカメラ
ネイティブオーディオ付きシネマティック映像
ヴィンテージカーと共に撮影された夕日の映像、フォーリーとアンビエントサウンド付き
アクションシーン合成
星空の下でのダスト効果とダイナミックカメラによる格闘シーン
感情的なナラティブ
画像と音声リファレンスからキャラクターの表情とともに生成されたストーリー
キャラクター置換
モーションを維持しながらシームレスにキャラクターを入れ替えたバンド演奏
マルチショット拡張
一貫したキャラクターで複数のショットにわたって拡張されたシーン
4つの制作方法
Seedance 2.0はテキスト、画像、動画リファレンス、音声を入力として受け付けます — 単独でも組み合わせでも、最大限のクリエイティブコントロールが可能です。
テキストから動画
自然言語でシーンを記述するだけで、Seedance 2.0が同期された会話、フォーリー、アンビエントオーディオとともに映像を生成します — すべてネイティブ生成。
- プロンプトによる詳細なシーンとアクションの制御
- ネイティブオーディオ生成(会話 + 効果音 + アンビエンス)
- 全6種類のアスペクト比に対応
- 4〜12秒の出力時間
画像から動画
静止画像をアップロードすると、顔の特徴、服装、背景、照明などすべてのディテールを保持しながらリアルなモーションでアニメーション化されます。
- アイデンティティを保持したアニメーション
- キャラクターやシーン用に最大9枚のリファレンス画像を使用可能
- カメラ移動の自動生成
- フレーム間で一貫したスタイル
動画リファレンス
リファレンス動画をアップロードして、カメラの動き、キャラクターのモーション、タイミングを抽出。Seedance 2.0は複雑なプロンプトなしで映画的技法をインテリジェントに再現します。
- カメラ軌道の抽出と再現
- リファレンス映像からの表情転写
- 新しいキャラクター/シーンでのモーション複製
- 最大3本のリファレンス動画(合計15秒)
オーディオ駆動動画
ナレーション、サウンドトラック、語りを主要な制御信号として使用。モデルはオーディオのリズム、感情、タイミングに合った映像を生成します。
- ビートに同期した映像生成
- アップロードしたナレーションからのリップシンク
- 音楽駆動のシーン遷移
- 最大3つのオーディオファイル(合計15秒)
最大12ファイル。1回の生成。
以前は、複雑なカメラの動きやキャラクター一貫性のあるマルチシーン動画を得るには、精巧なプロンプトを書く必要がありました。Seedance 2.0では、リファレンスファイルをアップロードするだけで、モデルが必要な要素をインテリジェントに抽出します。
ハリウッドのカメラ技法
プロンプトでカメラの動きを記述するか、リファレンス動画をアップロードすると、Seedance 2.0がプロの撮影技法を自動的に抽出・再現します。
Hitchcock Zoom
方向感覚を失わせる遠近感の変化を生み出す古典的なドリーズーム効果 — ドラマチックな場面転換や主人公のパニックシーンに最適。
トラッキングショット
スムーズな後方、側方、前方トラッキングで環境内の被写体を追従。ローアングルおよびハイアングルのバリエーションにも対応。
サークリング / オービット
自然な加速と減速による被写体周囲のマルチアングル周回。ダイナミックな180°および360°のリビールを作成。
クレーン & ブーム
地面レベルから上昇、または空中視点から滑らかな動きで降下する垂直カメラ移動。
パン & チルト
正確な角度ベースのパン(90°、180°)と停止・再開制御。被写体の視線方向を自然に追従。
プッシュ / プルズーム
クローズアップへのスムーズなズームイン、またはワイドシーンを見せるためのプルバック。ズームのペースを制御してドラマチックまたは繊細な効果を演出。
ネイティブ音声映像同期
後処理ステップとしてオーディオを追加する他のモデルとは異なり、Seedance 2.0はコア生成パイプラインの一部として高忠実度オーディオを生成します。3つのインテリジェントなオーディオレイヤーがフレームレベルで映像コンテンツと同期されます。
- 会話 — 8言語以上での音素レベルのリップシンク
- フォーリー — アクションに合わせた効果音(足音、衝撃音、ドア音)
- アンビエンス — 環境音(風、群衆、雨、交通)
- ビートマッチング — 音楽のための音声映像リズム同期
リップシンクされた音声 · 8言語以上 · 音素レベルの精度
足音 · 衝撃 · オブジェクトインタラクション · 環境効果音
背景の雰囲気 · 天候 · 群衆 · 空間オーディオ
使い方
入力を選択
テキストプロンプトから始めるか、キャラクターやシーン用のリファレンス画像をアップロード、カメラの動き用のリファレンス動画を追加、またはリップシンクやビートマッチング用のオーディオを提供します。
出力を設定
Select your aspect ratio (16:9, 9:16, 1:1, etc.), video duration (4–12 seconds), and desired visual style — from photorealistic to anime to film noir.
@タグでリファレンス
プロンプト内で@Image1、@Image2、@Video1の表記を使用して、各リファレンスファイルが出力にどのように影響するかをモデルに正確に伝えます。
生成と反復
Seedance 2.0がマルチモーダル入力を処理し、同期されたオーディオ付きの動画を生成します。プロンプトを調整したりリファレンスを差し替えて反復改善できます。
より良い結果のためのヒント
パワーユーザーや公式ドキュメントからのプロンプト技法で、Seedance 2.0を最大限に活用しましょう。
カメラ用語を使う
Include specific cinematography terms: "Hitchcock zoom", "tracking shot following the subject", "slow 180° pan", "low-angle crane rising". Seedance 2.0 understands professional film vocabulary.
“ダークスーツの男がネオンに照らされた廊下を歩く。カメラは後方トラッキングショットから始まり、エレベーターに到着すると周回オービットに移行する。”
アップロードをリファレンスする
プロンプトで@Imageや@Video表記を使って特定のファイルを役割に割り当てます。画像をキャラクター、ロケーション、スタイルリファレンスに、動画をカメラやモーションリファレンスに割り当てます。
“@Image1がメインキャラクター。@Image2がオフィスのロケーション。@Video1がカメラの動きを提供。キャラクターがデスクに座り、電話を取り、窓の外を見る。”
感情とモーションを記述する
視覚的な記述を超えましょう。感情状態、呼吸パターン、微表情、ボディランゲージを含めることで、よりリアルなキャラクターアニメーションが実現します。
“女性が本から顔を上げ、驚きで目を見開く。ゆっくりと立ち上がり、手が微かに震え、ためらいがちに一歩前に踏み出す。”
オーディオの方向をレイヤー化する
Describe the soundscape you want: dialogue content, ambient sounds, and action-specific foley. The model generates all three audio layers natively.
“にぎやかなカフェのシーン。背景に会話とカップの音。バリスタが注文を呼ぶ。雨が窓を打つ。主人公がため息をつき、コーヒーをかき混ぜる。”
あらゆる美学を想像のままに
プロンプトでビジュアルスタイルを指定するか、モデルにリファレンス画像から推測させます。
技術仕様
2.0 vs 1.5 Pro
解像度、オーディオ、入力、速度、クリエイティブコントロール — あらゆる面で向上。
| 機能 | Seedance 2.0 | Seedance 1.5 Pro |
|---|---|---|
| 解像度 | 最大2K | 1080p |
| ネイティブオーディオ | 会話 + フォーリー + アンビエンス | 基本的なオーディオ同期 |
| リップシンク | 8言語以上、音素レベル | 限定的な言語サポート |
| 入力モダリティ | テキスト + 画像 + 動画 + オーディオ | テキスト + 画像のみ |
| 最大入力ファイル数 | 12ファイル同時 | 1〜2ファイル |
| キャラクター一貫性 | 極めて高い — マルチショットIP継続性 | 良好 — シングルショット |
| マルチショットストーリーテリング | 対応 — 自動シーン遷移 | 非対応 |
| カメラ制御 | リファレンス動画抽出 | プロンプトのみ |
| 動画編集 | 自然言語による編集 | 非対応 |
| 生成速度 | 30%高速化 | ベースライン |
作成できるもの
ソーシャルメディアコンテンツ
TikTok、Instagram Reels、YouTube Shorts向けのスクロールを止める動画を作成。ネイティブオーディオ生成により、オーディオ編集不要ですぐに投稿できるコンテンツが完成します。
プロダクトマーケティング
プロフェッショナルなカメラワークによるシネマティックな製品紹介動画を生成。製品写真をアップロードし、カメラ技法のリファレンス動画を追加して、洗練されたコマーシャルを取得。
ショートフィルム & ナラティブ
シーン間で一貫したキャラクターによるマルチショットのストーリーシーケンスを制作。自動遷移とキャラクターアイデンティティの持続により、エピソードコンテンツの制作が可能に。
教育コンテンツ
8言語以上での同期ナレーションリップシンク付きの魅力的な解説動画を作成。ナレーション音声をアップロードすると、モデルがそれに合った映像を生成します。
ミュージックビデオ
オーディオ入力からビートに同期した映像を生成。モデルがシーン遷移、キャラクターの動き、カメラカットを音楽のリズムに合わせて同期します。
ブランドストーリーテリング
極めて高いキャラクター一貫性でエピソードコンテンツシリーズを構築。ブランドマスコット、スポークスパーソン、製品がすべてのショットでアイデンティティを維持します。
映画プリビジュアライゼーション
実際の制作前にリファレンス動画を使って複雑なカメラワークをプロトタイプ。Hitchcock zoom、クレーンショット、オービットシーケンスを仮想的にテスト。
多言語コンテンツ
英語、中国語、韓国語、日本語、スペイン語、インドネシア語など、異なるオーディオを使った1つのプロンプトから同じ動画をリップシンク付きで生成。
よくある質問
Seedance 2.0について知っておくべきすべてのこと
Seedance 2.0とは?
Seedance 2.0 is ByteDance's next-generation AI video model. It generates video with native audio (dialogue, foley, and ambience) from four input types: text, images, video references, and audio. It outputs up to 2K resolution with extreme character consistency and professional camera techniques.
Seedance 2.0が他のAI動画モデルと異なる点は?
Three key differentiators: (1) Native audio-visual generation — audio isn't post-processed but generated jointly with video, enabling true lip-sync and beat matching. (2) Reference video input — upload existing videos to extract and reproduce camera movements and character motion without complex prompting. (3) Multi-shot storytelling with extreme character consistency across scenes.
マルチモーダル入力システムはどのように機能しますか?
You can combine up to 12 files: up to 9 images (for characters, locations, style references), up to 3 video clips (for camera movements and motion references, 15s total), and up to 3 audio files (for voiceover and music, 15s total). Use @Image1, @Video1 notation in your prompt to assign roles to each file.
Seedance 2.0はどのようなカメラ技法に対応していますか?
Seedance 2.0 understands professional cinematography language including: Hitchcock zoom (dolly-zoom), tracking shots (rear, side, frontal), orbiting/circling shots, crane and boom movements, pan and tilt with precise degree control, push/pull zoom, and robotic arm multi-angle effects. You can describe these in text or upload a reference video.
対応する解像度とフォーマットは?
Output: up to 2K resolution (1080p standard), 4–12 second duration, 6 aspect ratios (16:9, 9:16, 4:3, 3:4, 21:9, 1:1). The model supports photorealistic, anime, 2D/3D animation, watercolor, film noir, and abstract visual styles.
ネイティブオーディオ生成はどのように機能しますか?
Seedance 2.0 generates three audio layers simultaneously with the video: Dialogue (with phoneme-level lip-sync in 8+ languages), Foley (action-matched sound effects like footsteps, impacts, and environmental interactions), and Ambience (background audio like wind, crowds, rain). All layers are synchronized with the visual content.
複数のショット間でキャラクターの外見を制御できますか?
はい。Seedance 2.0は極めて高いキャラクター一貫性を備えています — 顔の特徴、服装の詳細、アクセサリー、ビジュアルスタイルがマルチショットナラティブ全体で均一に維持されます。キャラクターのリファレンス画像をアップロードすると、モデルが生成シーケンス全体でアイデンティティの持続性を維持します。
動画リファレンス入力はどのように機能しますか?
最大3本のリファレンス動画(合計15秒)をアップロードします。モデルがリファレンス映像からカメラ軌道、キャラクターのモーションパターン、表情を抽出し、新しいキャラクターとシーンで生成される動画に適用します。これにより、複雑なテキストベースのカメラ指示が不要になります。
リップシンクはどの言語に対応していますか?
Seedance 2.0 supports phoneme-level lip-sync in 8+ languages: English, Mandarin Chinese, Cantonese, Korean, Japanese, Spanish, Indonesian, and more. You can generate the same scene with lip-sync in different languages by changing the audio input.
Seedance 2.0のクレジット消費量は?
Seedance 2.0は秒単位の料金設定です。クレジットコストは長さに応じてスケールします — 短いクリップほど安く、長いクリップほど高くなります。現在のクレジットレートは動画生成ページをご覧ください。
Seedance 2.0で生成した動画を商用利用できますか?
はい。Easy-Peasy.AI上のSeedance 2.0で生成された動画は、マーケティング、広告、ソーシャルメディア、製品動画、コンテンツ制作を含む商用目的で使用できます(利用規約が適用されます)。
Seedance 2.0は以前のバージョンと比べてどのくらい速いですか?
Seedance 2.0はSeedance 1.5 Proより30%高速で、より高い解像度(最大2K vs 1080p)、より多くの入力モダリティ、ネイティブマルチレイヤーオーディオ生成を提供します。標準的なクリップの一般的な生成は60秒以内に完了します。


