ByteDanceの次世代動画モデル

Seedance2.0

4つの入力モダリティ。ネイティブ音声映像同期。映画的カメラ再現。極めて高いキャラクター一貫性を持つマルチショットストーリーテリング — すべて最大2K解像度で。

2月24日公開予定

2,182,705+ happy users

2K
解像度
12
入力ファイル
8+
リップシンク対応言語
30%
高速化
動画サンプル

Seedance 2.0の実際の動作を見る

Seedance 2.0で生成された実際の出力 — 映画的なワンテイクトラッキングショットから音声同期ナラティブ、マルチキャラクターシーンまで。

ワンテイク・トラッキングショット

複数の都市ロケーションを通じて被写体を連続的に追うカメラ

ネイティブオーディオ付きシネマティック映像

ヴィンテージカーと共に撮影された夕日の映像、フォーリーとアンビエントサウンド付き

アクションシーン合成

星空の下でのダスト効果とダイナミックカメラによる格闘シーン

感情的なナラティブ

画像と音声リファレンスからキャラクターの表情とともに生成されたストーリー

キャラクター置換

モーションを維持しながらシームレスにキャラクターを入れ替えたバンド演奏

マルチショット拡張

一貫したキャラクターで複数のショットにわたって拡張されたシーン

制作モード

4つの制作方法

Seedance 2.0はテキスト、画像、動画リファレンス、音声を入力として受け付けます — 単独でも組み合わせでも、最大限のクリエイティブコントロールが可能です。

T2V

テキストから動画

自然言語でシーンを記述するだけで、Seedance 2.0が同期された会話、フォーリー、アンビエントオーディオとともに映像を生成します — すべてネイティブ生成。

  • プロンプトによる詳細なシーンとアクションの制御
  • ネイティブオーディオ生成(会話 + 効果音 + アンビエンス)
  • 全6種類のアスペクト比に対応
  • 4〜12秒の出力時間
I2V

画像から動画

静止画像をアップロードすると、顔の特徴、服装、背景、照明などすべてのディテールを保持しながらリアルなモーションでアニメーション化されます。

  • アイデンティティを保持したアニメーション
  • キャラクターやシーン用に最大9枚のリファレンス画像を使用可能
  • カメラ移動の自動生成
  • フレーム間で一貫したスタイル
V2V

動画リファレンス

リファレンス動画をアップロードして、カメラの動き、キャラクターのモーション、タイミングを抽出。Seedance 2.0は複雑なプロンプトなしで映画的技法をインテリジェントに再現します。

  • カメラ軌道の抽出と再現
  • リファレンス映像からの表情転写
  • 新しいキャラクター/シーンでのモーション複製
  • 最大3本のリファレンス動画(合計15秒)
A2V

オーディオ駆動動画

ナレーション、サウンドトラック、語りを主要な制御信号として使用。モデルはオーディオのリズム、感情、タイミングに合った映像を生成します。

  • ビートに同期した映像生成
  • アップロードしたナレーションからのリップシンク
  • 音楽駆動のシーン遷移
  • 最大3つのオーディオファイル(合計15秒)
マルチモーダル入力

最大12ファイル。1回の生成。

以前は、複雑なカメラの動きやキャラクター一貫性のあるマルチシーン動画を得るには、精巧なプロンプトを書く必要がありました。Seedance 2.0では、リファレンスファイルをアップロードするだけで、モデルが必要な要素をインテリジェントに抽出します。

最大9枚の画像キャラクター、ロケーション、小道具、スタイルリファレンス
最大3本の動画カメラの動き、モーションパターン、表情(最大15秒)
最大3つのオーディオファイルナレーション、音楽、同期用効果音(最大15秒)
入力フロー図
Text Prompt
@Image1
@Image2
@Image3
@Video1
@Audio1
動画 + 同期オーディオ
最大2K · 4〜12秒 · 会話 + フォーリー + アンビエンス
シネマティックカメラ制御

ハリウッドのカメラ技法

プロンプトでカメラの動きを記述するか、リファレンス動画をアップロードすると、Seedance 2.0がプロの撮影技法を自動的に抽出・再現します。

Hitchcock Zoom

方向感覚を失わせる遠近感の変化を生み出す古典的なドリーズーム効果 — ドラマチックな場面転換や主人公のパニックシーンに最適。

トラッキングショット

スムーズな後方、側方、前方トラッキングで環境内の被写体を追従。ローアングルおよびハイアングルのバリエーションにも対応。

サークリング / オービット

自然な加速と減速による被写体周囲のマルチアングル周回。ダイナミックな180°および360°のリビールを作成。

クレーン & ブーム

地面レベルから上昇、または空中視点から滑らかな動きで降下する垂直カメラ移動。

パン & チルト

正確な角度ベースのパン(90°、180°)と停止・再開制御。被写体の視線方向を自然に追従。

プッシュ / プルズーム

クローズアップへのスムーズなズームイン、またはワイドシーンを見せるためのプルバック。ズームのペースを制御してドラマチックまたは繊細な効果を演出。

革新的技術

ネイティブ音声映像同期

後処理ステップとしてオーディオを追加する他のモデルとは異なり、Seedance 2.0はコア生成パイプラインの一部として高忠実度オーディオを生成します。3つのインテリジェントなオーディオレイヤーがフレームレベルで映像コンテンツと同期されます。

  • 会話 — 8言語以上での音素レベルのリップシンク
  • フォーリー — アクションに合わせた効果音(足音、衝撃音、ドア音)
  • アンビエンス — 環境音(風、群衆、雨、交通)
  • ビートマッチング — 音楽のための音声映像リズム同期
今すぐ試す
オーディオレイヤースタック
会話90% 精度

リップシンクされた音声 · 8言語以上 · 音素レベルの精度

フォーリー82% 精度

足音 · 衝撃 · オブジェクトインタラクション · 環境効果音

アンビエンス75% 精度

背景の雰囲気 · 天候 · 群衆 · 空間オーディオ

ワークフロー

使い方

01

入力を選択

テキストプロンプトから始めるか、キャラクターやシーン用のリファレンス画像をアップロード、カメラの動き用のリファレンス動画を追加、またはリップシンクやビートマッチング用のオーディオを提供します。

02

出力を設定

Select your aspect ratio (16:9, 9:16, 1:1, etc.), video duration (4–12 seconds), and desired visual style — from photorealistic to anime to film noir.

03

@タグでリファレンス

プロンプト内で@Image1、@Image2、@Video1の表記を使用して、各リファレンスファイルが出力にどのように影響するかをモデルに正確に伝えます。

04

生成と反復

Seedance 2.0がマルチモーダル入力を処理し、同期されたオーディオ付きの動画を生成します。プロンプトを調整したりリファレンスを差し替えて反復改善できます。

プロンプトガイド

より良い結果のためのヒント

パワーユーザーや公式ドキュメントからのプロンプト技法で、Seedance 2.0を最大限に活用しましょう。

カメラ用語を使う

Include specific cinematography terms: "Hitchcock zoom", "tracking shot following the subject", "slow 180° pan", "low-angle crane rising". Seedance 2.0 understands professional film vocabulary.

プロンプト例

ダークスーツの男がネオンに照らされた廊下を歩く。カメラは後方トラッキングショットから始まり、エレベーターに到着すると周回オービットに移行する。

アップロードをリファレンスする

プロンプトで@Imageや@Video表記を使って特定のファイルを役割に割り当てます。画像をキャラクター、ロケーション、スタイルリファレンスに、動画をカメラやモーションリファレンスに割り当てます。

プロンプト例

@Image1がメインキャラクター。@Image2がオフィスのロケーション。@Video1がカメラの動きを提供。キャラクターがデスクに座り、電話を取り、窓の外を見る。

感情とモーションを記述する

視覚的な記述を超えましょう。感情状態、呼吸パターン、微表情、ボディランゲージを含めることで、よりリアルなキャラクターアニメーションが実現します。

プロンプト例

女性が本から顔を上げ、驚きで目を見開く。ゆっくりと立ち上がり、手が微かに震え、ためらいがちに一歩前に踏み出す。

オーディオの方向をレイヤー化する

Describe the soundscape you want: dialogue content, ambient sounds, and action-specific foley. The model generates all three audio layers natively.

プロンプト例

にぎやかなカフェのシーン。背景に会話とカップの音。バリスタが注文を呼ぶ。雨が窓を打つ。主人公がため息をつき、コーヒーをかき混ぜる。

ビジュアルスタイル

あらゆる美学を想像のままに

プロンプトでビジュアルスタイルを指定するか、モデルにリファレンス画像から推測させます。

フォトリアリスティック
実物そのままの品質
シネマティック・フィルム
ハリウッドカラーグレーディング
Anime
日本のアニメーションスタイル
3Dアニメーション
Pixarクオリティのレンダリング
2Dアニメーション
フラットイラストスタイル
水彩画
絵画的なソフトエッジ
Film Noir
ハイコントラスト白黒ドラマ
アブストラクト
非具象アート
仕様

技術仕様

最大解像度
2K
1080p standard
再生時間
4–12s
1回の生成あたり
アスペクト比
6
16:9 · 9:16 · 4:3 · 3:4 · 21:9 · 1:1
入力モダリティ
4
テキスト · 画像 · 動画 · オーディオ
最大入力ファイル数
12
モダリティ間の合計
リファレンス画像
9
キャラクター、オブジェクト、シーン
リファレンス動画
3
合計最大15秒
オーディオファイル
3
合計最大15秒
リップシンク対応言語
8+
EN · ZH · KO · JA · ES · ID & その他
オーディオレイヤー
3
会話 · フォーリー · アンビエンス
v1.5比の速度
+30%
より高速な生成
ビジュアルスタイル
8+
フォトリアリスティックからアブストラクトまで
比較

2.0 vs 1.5 Pro

解像度、オーディオ、入力、速度、クリエイティブコントロール — あらゆる面で向上。

機能Seedance 2.0Seedance 1.5 Pro
解像度最大2K1080p
ネイティブオーディオ会話 + フォーリー + アンビエンス基本的なオーディオ同期
リップシンク8言語以上、音素レベル限定的な言語サポート
入力モダリティテキスト + 画像 + 動画 + オーディオテキスト + 画像のみ
最大入力ファイル数12ファイル同時1〜2ファイル
キャラクター一貫性極めて高い — マルチショットIP継続性良好 — シングルショット
マルチショットストーリーテリング対応 — 自動シーン遷移非対応
カメラ制御リファレンス動画抽出プロンプトのみ
動画編集自然言語による編集非対応
生成速度30%高速化ベースライン
ユースケース

作成できるもの

📱

ソーシャルメディアコンテンツ

TikTok、Instagram Reels、YouTube Shorts向けのスクロールを止める動画を作成。ネイティブオーディオ生成により、オーディオ編集不要ですぐに投稿できるコンテンツが完成します。

🛍️

プロダクトマーケティング

プロフェッショナルなカメラワークによるシネマティックな製品紹介動画を生成。製品写真をアップロードし、カメラ技法のリファレンス動画を追加して、洗練されたコマーシャルを取得。

🎞️

ショートフィルム & ナラティブ

シーン間で一貫したキャラクターによるマルチショットのストーリーシーケンスを制作。自動遷移とキャラクターアイデンティティの持続により、エピソードコンテンツの制作が可能に。

📚

教育コンテンツ

8言語以上での同期ナレーションリップシンク付きの魅力的な解説動画を作成。ナレーション音声をアップロードすると、モデルがそれに合った映像を生成します。

🎶

ミュージックビデオ

オーディオ入力からビートに同期した映像を生成。モデルがシーン遷移、キャラクターの動き、カメラカットを音楽のリズムに合わせて同期します。

💎

ブランドストーリーテリング

極めて高いキャラクター一貫性でエピソードコンテンツシリーズを構築。ブランドマスコット、スポークスパーソン、製品がすべてのショットでアイデンティティを維持します。

🎯

映画プリビジュアライゼーション

実際の制作前にリファレンス動画を使って複雑なカメラワークをプロトタイプ。Hitchcock zoom、クレーンショット、オービットシーケンスを仮想的にテスト。

🌍

多言語コンテンツ

英語、中国語、韓国語、日本語、スペイン語、インドネシア語など、異なるオーディオを使った1つのプロンプトから同じ動画をリップシンク付きで生成。

お客様の声

Our Trustpilot score

人々が公共のプラットフォームで行ったコメントを読んでください。

FAQ

よくある質問

Seedance 2.0について知っておくべきすべてのこと

Seedance 2.0とは?

Seedance 2.0 is ByteDance's next-generation AI video model. It generates video with native audio (dialogue, foley, and ambience) from four input types: text, images, video references, and audio. It outputs up to 2K resolution with extreme character consistency and professional camera techniques.

Seedance 2.0が他のAI動画モデルと異なる点は?

Three key differentiators: (1) Native audio-visual generation — audio isn't post-processed but generated jointly with video, enabling true lip-sync and beat matching. (2) Reference video input — upload existing videos to extract and reproduce camera movements and character motion without complex prompting. (3) Multi-shot storytelling with extreme character consistency across scenes.

マルチモーダル入力システムはどのように機能しますか?

You can combine up to 12 files: up to 9 images (for characters, locations, style references), up to 3 video clips (for camera movements and motion references, 15s total), and up to 3 audio files (for voiceover and music, 15s total). Use @Image1, @Video1 notation in your prompt to assign roles to each file.

Seedance 2.0はどのようなカメラ技法に対応していますか?

Seedance 2.0 understands professional cinematography language including: Hitchcock zoom (dolly-zoom), tracking shots (rear, side, frontal), orbiting/circling shots, crane and boom movements, pan and tilt with precise degree control, push/pull zoom, and robotic arm multi-angle effects. You can describe these in text or upload a reference video.

対応する解像度とフォーマットは?

Output: up to 2K resolution (1080p standard), 4–12 second duration, 6 aspect ratios (16:9, 9:16, 4:3, 3:4, 21:9, 1:1). The model supports photorealistic, anime, 2D/3D animation, watercolor, film noir, and abstract visual styles.

ネイティブオーディオ生成はどのように機能しますか?

Seedance 2.0 generates three audio layers simultaneously with the video: Dialogue (with phoneme-level lip-sync in 8+ languages), Foley (action-matched sound effects like footsteps, impacts, and environmental interactions), and Ambience (background audio like wind, crowds, rain). All layers are synchronized with the visual content.

複数のショット間でキャラクターの外見を制御できますか?

はい。Seedance 2.0は極めて高いキャラクター一貫性を備えています — 顔の特徴、服装の詳細、アクセサリー、ビジュアルスタイルがマルチショットナラティブ全体で均一に維持されます。キャラクターのリファレンス画像をアップロードすると、モデルが生成シーケンス全体でアイデンティティの持続性を維持します。

動画リファレンス入力はどのように機能しますか?

最大3本のリファレンス動画(合計15秒)をアップロードします。モデルがリファレンス映像からカメラ軌道、キャラクターのモーションパターン、表情を抽出し、新しいキャラクターとシーンで生成される動画に適用します。これにより、複雑なテキストベースのカメラ指示が不要になります。

リップシンクはどの言語に対応していますか?

Seedance 2.0 supports phoneme-level lip-sync in 8+ languages: English, Mandarin Chinese, Cantonese, Korean, Japanese, Spanish, Indonesian, and more. You can generate the same scene with lip-sync in different languages by changing the audio input.

Seedance 2.0のクレジット消費量は?

Seedance 2.0は秒単位の料金設定です。クレジットコストは長さに応じてスケールします — 短いクリップほど安く、長いクリップほど高くなります。現在のクレジットレートは動画生成ページをご覧ください。

Seedance 2.0で生成した動画を商用利用できますか?

はい。Easy-Peasy.AI上のSeedance 2.0で生成された動画は、マーケティング、広告、ソーシャルメディア、製品動画、コンテンツ制作を含む商用目的で使用できます(利用規約が適用されます)。

Seedance 2.0は以前のバージョンと比べてどのくらい速いですか?

Seedance 2.0はSeedance 1.5 Proより30%高速で、より高い解像度(最大2K vs 1080p)、より多くの入力モダリティ、ネイティブマルチレイヤーオーディオ生成を提供します。標準的なクリップの一般的な生成は60秒以内に完了します。

AIでより速く作成します。
リスクフリーでお試しください。

時間を無駄にせず、生成AIの力ですぐに高品質なコンテンツを作成し始めましょう。

App screenshot