ByteDanceの次世代動画モデル

Seedance2.0

4つの入力モダリティ。ネイティブ音声映像同期。映画的カメラ再現。極めて高いキャラクター一貫性を持つマルチショットストーリーテリング — すべて最大2K解像度で。

Available Now

Seedance 2.0で制作を始める→機能を探る

3,482,705+ happy users

解像度

入力ファイル

リップシンク対応言語

30%

高速化

動画サンプル

Seedance 2.0の実際の動作を見る

Seedance 2.0で生成された実際の出力 — 映画的なワンテイクトラッキングショットから音声同期ナラティブ、マルチキャラクターシーンまで。

ワンテイク・トラッキングショット

複数の都市ロケーションを通じて被写体を連続的に追うカメラ

ネイティブオーディオ付きシネマティック映像

ヴィンテージカーと共に撮影された夕日の映像、フォーリーとアンビエントサウンド付き

アクションシーン合成

星空の下でのダスト効果とダイナミックカメラによる格闘シーン

感情的なナラティブ

画像と音声リファレンスからキャラクターの表情とともに生成されたストーリー

キャラクター置換

モーションを維持しながらシームレスにキャラクターを入れ替えたバンド演奏

マルチショット拡張

一貫したキャラクターで複数のショットにわたって拡張されたシーン

制作モード

4つの制作方法

Seedance 2.0はテキスト、画像、動画リファレンス、音声を入力として受け付けます — 単独でも組み合わせでも、最大限のクリエイティブコントロールが可能です。

T2V

テキストから動画

自然言語でシーンを記述するだけで、Seedance 2.0が同期された会話、フォーリー、アンビエントオーディオとともに映像を生成します — すべてネイティブ生成。

プロンプトによる詳細なシーンとアクションの制御
ネイティブオーディオ生成（会話 + 効果音 + アンビエンス）
全6種類のアスペクト比に対応
4〜12秒の出力時間

I2V

画像から動画

静止画像をアップロードすると、顔の特徴、服装、背景、照明などすべてのディテールを保持しながらリアルなモーションでアニメーション化されます。

アイデンティティを保持したアニメーション
キャラクターやシーン用に最大9枚のリファレンス画像を使用可能
カメラ移動の自動生成
フレーム間で一貫したスタイル

V2V

動画リファレンス

リファレンス動画をアップロードして、カメラの動き、キャラクターのモーション、タイミングを抽出。Seedance 2.0は複雑なプロンプトなしで映画的技法をインテリジェントに再現します。

カメラ軌道の抽出と再現
リファレンス映像からの表情転写
新しいキャラクター/シーンでのモーション複製
最大3本のリファレンス動画（合計15秒）

A2V

オーディオ駆動動画

ナレーション、サウンドトラック、語りを主要な制御信号として使用。モデルはオーディオのリズム、感情、タイミングに合った映像を生成します。

ビートに同期した映像生成
アップロードしたナレーションからのリップシンク
音楽駆動のシーン遷移
最大3つのオーディオファイル（合計15秒）

マルチモーダル入力

最大12ファイル。1回の生成。

以前は、複雑なカメラの動きやキャラクター一貫性のあるマルチシーン動画を得るには、精巧なプロンプトを書く必要がありました。Seedance 2.0では、リファレンスファイルをアップロードするだけで、モデルが必要な要素をインテリジェントに抽出します。

最大9枚の画像キャラクター、ロケーション、小道具、スタイルリファレンス

最大3本の動画カメラの動き、モーションパターン、表情（最大15秒）

最大3つのオーディオファイルナレーション、音楽、同期用効果音（最大15秒）

入力フロー図

Text PromptText Prompt

@Image1 — Character@Image1

@Image2 — Location@Image2

@Image3 — Style ref@Image3

@Video1 — Camera@Video1

@Audio1 — Voiceover@Audio1

動画 + 同期オーディオ

最大2K · 4〜12秒 · 会話 + フォーリー + アンビエンス

シネマティックカメラ制御

ハリウッドのカメラ技法

プロンプトでカメラの動きを記述するか、リファレンス動画をアップロードすると、Seedance 2.0がプロの撮影技法を自動的に抽出・再現します。

Hitchcock Zoom

方向感覚を失わせる遠近感の変化を生み出す古典的なドリーズーム効果 — ドラマチックな場面転換や主人公のパニックシーンに最適。

トラッキングショット

スムーズな後方、側方、前方トラッキングで環境内の被写体を追従。ローアングルおよびハイアングルのバリエーションにも対応。

サークリング / オービット

自然な加速と減速による被写体周囲のマルチアングル周回。ダイナミックな180°および360°のリビールを作成。

クレーン & ブーム

地面レベルから上昇、または空中視点から滑らかな動きで降下する垂直カメラ移動。

パン & チルト

正確な角度ベースのパン（90°、180°）と停止・再開制御。被写体の視線方向を自然に追従。

プッシュ / プルズーム

クローズアップへのスムーズなズームイン、またはワイドシーンを見せるためのプルバック。ズームのペースを制御してドラマチックまたは繊細な効果を演出。

革新的技術

ネイティブ音声映像同期

後処理ステップとしてオーディオを追加する他のモデルとは異なり、Seedance 2.0はコア生成パイプラインの一部として高忠実度オーディオを生成します。3つのインテリジェントなオーディオレイヤーがフレームレベルで映像コンテンツと同期されます。

会話 — 8言語以上での音素レベルのリップシンク
フォーリー — アクションに合わせた効果音（足音、衝撃音、ドア音）
アンビエンス — 環境音（風、群衆、雨、交通）
ビートマッチング — 音楽のための音声映像リズム同期

今すぐ試す

オーディオレイヤースタック

会話90% 精度

リップシンクされた音声 · 8言語以上 · 音素レベルの精度

フォーリー82% 精度

足音 · 衝撃 · オブジェクトインタラクション · 環境効果音

アンビエンス75% 精度

背景の雰囲気 · 天候 · 群衆 · 空間オーディオ

ワークフロー

使い方

入力を選択

テキストプロンプトから始めるか、キャラクターやシーン用のリファレンス画像をアップロード、カメラの動き用のリファレンス動画を追加、またはリップシンクやビートマッチング用のオーディオを提供します。

出力を設定

Select your aspect ratio (16:9, 9:16, 1:1, etc.), video duration (4–12 seconds), and desired visual style — from photorealistic to anime to film noir.

@タグでリファレンス

プロンプト内で@Image1、@Image2、@Video1の表記を使用して、各リファレンスファイルが出力にどのように影響するかをモデルに正確に伝えます。

生成と反復

Seedance 2.0がマルチモーダル入力を処理し、同期されたオーディオ付きの動画を生成します。プロンプトを調整したりリファレンスを差し替えて反復改善できます。

プロンプトガイド

より良い結果のためのヒント

パワーユーザーや公式ドキュメントからのプロンプト技法で、Seedance 2.0を最大限に活用しましょう。

カメラ用語を使う

Include specific cinematography terms: "Hitchcock zoom", "tracking shot following the subject", "slow 180° pan", "low-angle crane rising". Seedance 2.0 understands professional film vocabulary.

プロンプト例

“ダークスーツの男がネオンに照らされた廊下を歩く。カメラは後方トラッキングショットから始まり、エレベーターに到着すると周回オービットに移行する。”

アップロードをリファレンスする

プロンプトで@Imageや@Video表記を使って特定のファイルを役割に割り当てます。画像をキャラクター、ロケーション、スタイルリファレンスに、動画をカメラやモーションリファレンスに割り当てます。

プロンプト例

“@Image1がメインキャラクター。@Image2がオフィスのロケーション。@Video1がカメラの動きを提供。キャラクターがデスクに座り、電話を取り、窓の外を見る。”

感情とモーションを記述する

視覚的な記述を超えましょう。感情状態、呼吸パターン、微表情、ボディランゲージを含めることで、よりリアルなキャラクターアニメーションが実現します。

プロンプト例

“女性が本から顔を上げ、驚きで目を見開く。ゆっくりと立ち上がり、手が微かに震え、ためらいがちに一歩前に踏み出す。”

オーディオの方向をレイヤー化する

Describe the soundscape you want: dialogue content, ambient sounds, and action-specific foley. The model generates all three audio layers natively.

プロンプト例

“にぎやかなカフェのシーン。背景に会話とカップの音。バリスタが注文を呼ぶ。雨が窓を打つ。主人公がため息をつき、コーヒーをかき混ぜる。”

ビジュアルスタイル

あらゆる美学を想像のままに

プロンプトでビジュアルスタイルを指定するか、モデルにリファレンス画像から推測させます。

フォトリアリスティック

実物そのままの品質

シネマティック・フィルム

ハリウッドカラーグレーディング

Anime

日本のアニメーションスタイル

3Dアニメーション

Pixarクオリティのレンダリング

2Dアニメーション

フラットイラストスタイル

水彩画

絵画的なソフトエッジ

Film Noir

ハイコントラスト白黒ドラマ

アブストラクト

非具象アート

仕様

技術仕様

最大解像度

1080p standard

再生時間

4–12s

1回の生成あたり

アスペクト比

16:9 · 9:16 · 4:3 · 3:4 · 21:9 · 1:1

入力モダリティ

テキスト · 画像 · 動画 · オーディオ

最大入力ファイル数

モダリティ間の合計

リファレンス画像

キャラクター、オブジェクト、シーン

リファレンス動画

合計最大15秒

オーディオファイル

合計最大15秒

リップシンク対応言語

EN · ZH · KO · JA · ES · ID & その他

オーディオレイヤー

会話 · フォーリー · アンビエンス

v1.5比の速度

+30%

より高速な生成

ビジュアルスタイル

フォトリアリスティックからアブストラクトまで

比較

2.0 vs 1.5 Pro

解像度、オーディオ、入力、速度、クリエイティブコントロール — あらゆる面で向上。

機能	Seedance 2.0	Seedance 1.5 Pro
解像度	最大2K	1080p
ネイティブオーディオ	会話 + フォーリー + アンビエンス	基本的なオーディオ同期
リップシンク	8言語以上、音素レベル	限定的な言語サポート
入力モダリティ	テキスト + 画像 + 動画 + オーディオ	テキスト + 画像のみ
最大入力ファイル数	12ファイル同時	1〜2ファイル
キャラクター一貫性	極めて高い — マルチショットIP継続性	良好 — シングルショット
マルチショットストーリーテリング	対応 — 自動シーン遷移	非対応
カメラ制御	リファレンス動画抽出	プロンプトのみ
動画編集	自然言語による編集	非対応
生成速度	30%高速化	ベースライン

ユースケース

作成できるもの

📱

ソーシャルメディアコンテンツ

TikTok、Instagram Reels、YouTube Shorts向けのスクロールを止める動画を作成。ネイティブオーディオ生成により、オーディオ編集不要ですぐに投稿できるコンテンツが完成します。

🛍️

プロダクトマーケティング

プロフェッショナルなカメラワークによるシネマティックな製品紹介動画を生成。製品写真をアップロードし、カメラ技法のリファレンス動画を追加して、洗練されたコマーシャルを取得。

🎞️

ショートフィルム & ナラティブ

シーン間で一貫したキャラクターによるマルチショットのストーリーシーケンスを制作。自動遷移とキャラクターアイデンティティの持続により、エピソードコンテンツの制作が可能に。

📚

教育コンテンツ

8言語以上での同期ナレーションリップシンク付きの魅力的な解説動画を作成。ナレーション音声をアップロードすると、モデルがそれに合った映像を生成します。

🎶

ミュージックビデオ

オーディオ入力からビートに同期した映像を生成。モデルがシーン遷移、キャラクターの動き、カメラカットを音楽のリズムに合わせて同期します。

💎

ブランドストーリーテリング

極めて高いキャラクター一貫性でエピソードコンテンツシリーズを構築。ブランドマスコット、スポークスパーソン、製品がすべてのショットでアイデンティティを維持します。

🎯

映画プリビジュアライゼーション

実際の制作前にリファレンス動画を使って複雑なカメラワークをプロトタイプ。Hitchcock zoom、クレーンショット、オービットシーケンスを仮想的にテスト。

🌍

多言語コンテンツ

英語、中国語、韓国語、日本語、スペイン語、インドネシア語など、異なるオーディオを使った1つのプロンプトから同じ動画をリップシンク付きで生成。

Seedance 2.0で制作を始める

特集記事

お客様の声

人々が公共のプラットフォームで行ったコメントを読んでください。

FAQ

よくある質問

Seedance 2.0について知っておくべきすべてのこと

Seedance 2.0とは？

Seedance 2.0 is ByteDance's next-generation AI video model. It generates video with native audio (dialogue, foley, and ambience) from four input types: text, images, video references, and audio. It outputs up to 2K resolution with extreme character consistency and professional camera techniques.

Seedance 2.0が他のAI動画モデルと異なる点は？

Three key differentiators: (1) Native audio-visual generation — audio isn't post-processed but generated jointly with video, enabling true lip-sync and beat matching. (2) Reference video input — upload existing videos to extract and reproduce camera movements and character motion without complex prompting. (3) Multi-shot storytelling with extreme character consistency across scenes.

マルチモーダル入力システムはどのように機能しますか？

You can combine up to 12 files: up to 9 images (for characters, locations, style references), up to 3 video clips (for camera movements and motion references, 15s total), and up to 3 audio files (for voiceover and music, 15s total). Use @Image1, @Video1 notation in your prompt to assign roles to each file.

Seedance 2.0はどのようなカメラ技法に対応していますか？

Seedance 2.0 understands professional cinematography language including: Hitchcock zoom (dolly-zoom), tracking shots (rear, side, frontal), orbiting/circling shots, crane and boom movements, pan and tilt with precise degree control, push/pull zoom, and robotic arm multi-angle effects. You can describe these in text or upload a reference video.

対応する解像度とフォーマットは？

Output: up to 2K resolution (1080p standard), 4–12 second duration, 6 aspect ratios (16:9, 9:16, 4:3, 3:4, 21:9, 1:1). The model supports photorealistic, anime, 2D/3D animation, watercolor, film noir, and abstract visual styles.

ネイティブオーディオ生成はどのように機能しますか？

Seedance 2.0 generates three audio layers simultaneously with the video: Dialogue (with phoneme-level lip-sync in 8+ languages), Foley (action-matched sound effects like footsteps, impacts, and environmental interactions), and Ambience (background audio like wind, crowds, rain). All layers are synchronized with the visual content.

複数のショット間でキャラクターの外見を制御できますか？

はい。Seedance 2.0は極めて高いキャラクター一貫性を備えています — 顔の特徴、服装の詳細、アクセサリー、ビジュアルスタイルがマルチショットナラティブ全体で均一に維持されます。キャラクターのリファレンス画像をアップロードすると、モデルが生成シーケンス全体でアイデンティティの持続性を維持します。

動画リファレンス入力はどのように機能しますか？

最大3本のリファレンス動画（合計15秒）をアップロードします。モデルがリファレンス映像からカメラ軌道、キャラクターのモーションパターン、表情を抽出し、新しいキャラクターとシーンで生成される動画に適用します。これにより、複雑なテキストベースのカメラ指示が不要になります。

リップシンクはどの言語に対応していますか？

Seedance 2.0 supports phoneme-level lip-sync in 8+ languages: English, Mandarin Chinese, Cantonese, Korean, Japanese, Spanish, Indonesian, and more. You can generate the same scene with lip-sync in different languages by changing the audio input.

Seedance 2.0のクレジット消費量は？

Seedance 2.0は秒単位の料金設定です。クレジットコストは長さに応じてスケールします — 短いクリップほど安く、長いクリップほど高くなります。現在のクレジットレートは動画生成ページをご覧ください。

Seedance 2.0で生成した動画を商用利用できますか？

はい。Easy-Peasy.AI上のSeedance 2.0で生成された動画は、マーケティング、広告、ソーシャルメディア、製品動画、コンテンツ制作を含む商用目的で使用できます（利用規約が適用されます）。

Seedance 2.0は以前のバージョンと比べてどのくらい速いですか？

Seedance 2.0はSeedance 1.5 Proより30%高速で、より高い解像度（最大2K vs 1080p）、より多くの入力モダリティ、ネイティブマルチレイヤーオーディオ生成を提供します。標準的なクリップの一般的な生成は60秒以内に完了します。

AIでより速く作成します。
リスクフリーでお試しください。

時間を無駄にせず、生成AIの力ですぐに高品質なコンテンツを作成し始めましょう。

無料で始める

Seedance2.0

Seedance 2.0の実際の動作を見る

ワンテイク・トラッキングショット

ネイティブオーディオ付きシネマティック映像

アクションシーン合成

感情的なナラティブ

キャラクター置換

マルチショット拡張

4つの制作方法

テキストから動画

画像から動画

動画リファレンス

オーディオ駆動動画

最大12ファイル。1回の生成。

ハリウッドのカメラ技法

Hitchcock Zoom

トラッキングショット

サークリング / オービット

クレーン & ブーム

パン & チルト

プッシュ / プルズーム

ネイティブ音声映像同期

使い方

入力を選択

出力を設定

@タグでリファレンス

生成と反復

より良い結果のためのヒント

カメラ用語を使う

アップロードをリファレンスする

感情とモーションを記述する

オーディオの方向をレイヤー化する

あらゆる美学を想像のままに

技術仕様

2.0 vs 1.5 Pro

作成できるもの

ソーシャルメディアコンテンツ

プロダクトマーケティング

ショートフィルム & ナラティブ

教育コンテンツ

ミュージックビデオ

ブランドストーリーテリング

映画プリビジュアライゼーション

多言語コンテンツ

特集記事

よくある質問

AIでより速く作成します。リスクフリーでお試しください。

AIでより速く作成します。
リスクフリーでお試しください。