Skip to main content

概要

テキストから動画へ(Text-to-Video)の変換モデルは、テキストプロンプトを入力として受け取り、そのプロンプトをガイドとしてシーンの構成、動き、スタイルを決定し、記述された物語や視覚的なコンセプトに合致する動的な動画コンテンツを生成します。

操作方法

ダブルクリックでテキストノードを選択し、ノード内にプロンプト指示を入力します。 テキストノードから動画ノードに接続し、テキストノードで指示した動画を生成することができます。

テキストから動画を生成するモデル

以下は、利用可能なモデルのリストです。
モデルクレジット/単位モダリティ最適な用途対応パラメータ
Gen-3 Turbo6Cr/秒画像→動画<br />テキスト→動画ループ動画や明確なエンディングが必要なプロジェクト(例:シームレスなループ映像や物語性のある短編動画)に最適。映像内のオブジェクトやキャラクターの配置を厳密にコントロールしたいケースに向いています。長さ: 5秒<br />解像度: 720p<br />アスペクト比: 横(16:9)、縦(9:16)<br />フレームレート: 24FPS
Gen-4 Turbo14Cr/秒画像→動画<br />テキスト→動画シネマティックで滑らかな映像表現や複数フォーマットでの動画制作に適しています。高速に高品質な映像を得られるため、広告やマーケティング用のプロモーション動画、映画・映像制作におけるプロトタイピング、ビジュアルエフェクト作成などに最適です。長さ: 最大10秒<br />解像度: 720p<br />アスペクト比: 横(16:9)、縦(9:16)、正方形(1:1)<br />フレームレート: 24FPS
I2V-01 Standard / Live (MiniMax)10Cr/秒画像→動画<br />テキスト→動画幅広い短編映像の制作に利用可能です。特にLiveモデルは、マンガのコマやイラストを動かして魅力的なアニメーションにする用途に適しています。プロモーション用の簡易アニメ動画やSNS向けコンテンツ制作にも向いています。長さ: 約5~6秒程度<br />解像度: 720p 前後<br />ループ: 対応なし<br />アスペクト比: 標準的な横長
S2V-01 (MiniMax)15Cr/秒画像→動画<br />テキスト→動画登場人物やキャラクターの外見を維持した動画を作りたいケースに最適です。映画のトレーラー、ブランドのマスコットキャラクターが登場するプロモーション動画など、キャラクター重視の物語映像やマーケティング素材の制作に向いています。長さ: 5秒程度<br />解像度: 720p 前後<br />ループ: 対応なし<br />アスペクト比: 横長が基本<br />入力: 被写体の参照画像+テキストプロンプト
T2V-01 / Director (MiniMax)10Cr/秒画像→動画<br />テキスト→動画映画さながらのシネマティックな短編映像の生成に最適です。映画トレーラー、ミュージックビデオ、高品質なCMなどで威力を発揮します。映像制作のプロトタイプ作成や、凝った演出の動画コンテンツ制作に向いています。長さ: ~5秒程度<br />解像度: 720p 前後<br />アスペクト比: 横長推奨 (16:9など)
Kling (各バージョン)6~12Cr/秒画像→動画<br />テキスト→動画画像から特定のモーションパスを持つ動画を作成する用途に優れています。SNS向けの短尺動画、製品デモ、チュートリアル動画の作成、クリエイティブな映像作品まで幅広く活用できます。長さ: 5秒<br />解像度: 最大1080p<br />アスペクト比: 横(16:9)、縦(9:16)、正方形(1:1)
Ray 1.6 (Luma)12Cr/秒画像→動画<br />テキスト→動画キャラクター主体の短編ストーリー動画や解説動画、ループする背景アニメーションの作成に適しています。ゲームのコンセプトムービーやプロダクト紹介映像など、クリエイティブな演出が求められるコンテンツ制作に最適です。長さ: 5秒<br />解像度: 540p, 720p, 1080p<br />アスペクト比: 横(16:9)、縦(9:16)、正方形(1:1)
Ray 2 (Luma)36Cr/秒画像→動画<br />テキスト→動画高品質なキャラクター主体の物語映像や解説ビデオ、ソーシャルメディア向けの高度なマーケティング動画、教育用途の説得力ある映像コンテンツの生成に向いています。映画やアニメ制作におけるプロトタイプ映像作成にも有用です。長さ: 5秒または10秒(最大約10秒)<br />解像度: 540p, 720p, 1080p<br />アスペクト比: 横(16:9)、縦(9:16)、正方形(1:1)
Ray Flash 2 (Luma)9Cr/秒画像→動画<br />テキスト→動画短いリアル映像を迅速に作成したい場合や、多数の試行を重ねるプロトタイピング用途に最適です。SNS投稿用の数秒動画の量産や、映像アイデアの高速な検証、A/Bテスト用映像作成などで活躍します。長さ: 5秒または10秒<br />解像度: 540p, 720p, 1080p<br />アスペクト比: 横(16:9)、縦(9:16)、正方形(1:1)<br />その他: 生成速度はRay2比で約3倍

【目的別】テキストから動画を生成する際のおすすめモデル選択

テキストから動画を生成できるAIモデルには、物語表現、広告用映像、芸術的表現など、それぞれの得意分野があります。作りたい動画の目的に応じて、最適なモデルを選びましょう。

A) 高品質な広告や製品紹介映像を作りたいなら

ブランドイメージを崩さず、リアルなビジュアルで訴求力のある広告を制作するなら、解像度や動きの滑らかさに優れた高性能モデルが最適です。 Runway (Gen-4 Turbo / Gen-3 Turbo)
  • 特徴: 実写に近い高品質映像を高速に生成可能。Gen-4はプロンプト内の世界観を忠実に再現し、シームレスなシーン遷移や高いカメラ表現も実現可能。Gen-3はループや終了フレームのコントロールが強力。
  • 用途:
    • 製品プロモーション用ショートビデオ
    • ブランドキャンペーン映像
    • 実写風の広告表現やビジュアルデモ
Luma (Ray 2 / Ray Flash 2)
  • 特徴: 写実的かつ映画的なカメラワークと滑らかな動きが特徴。Ray 2はディテール重視、Flash 2は高速&コスト効率重視で大量生成にも向く。
  • 用途:
    • 高品位な製品広告/PRムービー
    • SNSでのA/Bテスト用広告動画
    • コンセプトビデオの高速試作

B) ストーリー性のあるコンテンツや物語動画を作りたいなら

キャラクターの一貫性、物語の構成力、映像内の視点や演出のコントロールが求められる場合は、文脈理解力とカメラ演出力が高いモデルが必要です。 MiniMax (T2V-01 / Director)
  • 特徴: テキスト内の物語構造や文脈を理解し、映画的なカメラ演出(例:Pan, Zoom, 俯瞰視点)を自然に反映。プロンプト内でカメラ操作を明示的に指示可能。
  • 用途:
    • ストーリー性のある商品紹介(例:「少年が製品を見つける」など)
    • アニメーション風のCM、PRストーリー動画
    • ミュージックビデオ、物語風SNSコンテンツ
MiniMax (S2V-01)
  • 特徴: 特定キャラクターの外見を保持しつつ、テキストでそのキャラクターの行動やシーンを制御できる。ブランドマスコットやタレントを起用した一貫映像に最適。
  • 用途:
    • キャラクター中心のストーリー動画
    • ブランディングシリーズコンテンツ
    • 短尺エピソード広告

C) アーティスティックで印象的な映像を作りたいなら

ビジュアル重視で、独創的かつスタイルのある映像が求められるなら、スタイル変換や空気感の演出が得意なモデルを選びましょう。 Luma (Ray 1.6 / Ray 2)
  • 特徴: キーフレーム・構図指定による構成力と、質感や光のニュアンス表現に強い。Ray 2はよりリアルに、Ray 1.6はループ・プロトタイプに向く。
  • 用途:
    • 展示・イベント向けオープニングムービー
    • SNSでの世界観訴求型ティザー動画
    • アーティストやブランドのイメージ強化映像
Kling (v1.5〜)
  • 特徴: 映画風やアニメ風など、多彩なスタイル切替に対応。抽象的なテキストプロンプトでも個性的な映像を生成。
  • 用途:
    • コンセプチュアルなPV/MV
    • アートディレクションの下での表現実験
    • ルックテスト・コンセプト提案映像