Skip to main content

画像ノード の基本を学ぶ

画像ノードを使うと、ビジュアルをより詳細に表現したり、コンセプトを深く探ったり、視覚的な構成を組み立てたりすることができます。 また、テキストとビジュアル情報を繋ぐ架け橋として、デザイン案を練り直したり、様々なスタイルやカラーパレットを試したり、複数の画像を組み合わせて複雑なビジュアルストーリーを創り出すことも可能です。
  • テキストから画像(Text to Image): プロンプト(指示テキスト)を基に画像をゼロから生成します。
  • 画像から動画(Image to Video): 入力された画像をソースとして、テキストの指示や別の画像などを参考に、新たな画像を生成・編集します。

画像モデル

モデルクレジット/単位モダリティ最適な用途(コンテンツ作成)
DALL-E 23Cr/画像テキスト→画像生成高品質な創造的画像の生成に。シーンの文脈理解力が高く、イラスト制作や写真の部分修正など、正確さと表現力が求められる作業に有用。多様なスタイルを生成でき、細部の整合性が取れたビジュアルが必要なプロジェクトに適している。
DALL-E 35Cr/画像テキスト→画像生成複雑なリクエストや長文プロンプトで狙い通りの画像を得たい場合に最適。広告・マーケティング用のビジュアル作成、正確な表現が求められるイラストやデザインの試作に有用。
FLUX シリーズ10Cr/秒テキスト→画像フォトリアルな高品質画像生成に長ける。実写的な描写力はMidjourney v6に近く、人間の手などの細部も安定。リアルな合成画像や製品写真の生成に適している。多様なスタイルを試したいクリエイティブ作業にも有用。
Grok-21Cr/3 k tokテキスト→画像ソーシャルメディア上でのクリエイティブなコンテンツ制作に。他のAIで難しい著名人やキャラクターを用いたミームやパロディ画像の作成で活躍。チャット形式での微調整にも対応。
Grok-33Cr/3 k tokテキスト→画像フォトリアルで忠実なビジュアル制作に。実在風景・人物の精密なレンダリングや、ロゴ・文字を含む画像の生成が得意。広告デザイン、プロダクトビジュアル、映像のプリビズ等で活用できる。
GPT-Image-119Cr/画像テキスト→画像プロ向けのコンテンツ制作全般。マーケティング用ビジュアル、企業ロゴ・商品画像の生成に最適。