AIクリエイティブ・ディレクター研修:Google & OpenAI モデルを駆使した次世代の視覚表現・映像制作術

画像生成AIプロンプトの6層構造:DALL-E 3 & Imagen 3 完全攻略 | Chapter2

阿部

阿部

Camp College

初級 10
公開日: 2026.01.06

AIに「視覚」を伝えるプロンプト術

「美しい風景を描いて」と頼んでも、AIは困惑します。それはスイスの雪山でしょうか、それとも夕暮れのハワイのビーチでしょうか?

Chapter 1では、AIへの指示を「設計」と捉えるマインドセットを学びました。本章では、その設計図を具体的な画像生成プロンプトとして記述するための技術的アプローチに入ります。

GoogleのImagen (Gemini) やOpenAIのDALL-E 3といった最新モデルは非常に高い言語理解能力を持っていますが、それでも「言葉足らず」な指示では、AIは確率的に「最もありふれた画像」を出力してしまいます。

意図通りの画像を生成するための鍵は、プロンプトを6つのレイヤー(層)で積み上げることです。


2-1. 画像プロンプトの「6層構造」フレームワーク

プロフェッショナルな画像生成において、プロンプトは単なる単語の羅列(タグ・スープ)ではなく、構造化された記述であるべきです。

第1層:主題 (Subject) - 「何」を描くか

画像の主役となる要素です。抽象的な概念(「愛」「平和」)を避け、具体的な名詞を使用します。

  • 悪い例: 「かっこいい犬」
  • 良い例: 「堂々としたゴールデンレトリバー」

第2層:行動 (Action) - 「何」をしているか

静止画であっても、動き(動詞)を含めることで物語性が生まれます。

  • 記述例: 「フリスビーを空中でキャッチしようと跳躍している」「古書を読みふけっている」

第3層:環境 (Environment) - 「どこ」にいるか

被写体を取り巻く背景や状況です。場所の湿度や温度が伝わるような描写を加えます。

  • 記述例: 「朝霧が立ち込める針葉樹林の奥深く」「ネオンサインが濡れたアスファルトに反射するサイバーパンクな東京の路地」

第4層:照明と雰囲気 (Lighting & Atmosphere) - 「ムード」の決定

光は感情を決定づける最も重要な要素です。具体的なライティング用語を使用しましょう。

  • 記述例: 「ゴールデンアワー(夕暮れ時の黄金の光)」「ドラマチックな陰影(Chiaroscuro)」「柔らかい拡散光(Soft diffused light)」

第5層:スタイル (Style) - 「どう」描くか

画風や媒体の指定です。写真、油絵、3Dレンダリングなどを明確にします。

  • 記述例: 「35mmフィルム写真」「印象派の油絵」「Unreal Engine 5による3Dレンダリング」

第6層:技術仕様 (Specs) - 「レンズ」を通す

カメラの設定を指定することで、AIの出力をプロレベルに引き上げます。

  • 記述例: 「85mmレンズ(ポートレート用)」「f/1.8(背景ボケ)」「俯瞰ショット(Overhead shot)」

2-2. モデル別アプローチの実践

OpenAI (DALL-E 3):会話型リライトの理解

DALL-E 3はChatGPTがプロンプトを自動的にリライトします。

  • 戦略: 「自然言語」で指示します。単語の羅列より「〜のような雰囲気で、〜をしている様子を描いて」と文章で伝える方が意図を汲み取ります。
  • スタイル制御: パラメータとして「Vivid(鮮やか)」または「Natural(自然的)」を指定可能です。

Google (Gemini / Imagen):忠実性とテキスト描画

Googleの最新モデル(Imagen 3など)は、フォトリアリズムと「画像内の文字」に強みがあります。

  • 戦略: 具体的な記述を好みます。画像内に含めたいテキストは 二重引用符(" ") で囲んで指示します。
  • マルチモーダル: 複雑な資料を読み込ませ「この内容を要約したインフォグラフィックにして」という指示も得意です。

2-3. 実践テクニック:スタイルの制御と否定

  • 否定プロンプト (Negative Prompting): 描いてほしくないものを指定します。DALL-E 3では「~を含めないで」と文章で指示するのが有効です。
  • 参照画像 (Reference Image): 言葉で伝えにくいスタイルは、画像をアップロードして「この画風(色使い、タッチ)を真似して」と指示することで、スタイルレイヤーを強力に固定できます。

【保存版】プロンプト例題集:6層構造の実践

例題1:フォトリアルなポートレート

プロンプト:

[Subject] 30代の日本人陶芸家、作業着を着ている。
[Action] ろくろを回し、濡れた粘土に集中して形を作っている。
[Environment] 古民家を改装した工房、背景には棚に並んだ未完成の作品。窓から差し込む午後の光。
[Lighting] サイドライティング、空気中の埃が光に舞っているドラマチックな陰影。
[Style] 映画的なドキュメンタリー写真。
[Specs] 85mmレンズ、f/1.8(浅い被写界深度)、高解像度、Sony A7IVで撮影。

例題2:ビジネス向け3Dイラスト

プロンプト:

[Subject] 近未来的なスマートシティの物流ハブ。
[Action] 自動配送ドローンがパッケージを運び、自律走行トラックが道路を走っている。
[Environment] クリーンな白い背景(スタジオ設定)。
[Lighting] 明るく均一なスタジオライティング、柔らかい影。
[Style] 3Dレンダリング、アイソメトリックビュー、クレイ(粘土)質感、ミニマリストデザイン。
[Specs] 4k解像度。

例題3:クリエイティブ広告(DALL-E 3向き)

プロンプト:

[Subject & Action] 透明なガラスのコーヒーカップの中に、ミニチュアの宇宙が広がっている。コーヒーの渦が銀河のように回転している。
[Environment] 暗い宇宙空間に浮かんでいる。
[Lighting] カップの内側から発光する幻想的な光。
[Style] 超現実主義(シュルレアリズム)、デジタルアート。
[Text] 下部にエレガントなフォントで "Galaxy Brew" と書かれたラベルを表示。


次のステップへ

この「6層構造」をマスターすれば、AIに対して意図的な生成が可能になります。

次章の【Chapter 3:画像生成・応用編】では、生成した画像の一貫性を保ちながら、キャラクターを固定したり、部分的に修正したりする高度なテクニックに進みます。

次のレッスンへ

Current Lesson

画像生成AIプロンプトの6層構造:DALL-E 3 & Imagen 3 完全攻略 | Chapter2