再現性のあるAI活用へ
Chapter 2では、プロンプトの「6層構造」を用いて高品質な画像を出力する方法を学びました。しかし、実務でAIを使用する際、最大の壁となるのは「再現性」と「修正」です。
- 「さっきのキャラクターを、別のポーズで描いてほしい」
- 「背景の通行人だけを消したい」
- 「ラフスケッチをそのまま製品画像にしたい」
こうした要求に対し、ゼロから再生成(Re-roll)していては、いつまで経っても同じキャラクターには出会えません。本章では、GoogleとOpenAIのモデルを駆使し、一貫性(Consistency)を保ちながら細部を外科手術のように修正(Editing)するテクニックを習得します。
3-1. キャラクターとスタイルの固定(Identity Locking)
最新モデルでは「参照画像(Reference Image)」を活用することで、キャラクターの固定が現実的になっています。
Google (Gemini / Nano-Banana Pro) のアプローチ
Googleの最新モデル(Nano-Banana Proなど)は、「Identity Locking(アイデンティティの固定)」において圧倒的な強みを持っています。
多枚数リファレンス: 最大14枚の参照画像を処理可能。特定の顔立ちや服装を固定したまま、表情やアングルだけを変化させられます。
プロンプト戦略:
Keep the person's facial features exactly the same as Image 1(顔の特徴を完全に維持せよ)と明示的に指示するのが有効です。
OpenAI (DALL-E 3) のアプローチ
DALL-E 3は、ChatGPTとの対話を通じて文脈を引き継ぐことに長けています。
- セッション内での一貫性: 「先ほどのキャラクターを維持したまま、今度はカフェに移動させて」といった対話的な指示が可能です。
- Gen-ID (Generation ID): 各画像に割り振られた固有IDを参照し、「このGen-IDのスタイルを使って」と指示することでトーンを統一できます。
3-2. 部分修正と編集 (Inpainting / Outpainting)
「全体は完璧だが、細部だけ直したい」場合は、**「Edit, Don't Re-roll(再生成せず、編集せよ)」**が鉄則です。
DALL-E 3:領域選択編集(インペインティング)
ChatGPT上の編集ツールを使い、修正したい範囲を塗りつぶして指示を出します。
- 活用例: 誤字の修正、不要なオブジェクトの削除、服の色の変更など。
Googleモデル:セマンティック編集
手動のマスク(範囲選択)なしで、言葉だけで修正を行う「意味論的編集」に優れています。
- 自然言語による指示: 「背景の観光客を削除して」「このシーンを冬に変えて」と伝えるだけで、AIが対象を特定して修正します。
3-3. ビジネス・デザインへの応用:スケッチから完成品へ
実務では「構造的制御(Structural Control)」、つまり構図を維持したままの生成が重要です。
スケッチ・トゥ・イメージ (Sketch-to-Image)
手書きのラフ画やホワイトボードの図を、高品質な3Dレンダリングや製品画像に変換します。
- 次元の変換: 2Dの間取り図から、モダンなインテリアデザインの3Dパースを作成するといった用途に最適です。
テキストレンダリングとインフォグラフィック
画像内の文字(Text Rendering)精度を活かし、デザイン業務を効率化します。
- 正確な文字描写: 表示させたい文字を 二重引用符(" ") で囲んで指示します。
- データの視覚化: テキストデータを読み込ませ、その内容を要約した図解(インフォグラフィック)を生成させることが可能です。
【保存版】プロンプト例題集:一貫性と修正の実践
例題1:キャラクターの一貫性(Google推奨)
プロンプト:
Image 1の人物を使って、バイラルなYouTubeサムネイルを作成してください。顔の一貫性: 人物の顔の特徴はImage 1と完全に同じに保ちつつ(Keep the person's facial features exactly the same as Image 1)、表情を『驚きと興奮』に変えてください。
例題2:季節と雰囲気の変更(セマンティック編集)
プロンプト:
このシーンを冬に変えてください。維持するもの: 家の建築様式と構図は正確に維持すること。変更するもの: 屋根と庭に雪を追加し、照明を寒々とした曇りの午後の雰囲気に変更してください。
例題3:ラフスケッチからUIデザインへ
プロンプト:
このワイヤーフレームに基づいて、高品質なフードデリバリーアプリのUIモックアップを作成してください。レイアウト: アップロードした画像の要素配置に厳密に従うこと。スタイル: マテリアルデザイン、クリーン、ミニマリスト。
次のステップへ
静止画における「一貫性」と「修正」を習得したら、次はいよいよ画像に「時間」の概念を加えます。
次章【Chapter 4:動画生成・基礎編】では、OpenAIのSoraやGoogleのVeoを使い、静止画に物理法則と動きを与える動画プロンプトの技術に進みます。
