Stable Diffusionプロンプトをマスターする
Stable Diffusionは、その使い方を知っていれば、AI画像生成において比類のないコントロールを提供します。よりシンプルなインターフェースとは異なり、Stable Diffusionは技術的な知識に対して精密にカスタマイズされた結果で報います。このガイドでは、Stable Diffusion作品を次のレベルに引き上げる上級プロンプティングテクニックを紹介します。
AUTOMATIC1111のWeb UI、ComfyUI、またはその他のインターフェースを使用している場合でも、これらのテクニックは幅広く適用できます。プロンプト構文、重み付け、ネガティブプロンプト、モデル固有の戦略、上級ワークフローについて解説します。
プロンプト構文を理解する
Stable Diffusionは自然言語AIとは異なる方法でプロンプトを解釈します。その構文を理解することは非常に重要です:
基本構造:プロンプトはカンマで区切られたコンセプトとして処理されます。各コンセプトは個別に解釈され、その後組み合わされます。「a red car, sunset, beach」は3つの異なる要素を処理します。
単語の順序が重要:先頭のトークンは一般的により多くの注目を受けます。最も重要なコンセプトを最初に配置しましょう。
括弧で強調:(word)は注目を1.1倍増加させます。((word))は1.21倍(1.1の2乗)増加させます。3〜4レベルまでネストできますが、それ以上は効果が薄れます。
角括弧で弱化:[word]は注目を0.9倍減少させます。[[word]]は0.81倍減少させます。繊細な背景要素に便利です。
明示的な重み:(word:1.5)は正確な注目の重みを設定します。通常0.5〜1.5の範囲で使用します。2.0を超えるとアーティファクトが発生することが多いです。
| Syntax | Effect | Multiplier | Example |
|---|---|---|---|
| (word) | Increase attention | 1.1x | (beautiful landscape) |
| ((word)) | Strong increase | 1.21x | ((detailed eyes)) |
| (word:1.5) | Explicit weight | 1.5x | (golden hour:1.5) |
| [word] | Decrease attention | 0.9x | [background trees] |
| [word:0.5] | Explicit reduction | 0.5x | [clouds:0.5] |
| [word1:word2:0.5] | Prompt switching | At 50% of steps | [cat:dog:0.5] blends concepts |
Recommended Sampler Settings
For photorealism: DPM++ 2M Karras, 25-30 steps, CFG 7-8
For artistic/stylized: Euler a, 20-25 steps, CFG 7-9
For speed: DPM++ SDE Karras, 15-20 steps, CFG 7
For maximum detail: DPM++ 2M Karras, 40-50 steps, CFG 7-8, with Hires. fix
ネガティブプロンプトをマスターする
ネガティブプロンプトはStable Diffusionが真に輝く場所です。モデルに何を避けるべきかを伝え、品質を劇的に向上させます。
必須ネガティブプロンプトベース:品質ベースのネガティブから始めましょう:「blurry, low quality, lowres, bad anatomy, bad hands, cropped, worst quality, low quality, normal quality, jpeg artifacts, watermark, text, signature」
スタイル固有のネガティブ:ターゲットスタイルに基づいてネガティブを追加します:
フォトリアリズム向け:「cartoon, anime, illustration, painting, drawing, art, sketch」
アニメ/イラスト向け:「photorealistic, photograph, 3d, 3d render, realistic」
クリーンな画像向け:「busy background, cluttered, noisy, grainy」
解剖学ネガティブ:「bad anatomy, bad hands, missing fingers, extra fingers, extra limbs, missing limbs, fused fingers, too many fingers, mutated hands, malformed limbs, extra arms, extra legs」
顔のネガティブ:「deformed face, ugly face, asymmetric eyes, bad eyes, cross-eyed, blurry face」
高度なプロンプトウェイティング
戦略的な重み付けで微妙なニュアンスのある結果を作成できます:
被写体の強調:メインの被写体に背景要素より高い重みを付けます。「(beautiful woman:1.3), garden background, soft lighting」は被写体に注目を集中させます。
スタイルのバランス:スタイルを組み合わせる際に重み付けします:「portrait, (oil painting:0.8), (impressionist:0.6)」は繊細なスタイルブレンドを作成します。
ディテールのコントロール:ディテールキーワードに重みを付けます:「landscape, mountains, (intricate details:1.2), (8k:1.1)」やりすぎないようにしましょう。
プロンプトブレンディング:[from:to:when]構文でトランジションを使用:「[day:night:0.5]」はステップ50%で昼から夜に移行します。
モデル固有の戦略
異なるStable Diffusionモデルは異なるアプローチに反応します:
SDXL:SD 1.5より自然言語をよく扱えます。より長く、より描写的なプロンプトを使用できます。詳細なシーンの説明が効果的です。推奨解像度:1024x1024またはそれに近い値。
SD 1.5モデル:キーワードスタイルのプロンプトを好みます。短く、焦点を絞ったプロンプトがよりうまく機能します。多くが特定のスタイルで学習されています—トリガーワードを使用しましょう。一般的な解像度:512x512。
リアリスティックモデル(Realistic Visionなど):写真用語が効果的:「DSLR, 85mm, f/1.8, bokeh」。ライティングの説明を含めましょう:「studio lighting, natural light, rim light」。真実味のためにカメラ設定を参照します。
アニメモデル:アニメ固有の品質タグを使用:「masterpiece, best quality, highly detailed」。アートスタイルの参照を含めましょう:「by (artist name)」。自然言語よりもキャラクター説明のキーワードが重要です。
構図とレイアウトコントロール
プロンプトで画像構図をガイドしましょう:
視点キーワード:「wide shot, close-up, medium shot, bird's eye view, worm's eye view, Dutch angle, straight-on, profile view」
フレーミング:「centered, rule of thirds, symmetrical, asymmetrical, full body, portrait, headshot」
空間的関係:位置関係を明示的に指定:「woman standing in foreground, mountains in background, river between them」
アスペクト比の考慮:プロンプトを出力比率に合わせましょう。ポートレートは縦長、風景は横長の比率でより良い結果が得られます。
品質向上キーワード
これらのキーワードは一貫して結果を改善します:
一般的な品質:「masterpiece, best quality, highly detailed, sharp focus, professional, high resolution, 8k, 4k」
ライティング:「beautiful lighting, dramatic lighting, soft lighting, volumetric lighting, cinematic lighting, golden hour, rim light」
レンダリング:「detailed, intricate, elaborate, highly detailed, fine details, sharp, crisp」
芸術的品質:「award-winning, trending on artstation, artstation quality, deviantart quality」
注意:効果はモデルによって異なります。特定のチェックポイントで何が効果的かテストしましょう。
上級ワークフローテクニック
これらの上級アプローチでレベルアップしましょう:
段階的な洗練:まず低いステップ数/解像度で生成し、素早く反復します。良い構図が見つかったら、より高い品質で再生成しましょう。
シード操作:プロンプトを調整しながら構図を維持するためにシードを固定します。seed+1、seed+2で類似だが異なるバリエーションを見つけられます。
プロンプトスケジューリング:生成途中でプロンプトを変更:「[detailed background:simple background:0.6]」は詳細から始まり、シンプルに移行します。
ワイルドカード:バリエーションのためにワイルドカード構文を使用:「a __color__ __animal__ in a __setting__」は事前定義されたリストから引き出します。
ControlNet統合:テキストプロンプトとControlNetを組み合わせて、プロンプトの影響を維持しながら、ポーズ、構図、スタイルを精密にコントロールします。
一般的な問題のトラブルシューティング
過飽和/アーティファクト:強調の重みを減らしましょう。CFGスケールを下げましょう。品質のネガティブを追加しましょう。
プロンプトの一部が無視される:無視されたコンセプトの重みを増やしましょう。重要な要素をより前に移動しましょう。プロンプトを簡素化しましょう—コンセプトが多すぎると注目が分散します。
スタイルが一貫しない:より具体的なスタイルキーワードを使用しましょう。ターゲットスタイルにより適した別のモデルを試しましょう。スタイル関連の重みを増やしましょう。
解剖学の問題:包括的な解剖学ネガティブを追加しましょう。別のモデルを試しましょう。ポーズガイダンスにControlNetを使用しましょう。より高い解像度で生成しましょう。
結論
Stable Diffusionの複雑さはその強みです—これらのテクニックをマスターすることで、よりシンプルなプラットフォームでは得られないクリエイティブなコントロールが手に入ります。基本から始めて、徐々に上級テクニックを取り入れ、常に実験し続けましょう。
異なるモデルは異なる反応を示すことを忘れないでください。あるチェックポイントでうまくいくことが、別のものでは調整が必要かもしれません。好みのモデル用の効果的なプロンプトの個人ライブラリを構築し、何がうまくいくかを学びながらアプローチを洗練し続けましょう。
Stable Diffusionコミュニティは常に新しいテクニックを発見しています。フォーラム、Discordサーバー、GitHubリポジトリに参加して、スキルを最新の状態に保ちましょう。素晴らしい作品生成を!