Maîtriser les Prompts Stable Diffusion
Stable Diffusion offre un contrôle inégalé sur la génération d'images IA, à condition de savoir l'utiliser. Contrairement aux interfaces plus simples, Stable Diffusion récompense les connaissances techniques par des résultats précisément adaptés. Ce guide couvre les techniques avancées de prompting qui élèveront vos créations.
Que vous utilisiez AUTOMATIC1111, ComfyUI ou une autre interface, ces techniques s'appliquent largement. Nous aborderons la syntaxe des prompts, la pondération, les prompts négatifs, les stratégies par modèle et les workflows avancés.
Syntaxe des Prompts
Stable Diffusion interprète les prompts différemment de l'IA en langage naturel :
Structure de base : Les prompts sont traités comme des concepts séparés par des virgules. Chaque concept est interprété individuellement puis combiné. « a red car, sunset, beach » traite trois éléments distincts.
L'ordre compte : Les mots en début de prompt reçoivent plus de poids. Placez vos éléments les plus importants en premier.
Virgules vs points : Les virgules séparent les concepts distinctement. Les points créent des phrases que le modèle peut interpréter comme des descriptions continues.
Parenthèses pour le poids : (mot) augmente le poids de 1.1x. ((mot)) l'augmente de 1.21x. Vous pouvez aussi spécifier : (mot:1.5) pour un poids de 1.5x.
| Syntax | Effect | Multiplier | Example |
|---|---|---|---|
| (word) | Increase attention | 1.1x | (beautiful landscape) |
| ((word)) | Strong increase | 1.21x | ((detailed eyes)) |
| (word:1.5) | Explicit weight | 1.5x | (golden hour:1.5) |
| [word] | Decrease attention | 0.9x | [background trees] |
| [word:0.5] | Explicit reduction | 0.5x | [clouds:0.5] |
| [word1:word2:0.5] | Prompt switching | At 50% of steps | [cat:dog:0.5] blends concepts |
Recommended Sampler Settings
For photorealism: DPM++ 2M Karras, 25-30 steps, CFG 7-8
For artistic/stylized: Euler a, 20-25 steps, CFG 7-9
For speed: DPM++ SDE Karras, 15-20 steps, CFG 7
For maximum detail: DPM++ 2M Karras, 40-50 steps, CFG 7-8, with Hires. fix
Prompts Négatifs
Les prompts négatifs sont essentiels dans Stable Diffusion — ils indiquent ce que vous NE voulez PAS voir :
Négatifs essentiels : « blurry, low quality, distorted, deformed, ugly, bad anatomy, bad proportions » devrait être votre base de départ pour presque toutes les générations.
Négatifs spécifiques au style : Pour le photoréalisme, ajoutez « cartoon, anime, illustration, painting ». Pour l'anime, ajoutez « photorealistic, photograph, 3d render ».
Négatifs de composition : « cropped, out of frame, watermark, signature, text, logo » aide à garder des compositions propres.
Pondération des négatifs : Comme les prompts positifs, vous pouvez pondérer les éléments négatifs. (blurry:1.5) donne un poids plus fort à l'évitement du flou.
Pondération des Prompts
La pondération vous donne un contrôle précis sur l'influence de chaque élément :
Syntaxe de base : (élément:poids) où le poids est un nombre décimal. 1.0 est la valeur par défaut. Au-dessus de 1.0 augmente l'importance, en dessous la diminue.
Plage recommandée : Restez entre 0.5 et 1.5 pour la plupart des cas. Des valeurs extrêmes (au-delà de 2.0) peuvent créer des artefacts et distorsions.
Exemple pratique : « (beautiful sunset:1.3), ocean, (palm trees:0.7), beach » met l'accent sur le coucher de soleil tout en rendant les palmiers subtils.
Alternance de prompts : [concept1|concept2] alterne entre les concepts à chaque étape, créant des fusions intéressantes.
Stratégies par Modèle
Différents modèles Stable Diffusion répondent différemment aux prompts :
SDXL : Comprend mieux le langage naturel. Supporte des prompts plus longs. Deux champs de texte (prompt et prompt négatif) avec un encodeur double. Excelle avec les descriptions détaillées et les références de style.
SD 1.5 et dérivés : Préfère les mots-clés séparés par des virgules. La brièveté fonctionne souvent mieux. La communauté a créé des milliers de modèles spécialisés avec leurs propres mots-clés déclencheurs.
Modèles LoRA : Les LoRA ajoutent des capacités spécialisées. Chaque LoRA a souvent des mots-clés déclencheurs spécifiques. Vérifiez toujours la documentation du LoRA pour les mots-clés optimaux.
Modèles spécialisés : Les modèles d'anime, de photoréalisme ou de style spécifique ont chacun des vocabulaires optimaux. Consultez les pages des modèles pour les recommandations de prompting.
Contrôle de la Composition
Stable Diffusion offre plusieurs outils pour contrôler la composition :
ControlNet : Utilisez des images de contrôle (poses, canny edges, depth maps) pour guider la composition précisément. C'est l'outil le plus puissant pour le contrôle de la composition.
Termes de composition dans le prompt : Incluez des descriptions de cadrage comme « close-up portrait », « wide angle landscape », « bird's eye view », « centered composition », « rule of thirds ».
Inpainting : Modifiez des parties spécifiques d'une image existante avec des prompts ciblés. Idéal pour affiner des détails sans régénérer l'image entière.
Outpainting : Étendez une image au-delà de ses bordures actuelles avec des prompts qui maintiennent la cohérence visuelle.
Mots-Clés de Qualité
Ces mots-clés améliorent systématiquement la qualité des résultats :
Qualité générale : masterpiece, best quality, highly detailed, sharp focus, professional, award-winning
Photoréalisme : photorealistic, hyperrealistic, RAW photo, DSLR, 8K UHD, high resolution, Fujifilm
Art numérique : digital painting, concept art, artstation, deviantart, trending, illustration
Éclairage : volumetric lighting, studio lighting, cinematic lighting, rim light, golden hour, dramatic shadows
Attention : L'empilement excessif de mots-clés de qualité peut avoir des rendements décroissants. Utilisez 3 à 5 mots-clés de qualité ciblés plutôt qu'une longue liste.
Workflows Avancés
Combinez les techniques pour des workflows puissants :
Génération haute résolution : Générez d'abord en résolution de base, puis utilisez le hires fix ou l'img2img pour agrandir avec des détails supplémentaires.
Raffinement itératif : Utilisez img2img avec un denoising faible (0.3-0.5) pour affiner progressivement les images. Ajustez le prompt entre les itérations.
Fusion de styles : Combinez plusieurs LoRA avec des poids différents pour créer des styles uniques. Exemple : LoRA anime à 0.6 + LoRA aquarelle à 0.4.
Lots et variations : Générez des lots d'images avec des seeds différentes pour explorer les possibilités, puis affinez les meilleurs résultats.
Résolution de Problèmes
Solutions aux problèmes courants :
Images floues : Augmentez les étapes de sampling (40-50). Ajoutez « sharp focus, highly detailed » au prompt. Ajoutez « blurry, out of focus » aux négatifs.
Anatomie déformée : Utilisez des négatifs d'anatomie. Essayez ControlNet pour la pose. Réduisez le CFG scale si les images semblent surtraitées.
Couleurs ternes : Ajoutez des descripteurs de couleur spécifiques. Utilisez « vibrant colors, vivid, colorful ». Vérifiez que votre VAE est correctement configuré.
Style incohérent : Fixez le seed pour la reproductibilité. Utilisez des mots-clés de style plus spécifiques. Envisagez un modèle spécialisé pour votre style cible.
Conclusion
Stable Diffusion récompense l'investissement dans l'apprentissage. Maîtriser la syntaxe des prompts, la pondération, les prompts négatifs et les stratégies par modèle ouvre un monde de possibilités créatives inégalées par les alternatives plus simples.
Continuez à expérimenter, documentez ce qui fonctionne, et n'hésitez pas à explorer les ressources communautaires. La communauté Stable Diffusion est incroyablement active et généreuse en partage de connaissances.