Dominando Prompts do Stable Diffusion
O Stable Diffusion oferece controle incomparável sobre a geração de imagens com IA — se você souber como usá-lo. Diferente de interfaces mais simples, o Stable Diffusion recompensa o conhecimento técnico com resultados precisamente personalizados. Este guia cobre técnicas avançadas de prompting que vão elevar suas criações no Stable Diffusion.
Seja usando a web UI do AUTOMATIC1111, ComfyUI ou outra interface, essas técnicas se aplicam amplamente. Vamos cobrir sintaxe de prompts, ponderação, prompts negativos, estratégias específicas por modelo e fluxos de trabalho avançados.
Entendendo a Sintaxe de Prompts
O Stable Diffusion interpreta prompts de forma diferente de IA de linguagem natural. Entender sua sintaxe é crucial:
Estrutura Básica: Prompts são processados como conceitos separados por vírgula. Cada conceito é interpretado individualmente e depois combinado. "a red car, sunset, beach" processa três elementos distintos.
A Ordem das Palavras Importa: Tokens anteriores geralmente recebem mais atenção. Coloque seus conceitos mais importantes primeiro.
Parênteses para Ênfase: (word) aumenta a atenção em 1.1x. ((word)) aumenta em 1.21x (1.1²). Você pode aninhar até 3-4 níveis antes de retornos decrescentes.
Colchetes para Reduzir Ênfase: [word] diminui a atenção em 0.9x. [[word]] diminui em 0.81x. Útil para elementos sutis de fundo.
Pesos Explícitos: (word:1.5) define o peso exato de atenção. Normalmente use o intervalo 0.5-1.5. Ir além de 2.0 frequentemente causa artefatos.
| Syntax | Effect | Multiplier | Example |
|---|---|---|---|
| (word) | Increase attention | 1.1x | (beautiful landscape) |
| ((word)) | Strong increase | 1.21x | ((detailed eyes)) |
| (word:1.5) | Explicit weight | 1.5x | (golden hour:1.5) |
| [word] | Decrease attention | 0.9x | [background trees] |
| [word:0.5] | Explicit reduction | 0.5x | [clouds:0.5] |
| [word1:word2:0.5] | Prompt switching | At 50% of steps | [cat:dog:0.5] blends concepts |
Recommended Sampler Settings
For photorealism: DPM++ 2M Karras, 25-30 steps, CFG 7-8
For artistic/stylized: Euler a, 20-25 steps, CFG 7-9
For speed: DPM++ SDE Karras, 15-20 steps, CFG 7
For maximum detail: DPM++ 2M Karras, 40-50 steps, CFG 7-8, with Hires. fix
Dominando Prompts Negativos
Prompts negativos são onde o Stable Diffusion realmente brilha. Eles dizem ao modelo o que evitar, melhorando dramaticamente a qualidade.
Base Essencial de Prompt Negativo: Comece com negativos baseados em qualidade: "blurry, low quality, lowres, bad anatomy, bad hands, cropped, worst quality, low quality, normal quality, jpeg artifacts, watermark, text, signature"
Negativos Específicos de Estilo: Adicione negativos com base no seu estilo alvo:
Para fotorrealismo: "cartoon, anime, illustration, painting, drawing, art, sketch"
Para anime/ilustração: "photorealistic, photograph, 3d, 3d render, realistic"
Para imagens limpas: "busy background, cluttered, noisy, grainy"
Negativos de Anatomia: "bad anatomy, bad hands, missing fingers, extra fingers, extra limbs, missing limbs, fused fingers, too many fingers, mutated hands, malformed limbs, extra arms, extra legs"
Negativos de Rosto: "deformed face, ugly face, asymmetric eyes, bad eyes, cross-eyed, blurry face"
Ponderação Avançada de Prompts
Ponderação estratégica cria resultados nuançados:
Ênfase no Assunto: Dê ao seu assunto principal peso maior do que elementos de fundo. "(beautiful woman:1.3), garden background, soft lighting" foca a atenção no assunto.
Balanceamento de Estilo: Ao combinar estilos, pondere-os: "portrait, (oil painting:0.8), (impressionist:0.6)" cria uma mistura sutil de estilos.
Controle de Detalhes: Pondere palavras-chave de detalhes: "landscape, mountains, (intricate details:1.2), (8k:1.1)" sem exagerar.
Mesclagem de Prompts: Use a sintaxe [de:para:quando] para transições: "[day:night:0.5]" faz a transição do dia para a noite no passo 50%.
Estratégias Específicas por Modelo
Diferentes modelos do Stable Diffusion respondem a diferentes abordagens:
SDXL: Lida melhor com linguagem natural do que o SD 1.5. Pode usar prompts mais longos e descritivos. Se beneficia de descrições detalhadas de cena. Resolução recomendada: 1024x1024 ou similar.
Modelos SD 1.5: Preferem prompts no estilo de palavras-chave. Prompts mais curtos e focados funcionam melhor. Muitos são treinados em estilos específicos — use suas trigger words. Resolução comum: 512x512.
Modelos Realistas (como Realistic Vision): Se beneficiam de termos de fotografia: "DSLR, 85mm, f/1.8, bokeh". Inclua descrições de iluminação: "studio lighting, natural light, rim light". Faça referência a configurações de câmera para autenticidade.
Modelos de Anime: Use tags de qualidade específicas de anime: "masterpiece, best quality, highly detailed". Inclua referências de estilo artístico: "by (nome do artista)". Palavras-chave de descrição de personagem importam mais que linguagem natural.
Controle de Composição e Layout
Guie a composição da imagem através de prompts:
Palavras-Chave de Perspectiva: "wide shot, close-up, medium shot, bird's eye view, worm's eye view, Dutch angle, straight-on, profile view"
Enquadramento: "centered, rule of thirds, symmetrical, asymmetrical, full body, portrait, headshot"
Relações Espaciais: Seja explícito sobre posicionamento: "woman standing in foreground, mountains in background, river between them"
Considerações de Proporção: Combine seu prompt com a proporção de saída. Retratos funcionam melhor em proporções verticais; paisagens em horizontais.
Palavras-Chave de Melhoria de Qualidade
Estas palavras-chave melhoram consistentemente os resultados:
Qualidade Geral: "masterpiece, best quality, highly detailed, sharp focus, professional, high resolution, 8k, 4k"
Iluminação: "beautiful lighting, dramatic lighting, soft lighting, volumetric lighting, cinematic lighting, golden hour, rim light"
Renderização: "detailed, intricate, elaborate, highly detailed, fine details, sharp, crisp"
Qualidade Artística: "award-winning, trending on artstation, artstation quality, deviantart quality"
Nota: A eficácia varia por modelo. Teste o que funciona para seu checkpoint específico.
Técnicas Avançadas de Fluxo de Trabalho
Suba de nível com estas abordagens avançadas:
Refinamento Progressivo: Gere com menos steps/resolução primeiro para iterar rapidamente. Quando encontrar uma boa composição, regere em qualidade mais alta.
Manipulação de Seed: Trave seeds para manter a composição enquanto ajusta prompts. Use seed+1, seed+2 para encontrar variações semelhantes mas diferentes.
Agendamento de Prompts: Mude prompts durante a geração: "[detailed background:simple background:0.6]" começa detalhado e muda para simples.
Wildcards: Use sintaxe de wildcards para variedade: "a __color__ __animal__ in a __setting__" puxa de listas predefinidas.
Integração com ControlNet: Combine prompts de texto com ControlNet para controle preciso sobre pose, composição e estilo enquanto mantém a influência do prompt.
Solucionando Problemas Comuns
Supersaturação/Artefatos: Reduza os pesos de ênfase. Diminua o CFG scale. Adicione negativos de qualidade.
Ignorando Partes do Prompt: Aumente o peso dos conceitos ignorados. Mova elementos importantes para o início. Simplifique o prompt — muitos conceitos diluem a atenção.
Estilos Inconsistentes: Use palavras-chave de estilo mais específicas. Tente modelos diferentes mais adequados ao seu estilo alvo. Aumente os pesos relacionados ao estilo.
Anatomia Ruim: Adicione negativos abrangentes de anatomia. Tente modelos diferentes. Use ControlNet para guiar a pose. Gere em resoluções mais altas.
Conclusão
A complexidade do Stable Diffusion é sua força — dominar estas técnicas dá a você controle criativo incomparável em comparação com plataformas mais simples. Comece pelo básico, incorpore gradualmente técnicas avançadas e sempre experimente.
Lembre-se de que diferentes modelos respondem de formas diferentes. O que funciona para um checkpoint pode precisar de ajuste para outro. Construa sua biblioteca pessoal de prompts eficazes para seus modelos preferidos e continue refinando sua abordagem à medida que aprende o que funciona.
A comunidade do Stable Diffusion está constantemente descobrindo novas técnicas. Mantenha-se engajado com fóruns, servidores do Discord e repositórios do GitHub para manter suas habilidades atualizadas. Boas gerações!