O que é escala CFG de difusão estável – adição da ferramenta AI
Stable Diffusion é um gerador de fotos de IA totalmente gratuito e de código aberto. Vendo seu rápido crescimento, existem muitas configurações nesta ferramenta. Por exemplo, o Escala CFG em difusão estável. Mas muita gente ainda não sabe o que é essa configuração e como utilizá-la na geração de imagens. Pois bem, descubra mais sobre a escala CFG em Difusão Estável lendo este post.
Lista de guias
Parte 1: O que é escala CFG em difusão estável Parte 2: Como usar a escala CFG em difusão estável Parte 3: Comparação de diferentes imagens em escala CFG Parte 4: Perguntas frequentes sobre a escala CFG em difusão estávelParte 1: O que é escala CFG em difusão estável
A escala CFG ou Classifier Free Guidance é a configuração que contribui para o resultado mais próximo dos prompts de entrada. Para uma explicação mais elaborada, colocar um valor maior na escala CFG resultará em uma semelhança mais próxima com o prompt, mas terá qualidade distorcida. Entretanto, isso pode ser feito de outra forma, com uma troca de maior qualidade.
O valor padrão da escala CFG é definido como 7 para equilibrar a liberdade criativa e a direção. Por outro lado, um valor de 1 provavelmente permitirá que a Difusão Estável tenha liberdade, enquanto um valor de 15 e acima terá restrições. Embora o gerador de imagem AI limite o CFG de 1 a 30 no máximo, você pode definir a escala em 999 em Difusão Estável, tanto negativa quanto positiva, por meio do Terminal.
Pode parecer uma configuração simples, mas o gerador de imagens de IA tornará mais difícil o controle com as compensações de vários valores de CFG. Mas para usar a escala de forma mais eficaz, você pode seguir a demonstração abaixo sobre como usá-la na Difusão Estável.
Parte 2. Como usar a escala CFG em difusão estável
Nesta demonstração, você pode começar a experimentar CFG no DreamStudio ou Playground. No entanto, existem mais opções disponíveis para você, como a demonstração online do Stable Diffusion, a interface da Web do Stable Diffusion completa ou uma configuração mínima no RunPod.io.
Passo 1.Visite DreamStudio, Lexica ou Playground AI e inscreva-se. Lexica não exige que os usuários se inscrevam, mas as outras duas plataformas exigem uma conta Gmail ou Discord. Depois de entrar, digite o texto na caixa de prompt.
Passo 2.Clique no botão "Gerar" depois de aceitar as instruções. Dependendo da plataforma que você usar, o DreamStudio terá CFG Scale, enquanto o Lexica terá Guidance Scale. Por outro lado, você pode encontrar Orientação imediata sobre Playground AI na parte direita da interface.
Etapa 3.Ajuste o parâmetro de acordo com sua preferência. Lembre-se de que geralmente entre 7 e 11 valores geralmente há uma saída ideal. Mas ainda depende da sua necessidade, então reserve um tempo para experimentar até obter o melhor resultado.
Parte 3. Comparação de diferentes imagens em escala CFG
Como você vê as diferenças para cada ajuste na escala CFG? As alterações são visíveis na saída, especialmente se você estiver saltando de um valor pequeno para um valor maior. Mesmo se você estiver usando apenas uma plataforma, a diferença será notada na distorção e na qualidade com alguns ajustes. Para demonstrar, aqui estão algumas fotos da difusão estável e da escala CFG:
O prompt usado nesta foto é Retrato de Tom Cruise no Prompts de difusão estável de terno vermelho, alta qualidade, 4K. É gerado em difusão estável com valores específicos de CFG. Como resultado, a semelhança da imagem com o prompt de entrada é mais visível.
Existem também algumas coisas que você pode ver para os diferentes valores. A saturação e o contraste da cor aumentam à medida que o valor da escala CFG é adicionado. Mas por outro lado, logo acima do valor padrão colocará a imagem de saída com uma qualidade mais desfocada, resultando em perda de detalhes.
Se quiser evitar resultados de baixa qualidade, há duas coisas que você pode fazer. Primeiro, aumente as etapas do amostrador. Mas como acontece o mesmo com o CFG, as etapas do amostrador podem criar um tempo de processamento mais longo. Se o primeiro método não for um favor para você, você pode alterar os amostradores para gerar melhores detalhes da imagem, mesmo com um valor maior que 7. Aqui estão mais exemplos imagens ampliadas para 4K para determinados valores da escala CFG.
Dicas bônus: como ampliar imagens CFG de difusão estável
Se você não quiser fazer mais ajustes no Stable Diffusion, outra maneira de obter fotos de IA de alta qualidade é usar Upscaler de imagem AnyRec AI. É uma ferramenta online com o poder da tecnologia AI, suportando formatos de imagem populares, como PNG, BMP, JPEG, GIF e muito mais. Com sua interface intuitiva, você pode aumentar o nível de ampliação de uma foto em valores máximos de 2x, 4x, 6x e 8x. Ele recuperará automaticamente a perda detalhada no download, incluindo pixels, cores, texturas, etc. Esta é a solução para ampliar imagens, adequada para impressão, design gráfico e compartilhamento em redes sociais.
- 100% ampliador de fotos on-line gratuito para grande valor de escala de difusão estável CFG.
- Visualização lado a lado do original e dos resultados de saída.
- Fornece uma função integrada de aumentar/diminuir zoom para ver os detalhes da saída.
- Proteja a privacidade removendo uploads do servidor após o processo.
Passo 1.Clique no botão "Carregar foto" e escolha a imagem do seu dispositivo.
Passo 2.Escolha o nível de ampliação; verifique os detalhes com a função Zoom.
Etapa 3.Clique no botão "Salvar" quando estiver satisfeito para baixar o resultado final.
Parte 4: Perguntas frequentes sobre a escala CFG em difusão estável
-
1. Quando preciso alterar a Escala CFG?
Se você deseja que o Stable Diffusion gere o prompt fora de seu conhecimento, talvez seja necessário que o CFG alinhe o prompt ao resultado da imagem. Claro, é preciso buscar qualidade na hora de aumentar o valor da escala.
-
2. Existe uma diferença entre a escala CFG e a resistência à remoção de ruído?
Sim. A escala CFG funciona para a proximidade do prompt com o resultado, enquanto a força de remoção de ruído é mais para determinar a criatividade de IA da ferramenta. Com a combinação perfeita dos dois, você pode equilibrar a criatividade e a precisão da imagem.
-
3. O que é melhor: um valor maior ou menor em CFG?
Os usuários acham mais fácil ajustar a escala para um valor mais alto, pois produz resultados precisos. Embora a qualidade não seja boa, você pode encontrar outra alternativa para aumentar a qualidade, como AnyRec AI Image Upscaler.
-
4. Qual versão de Difusão Estável devo usar com a escala CFG?
Stable Diffusion 2 é melhor que o primeiro, fornecendo modelos mais profundos, sofisticados e com pintura interna. É claro que usar CFG com esta versão criará resultados precisos.
-
5. Qual valor deve ser definido para CFG?
O melhor valor para escolher é entre 7 e 10. Embora o resultado não seja promissor, você pode reservar um tempo para ver as fotos mais bem geradas.
Conclusão
Escala CFG em difusão estável é usado para controlar a proximidade do resultado da imagem com o prompt de entrada. Embora plataformas como DreamStudio, Lexica e Playground AI sejam mais eficazes na experimentação da configuração, você também pode definir o valor mais alto da escala Stable Diffusion CFG e usar AnyRec AI Image Upscaler para aumentar o tamanho e recuperar os detalhes com um clique.