Cos'è la scala CFG a diffusione stabile – Aggiunta dello strumento AI
Stable Diffusion è un generatore di foto AI completamente gratuito e open source. Considerando la sua rapida crescita, ci sono molte impostazioni in questo strumento. Ad esempio, il Scala CFG in diffusione stabile. Ma molte persone ancora non sanno cos'è questa impostazione e come usarla durante la generazione di immagini. Bene, scopri di più sulla scala CFG in Diffusione Stabile leggendo questo post.
Lista guida
Parte 1: Cos'è la scala CFG nella diffusione stabile Parte 2: Come utilizzare la scala CFG in diffusione stabile Parte 3: Confronto di diverse immagini in scala CFG Parte 4: domande frequenti sulla scala CFG nella diffusione stabileParte 1: Cos'è la scala CFG nella diffusione stabile
La scala CFG o Classifier Free Guidance è l'impostazione che contribuisce al risultato più vicino delle richieste di input. Per una spiegazione più elaborata, l'inserimento di un valore di scala CFG maggiore risulterà in una maggiore somiglianza con il prompt, ma sarà distorto in termini di qualità. Nel frattempo, questo può essere fatto diversamente, con una qualità più elevata in cambio.
Il valore della scala CFG predefinito è impostato su 7 per bilanciare la libertà creativa e la direzione. D'altra parte, un valore pari a 1 probabilmente consentirà alla Diffusione Stabile di avere libertà, mentre un valore pari a 15 e superiore avrà delle restrizioni. Sebbene il generatore di immagini AI limiti il CFG da 1 a 30 al massimo, puoi impostare la scala su 999 in Diffusione stabile, sia negativa che positiva, tramite il Terminale.
Potrebbe sembrare un'impostazione semplice, ma il generatore di immagini AI renderà più difficile il controllo con i compromessi derivanti dai vari valori CFG. Ma per utilizzare la bilancia nel modo più efficace, puoi seguire la dimostrazione qui sotto su come utilizzarla su Stable Diffusion.
Parte 2. Come utilizzare la scala CFG in diffusione stabile
In questa dimostrazione puoi iniziare a sperimentare CFG su DreamStudio o Playground. Tuttavia, ci sono più opzioni disponibili per te, come la demo online di Stable Diffusion, l'interfaccia utente Web completa di Stable Diffusion o una configurazione minima su RunPod.io.
Passo 1.Visita DreamStudio, Lexica o Playground AI e iscriviti. Lexica non richiede agli utenti di registrarsi, ma le altre due piattaforme richiedono un account Gmail o Discord. Una volta entrato, inserisci il testo nella casella di richiesta.
Passo 2.Fare clic sul pulsante "Genera" dopo aver seguito le istruzioni. A seconda della piattaforma utilizzata, DreamStudio avrà la scala CFG, mentre Lexica avrà la scala di guida. D'altra parte, puoi trovare una guida rapida su Playground AI nella parte destra dell'interfaccia.
Passaggio 3.Regola il parametro in base alle tue preferenze. Ricordare che tra 7 e 11 i valori hanno solitamente un output più ottimale. Ma dipende comunque dalle tue esigenze, quindi prenditi il tuo tempo con la sperimentazione finché non ottieni il miglior risultato.
Parte 3. Confronto di diverse immagini in scala CFG
Come vedi le differenze per ogni aggiustamento sulla scala CFG? Le modifiche sono visibili nell'output, soprattutto se si passa da un valore piccolo a uno più grande. Anche se utilizzi una sola piattaforma, la differenza si noterà nella distorsione e nella qualità con alcune modifiche. Per dimostrarlo, ecco alcune immagini dalla diffusione stabile e dalla scala CFG:
Il suggerimento utilizzato in questa immagine è Ritratto di Tom Cruise nel Richieste di diffusione stabile di abito rosso, alta qualità, 4K. Viene generato in Diffusione Stabile con valori CFG specifici. Di conseguenza, la somiglianza dell'immagine con la richiesta di input è più visibile.
Ci sono anche alcune cose che puoi vedere per i diversi valori. La saturazione e il contrasto del colore aumentano man mano che viene aggiunto il valore della scala CFG. Ma in un altro punto, appena sopra il valore predefinito, l'immagine in uscita avrà una qualità più sfocata, con conseguente perdita di dettagli.
Se vuoi evitare risultati di bassa qualità, ci sono due cose che puoi fare. Innanzitutto, aumenta i passaggi del campionatore. Ma poiché è lo stesso con CFG, le fasi di campionamento possono comportare tempi di elaborazione più lunghi. Se il primo metodo non ti soddisfa, puoi modificare i campionatori per generare dettagli dell'immagine migliori, anche con un valore maggiore di 7. Ecco altri esempi immagini upscalate a 4K per determinati valori della scala CFG.
Suggerimenti bonus: come ingrandire le immagini CFG a diffusione stabile
Se non vuoi apportare ulteriori modifiche a Stable Diffusion, un altro modo per ottenere foto AI di alta qualità è utilizzare AnyRec AI Image Upscaler. È uno strumento online con la potenza della tecnologia AI, che supporta i formati di immagine più diffusi, come PNG, BMP, JPEG, GIF e altri. Con la sua interfaccia intuitiva, puoi aumentare il livello di ingrandimento di una foto ai valori massimi 2x, 4x, 6x e 8x. Recupererà automaticamente la perdita dettagliata durante il download, inclusi pixel, colori, trame, ecc. Questa è la soluzione per ingrandire le immagini, adatta per la stampa, la progettazione grafica e la condivisione sui social media.
- 100% ingranditore fotografico online gratuito per valori di scala CFG a diffusione stabile di grandi dimensioni.
- Anteprima affiancata dell'originale e dei risultati di output.
- Fornire una funzione di ingrandimento/riduzione integrata per vedere i dettagli dell'output.
- Proteggi la privacy rimuovendo i caricamenti dal server dopo il processo.
Passo 1.Fai clic sul pulsante "Carica foto" e scegli l'immagine dal tuo dispositivo.
Passo 2.Scegli il livello di ingrandimento; controlla i dettagli con la funzione Zoom.
Passaggio 3.Quando sei soddisfatto, fai clic sul pulsante "Salva" per scaricare il risultato finale.
Parte 4: domande frequenti sulla scala CFG nella diffusione stabile
-
1. Quando devo cambiare la scala CFG?
Se desideri che Stable Diffusion generi il prompt al di fuori delle sue conoscenze, potrebbe essere necessario CFG per allineare il prompt al risultato dell'immagine. Naturalmente, quando si aumenta il valore della scala bisogna cercare la qualità.
-
2. Esiste una differenza tra la scala CFG e la forza di denoising?
SÌ. La scala CFG funziona per la vicinanza del prompt al risultato, mentre la forza del denoising è più utile per determinare la creatività dell'intelligenza artificiale dello strumento. Con la perfetta combinazione di questi due, puoi bilanciare la creatività e l'accuratezza dell'immagine.
-
3. Cosa è meglio: un valore CFG più alto o più basso?
Gli utenti trovano più semplice regolare la scala su un valore più alto, poiché produce risultati accurati. Sebbene la qualità non sia buona, puoi trovare un'altra alternativa per aumentare la qualità, come AnyRec AI Image Upscaler.
-
4. Quale versione di diffusione stabile dovrei usare con la bilancia CFG?
Stable Diffusion 2 è migliore del primo, fornendo modelli più profondi, raffinati e riprodotti. Naturalmente, l'utilizzo di CFG con questa versione creerà risultati accurati.
-
5. Quale valore deve essere impostato per CFG?
Il valore migliore da scegliere è compreso tra 7 e 10. Anche se il risultato non è promettente, puoi prenderti il tempo necessario per vedere le immagini generate meglio.
Conclusione
Scala CFG in diffusione stabile viene utilizzato per controllare la vicinanza del risultato dell'immagine al prompt di input. Sebbene piattaforme come DreamStudio, Lexica e Playground AI siano più efficaci nello sperimentare l'impostazione, puoi anche impostare un valore più alto della scala Stable Diffusion CFG e utilizzare AnyRec AI Image Upscaler per ingrandire le dimensioni e recuperare i dettagli con un clic.