Ce este Stable Diffusion CFG Scale – Adăugarea instrumentului AI

Liam Miller
aug. 03, 2023 / Actualizat de Liam Miller la Instrumente AI

Stable Diffusion este un generator de fotografii AI care este complet gratuit și open source. Văzând creșterea sa rapidă, există multe setări în acest instrument. De exemplu, cel Scala CFG în difuzie stabilă. Dar mulți oameni încă nu știu ce este această setare și cum să o folosească atunci când generează imagini. Ei bine, aflați mai multe despre scala CFG în Stable Diffusion citind această postare.

Partea 1: Ce este scala CFG în difuzie stabilă

Scala CFG sau Clasifier Free Guidance este setarea care contribuie la cel mai apropiat rezultat al solicitărilor de intrare. Pentru o explicație mai elaborată, punerea unei valori mai mari a scalei CFG va avea ca rezultat o asemănare mai strânsă cu promptul, dar va fi distorsionată în calitate. Între timp, acest lucru se poate face și altfel, cu o calitate mai mare în schimb.

Valoarea implicită a scării CFG este setată la 7 pentru a echilibra libertatea creativă și direcția. Pe de altă parte, o valoare de 1 va permite probabil ca Stable Diffusion să aibă libertate, în timp ce o valoare de 15 și mai mult va avea restricții. Deși generatorul de imagini AI limitează CFG de la 1 la 30 la maximum, puteți seta scara la 999 în Stable Diffusion, atât negativ, cât și pozitiv, prin intermediul terminalului.

Poate suna ca o setare simplă, dar generatorul de imagini AI va face mai greu de controlat cu compromisurile de la diferite valori CFG. Dar pentru a utiliza scala cel mai eficient, puteți urma demonstrația de mai jos despre cum să o utilizați pe Stable Diffusion.

Partea 2. Cum să utilizați scala CFG în difuzie stabilă

În această demonstrație, puteți începe să experimentați cu CFG pe DreamStudio sau Playground. Cu toate acestea, există mai multe opțiuni disponibile pentru dvs., cum ar fi Stable Diffusion Online Demo, Stable Diffusion Web UI completă sau o configurare minimă pe RunPod.io.

Pasul 1.Vizitați DreamStudio, Lexica sau Playground AI și înscrieți-vă. Lexica nu necesită înscrierea utilizatorilor, dar celelalte două platforme necesită un cont Gmail sau Discord. Odată ce intrați, introduceți textul în caseta de prompt.

Pasul 2.Faceți clic pe butonul „Generați” după ce v-ați stabilit cu solicitările. În funcție de platforma pe care o utilizați, DreamStudio va avea CFG Scale, în timp ce Lexica are Guidance Scale. Pe de altă parte, puteți găsi Prompt Guidance on Playground AI în partea dreaptă a interfeței.

Cum să scalați CFG

Pasul 3.Reglați parametrul după cum doriți. Amintiți-vă că între 7 și 11 valori au o ieșire mai optimă de obicei. Dar încă depinde de cerințele tale, așa că fă-ți timp cu experimentarea până când obții cel mai bun rezultat.

Cum să CFG Prompt Ghid

Partea 3. Compararea diferitelor imagini la scară CFG

Cum vedeți diferențele pentru fiecare ajustare pe scara CFG? Modificările sunt vizibile pentru ieșire, mai ales dacă treceți de la o valoare mică la una mai mare. Chiar dacă utilizați o singură platformă, diferența va spune distorsiunea și calitatea cu câteva modificări. Pentru a demonstra, iată câteva imagini de la Stable Diffusion și CFG scale:

Diferența de scară CFG

Promptul folosit în această imagine este Portretul lui Tom Cruise în Solicitări de difuzie stabilă de costum roșu, de înaltă calitate, 4K. Este generat în Difuziune stabilă cu valori CFG specifice. Ca rezultat, asemănarea imaginii cu promptul de intrare este mai vizibilă.

Există, de asemenea, câteva lucruri pe care le puteți vedea pentru diferitele valori. Saturația culorii și contrastul sunt crescute pe măsură ce se adaugă valoarea scării CFG. Dar, într-un alt punct, chiar deasupra valorii implicite va aduce imaginea de ieșire la o calitate mai neclară, ducând la pierderea detaliilor.

Dacă doriți să evitați rezultate de calitate scăzută, există două lucruri pe care le puteți face. Mai întâi, creșteți pașii de eșantionare. Dar, deoarece este același cu CFG, pașii de eșantionare pot crea timp de procesare mai lung. Dacă prima metodă nu este o favoare pentru dvs., puteți schimba eșantionarele pentru a genera detalii de imagine mai bune, chiar și la o valoare mai mare de 7. Iată mai multe mostre. imagini upscalate la 4K pentru anumite valori ale scalei CFG.

Imagini CFG

Sfaturi bonus: Cum să măriți imaginile CFG cu difuzie stabilă

Dacă nu doriți să faceți mai multe modificări pe Stable Diffusion, atunci o altă modalitate de a avea fotografii AI de înaltă calitate este să utilizați AnyRec AI Image Upscaler. Este un instrument online cu puterea tehnologiei AI, care acceptă formate de imagine populare, cum ar fi PNG, BMP, JPEG, GIF și multe altele. Cu interfața sa intuitivă, puteți crește nivelul de mărire al unei fotografii la valori maxime de 2x, 4x, 6x și 8x. Acesta va recupera automat pierderile detaliate la descărcare, inclusiv pixeli, culori, texturi etc. Aceasta este soluția pentru mărirea imaginilor, potrivită pentru imprimare, proiectare grafică și partajare pe rețelele sociale.

Pasul 1.Faceți clic pe butonul „Încărcați fotografie” și alegeți fotografia de pe dispozitiv.

AnyRec Încărcare fotografie

Pasul 2.Alegeți nivelul de mărire; verificați detaliile cu funcția Zoom.

Mărire AnyRec

Pasul 3.Faceți clic pe butonul „Salvați” când sunteți mulțumit pentru a descărca rezultatul final.

AnyRec Salvare imagine nouă

Partea 4: Întrebări frecvente despre Scala CFG în difuzie stabilă

Concluzie

Scala CFG în difuzie stabilă este utilizat pentru a controla apropierea rezultatului imaginii de promptul de intrare. În timp ce platforme precum DreamStudio, Lexica și Playground AI sunt mai eficiente în experimentarea setărilor, puteți, de asemenea, să setați o valoare mai mare a scalei Stable Diffusion CFG și să utilizați AnyRec AI Image Upscaler pentru a mări dimensiunea și a recupera detaliile cu un singur clic.

Articole similare: