Mi az a stabil diffúziós CFG skála – az AI eszköz kiegészítése
A Stable Diffusion egy mesterséges intelligencia fotógenerátor, amely teljesen ingyenes és nyílt forráskódú. Gyors növekedését látva ebben az eszközben számos beállítás található. Például a CFG skála stabil diffúzióban. Sokan azonban még mindig nem tudják, mi ez a beállítás, és hogyan kell használni a képek generálásakor. Nos, tudjon meg többet a CFG skáláról a stabil diffúzióban, ha elolvassa ezt a bejegyzést.
Útmutató lista
1. rész: Mi a CFG skála a stabil diffúzióban 2. rész: A CFG-skála használata stabil diffúzióban 3. rész: Különböző CFG léptékű képek összehasonlítása 4. rész: GYIK a CFG-skáláról a stabil diffúzióban1. rész: Mi a CFG skála a stabil diffúzióban
A CFG vagy Classifier Free Guidance skála az a beállítás, amely hozzájárul a beviteli promptok legközelebbi eredményéhez. A részletesebb magyarázat érdekében, ha nagyobb CFG skálaértéket ad meg, akkor a prompthoz való hasonlóság jobban hasonlít, de minősége torz lesz. Közben ezt meg lehet csinálni másként is, cserébe magasabb minőséggel.
Az alapértelmezett CFG skála értéke 7, hogy egyensúlyba kerüljön a kreatív szabadság és az irány. Másrészt az 1-es érték valószínűleg lehetővé teszi a Stable Diffusion számára a szabadságot, míg a 15-ös és afölötti érték korlátozásokat tartalmaz. Bár az AI képgenerátor maximum 1-től 30-ig korlátozza a CFG-t, a terminálon keresztül beállíthatja a skálát 999-re a stabil diffúzióban, negatív és pozitív egyaránt.
Lehet, hogy egyszerű beállításnak hangzik, de az AI képgenerátor megnehezíti a szabályozást a különféle CFG értékek kompromisszumaival. De a mérleg leghatékonyabb használatához kövesse az alábbi bemutatót a Stable Diffusion használatáról.
2. rész: A CFG-skála használata stabil diffúzióban
Ebben a bemutatóban elkezdheti a kísérletezést a CFG-vel a DreamStudio vagy a Playground alkalmazásban. Azonban több lehetőség is elérhető az Ön számára, például a Stable Diffusion Online Demo, a teljes Stable Diffusion webes felhasználói felület vagy egy minimális beállítás a RunPod.io webhelyen.
1. lépés.Látogassa meg a DreamStudiót, a Lexicát vagy a Playground AI-t, és regisztráljon. A Lexica nem követeli meg a felhasználók regisztrációját, de a másik két platformhoz Gmail vagy Discord fiók szükséges. Miután belépett, írja be a szöveget a prompt mezőbe.
2. lépés.Kattintson a "Létrehozás" gombra, miután elszámolt az utasításokkal. A használt platformtól függően a DreamStudio rendelkezik CFG-skálával, míg a Lexica-ban Guidance Scale. Másrészt a felület jobb oldalán találja a Prompt Guidance on Playground AI-t.
3. lépésÁllítsa be a paramétert ízlése szerint. Ne feledje, hogy a 7 és 11 közötti érték általában optimálisabb kimenettel rendelkezik. De ez továbbra is az Ön igényeitől függ, ezért szánjon időt a kísérletezésre, amíg el nem éri a legjobb eredményt.
3. rész. Különböző CFG léptékű képek összehasonlítása
Hogyan látja a különbségeket a CFG skála minden beállításánál? A változások láthatóak a kimeneten, különösen, ha kis értékről nagyobbra ugrik. Még ha csak egy platformot használ is, a különbség néhány módosítással megmutatja a torzítást és a minőséget. Ennek bemutatására itt van néhány kép a Stable Diffusion és a CFG skáláról:
A képen használt felszólítás: Tom Cruise portréja Stabil diffúziós üzenetek piros öltöny, kiváló minőségű, 4K. Stabil diffúzióban jön létre, meghatározott CFG értékekkel. Ennek eredményeként jobban látható a kép hasonlósága a beviteli prompthoz.
Van néhány dolog, amit a különböző értékeknél láthat. A színtelítettség és a kontraszt a CFG skálaérték hozzáadásával nő. De egy másik ponton, közvetlenül az alapértelmezett érték felett, a kimeneti kép minősége homályosabb lesz, ami részletveszteséget eredményez.
Ha el szeretné kerülni az alacsony minőségű eredményeket, két dolgot tehet. Először növelje a mintavevő lépéseit. De mivel ugyanez a helyzet a CFG-vel, a mintavevő lépései hosszabb feldolgozási időt eredményezhetnek. Ha az első módszer nem kedvez Önnek, módosíthatja a mintavevőket, hogy jobb képrészleteket generáljanak, akár 7-nél nagyobb értéknél is. Íme további minták képek 4K-ra felskálázva bizonyos CFG skálaértékekhez.
Bónusz tippek: Stabil diffúziós CFG képek nagyítása
Ha nem szeretnél többet módosítani a Stable Diffusion-on, akkor a jó minőségű mesterséges intelligencia fotók másik módja a AnyRec AI Image Upscaler. Ez egy online eszköz az AI technológia erejével, és támogatja a népszerű képformátumokat, mint például a PNG, BMP, JPEG, GIF stb. Intuitív kezelőfelületével a fénykép nagyítási szintjét 2x, 4x, 6x és 8x maximális értékre növelheti. Automatikusan helyreállítja a letöltés során fellépő részletes veszteséget, beleértve a képpontokat, színeket, textúrákat stb. Ez a megoldás a képek nagyítására, alkalmas nyomtatásra, grafikai tervezésre és közösségi média megosztásra.
- 100% ingyenes online fotónagyító a nagy stabil diffúziós CFG skálaértékhez.
- Az eredeti és a kimeneti eredmények egymás melletti előnézete.
- A kimenet részleteinek megtekintéséhez biztosítson beépített nagyítási/kicsinyítési funkciót.
- Védje meg a magánéletet azáltal, hogy a folyamat után eltávolítja a feltöltéseket a szerverről.
1. lépés.Kattintson a "Fénykép feltöltése" gombra, és válassza ki a képet az eszközéről.
2. lépés.Válassza ki a nagyítási szintet; ellenőrizze a részleteket a Zoom funkcióval.
3. lépésHa elégedett, kattintson a "Mentés" gombra a végeredmény letöltéséhez.
4. rész: GYIK a CFG-skáláról a stabil diffúzióban
-
1. Mikor kell megváltoztatnom a CFG-skálát?
Ha azt szeretné, hogy a Stable Diffusion a tudásán kívül generálja a promptot, akkor szükség lehet a CFG-re, hogy a promptot a kép eredményéhez igazítsa. Természetesen a skálaérték növelésekor a minőséget kell keresni.
-
2. Van-e különbség a CFG skála és a zajtalanító erősség között?
Igen. A CFG skála a prompt eredményhez való közelségére szolgál, míg a zajcsillapítás erőssége inkább az eszköz mesterséges intelligenciájának meghatározására szolgál. A kettő tökéletes keverékével egyensúlyba hozhatja a kép kreativitását és pontosságát.
-
3. Mi a jobb: magasabb vagy alacsonyabb érték a CFG-ben?
A felhasználók könnyebbnek találják a skála magasabb értékre állítását, mivel az pontos eredményeket ad. Bár a minőség nem jó, találhat más alternatívát a minőség növelésére, például az AnyRec AI Image Upscaler-t.
-
4. Melyik Stable Diffusion verziót használjam a CFG skálával?
A Stable Diffusion 2 jobb, mint az első, nagyobb mélységet, előkelő és festett modelleket biztosít. Természetesen a CFG használata ezzel a verzióval pontos eredményeket hoz.
-
5. Melyik értéket kell beállítani a CFG-hez?
A legjobb érték a 7 és 10 közötti választás. Bár az eredmény nem kecsegtető, szánja rá az időt a legjobban generált képek megtekintésére.
Következtetés
CFG skála stabil diffúzióban a kép eredményének a beviteli prompthoz való közelségének szabályozására szolgál. Míg az olyan platformok, mint a DreamStudio, a Lexica és a Playground AI hatékonyabban kísérleteznek a beállítással, a Stable Diffusion CFG skála magasabb értékét is beállíthatja, és az AnyRec AI Image Upscaler segítségével egy kattintással nagyíthatja a méretet, és visszaállíthatja a részleteket.