Co to jest skala CFG stabilnej dyfuzji – dodatek do narzędzia AI
Stable Diffusion to generator zdjęć AI, który jest całkowicie darmowy i ma otwarte oprogramowanie. Widząc jego szybki rozwój, istnieje wiele ustawień w tym narzędziu. Na przykład Skala CFG w stabilnej dyfuzji. Jednak wiele osób nadal nie wie, czym jest to ustawienie i jak go używać podczas generowania obrazów. Cóż, dowiedz się więcej o skali CFG w Stable Diffusion czytając ten post.
Lista przewodników
Część 1: Co to jest skala CFG w stabilnej dyfuzji Część 2: Jak używać skali CFG w stabilnej dyfuzji Część 3: Porównanie obrazów w różnych skalach CFG Część 4: Często zadawane pytania dotyczące skali CFG w stabilnej dyfuzjiCzęść 1: Co to jest skala CFG w stabilnej dyfuzji
Skala CFG lub Classifier Free Guidance to ustawienie, które ma wpływ na najbliższy wynik monitów wejściowych. Aby uzyskać bardziej szczegółowe wyjaśnienie, ustawienie większej wartości skali CFG spowoduje większe podobieństwo do podpowiedzi, ale będzie zniekształcone pod względem jakości. Tymczasem można to zrobić inaczej, w zamian za wyższą jakość.
Domyślna wartość skali CFG jest ustawiona na 7, aby zrównoważyć swobodę twórczą i kierunek. Z drugiej strony, wartość 1 prawdopodobnie pozwoli Stable Diffusion na swobodę, podczas gdy wartość 15 i wyższa będzie miała ograniczenia. Chociaż generator obrazu AI ogranicza CFG maksymalnie od 1 do 30, możesz ustawić skalę na 999 w stabilnym rozproszeniu, zarówno ujemną, jak i pozytywną, za pośrednictwem terminala.
Może to wydawać się prostym ustawieniem, ale generator obrazu AI utrudni kontrolę dzięki kompromisom z różnych wartości CFG. Aby jednak najskuteczniej wykorzystać skalę, możesz skorzystać z poniższej demonstracji, jak używać jej w trybie Stable Diffusion.
Część 2. Jak używać skali CFG w stabilnej dyfuzji
W tej demonstracji możesz rozpocząć eksperymenty z CFG w DreamStudio lub Playground. Dostępnych jest jednak więcej opcji, takich jak wersja demonstracyjna online Stable Diffusion, pełny interfejs sieciowy Stable Diffusion lub minimalna konfiguracja na RunPod.io.
Krok 1.Odwiedź DreamStudio, Lexica lub Playground AI i zarejestruj się. Lexica nie wymaga od użytkowników rejestracji, ale pozostałe dwie platformy wymagają konta Gmail lub Discord. Po wejściu wprowadź tekst w polu zachęty.
Krok 2.Po zapoznaniu się z monitami kliknij przycisk „Generuj”. W zależności od platformy, z której korzystasz, DreamStudio będzie miało skalę CFG, a Lexica - skalę nawigacji. Z drugiej strony, w prawej części interfejsu znajdziesz podpowiedzi dotyczące sztucznej inteligencji na placu zabaw.
Krok 3.Dostosuj parametr według własnych upodobań. Pamiętaj, że zwykle bardziej optymalne wyniki dają wartości od 7 do 11. Ale to nadal zależy od Twoich wymagań, więc nie spiesz się z eksperymentami, aż uzyskasz najlepszy wynik.
Część 3. Porównanie obrazów w różnych skalach CFG
Jak widzisz różnice dla każdej korekty na skali CFG? Zmiany są widoczne na wyjściu, zwłaszcza jeśli przeskakujesz z małej wartości do większej. Nawet jeśli używasz tylko jednej platformy, różnica będzie widoczna w zniekształceniach i jakości po kilku poprawkach. Aby to zademonstrować, oto kilka zdjęć ze skali stabilnej dyfuzji i CFG:
Podpowiedź użyta na tym obrazku to Portret Toma Cruise'a w Monity o stabilnym rozproszeniu czerwonego koloru, wysoka jakość, 4K. Jest generowany w trybie stabilnej dyfuzji z określonymi wartościami CFG. Dzięki temu podobieństwo obrazu do monitu wejściowego jest bardziej widoczne.
Istnieje również kilka rzeczy, które można zobaczyć dla różnych wartości. Nasycenie kolorów i kontrast zwiększają się w miarę dodawania wartości skali CFG. Ale z drugiej strony, tuż powyżej wartości domyślnej jakość obrazu wyjściowego będzie bardziej rozmazana, co spowoduje utratę szczegółów.
Jeśli chcesz uniknąć wyników niskiej jakości, możesz zrobić dwie rzeczy. Najpierw zwiększ liczbę kroków próbnika. Ponieważ jednak w przypadku CFG jest tak samo, kroki próbnika mogą wydłużyć czas przetwarzania. Jeśli pierwsza metoda nie jest dla Ciebie korzystna, możesz zmienić próbniki, aby generować lepsze szczegóły obrazu, nawet przy wartości większej niż 7. Tutaj jest więcej próbek obrazy przeskalowane do rozdzielczości 4K dla niektórych wartości skali CFG.
Dodatkowe wskazówki: jak powiększyć obrazy CFG o stabilnym rozproszeniu
Jeśli nie chcesz wprowadzać więcej poprawek w Stable Diffusion, innym sposobem na uzyskanie wysokiej jakości zdjęć AI jest użycie Narzędzie do skalowania obrazu AnyRec AI. Jest to narzędzie internetowe wykorzystujące technologię AI, obsługujące popularne formaty obrazów, takie jak PNG, BMP, JPEG, GIF i inne. Dzięki intuicyjnemu interfejsowi możesz zwiększyć poziom powiększenia zdjęcia do maksymalnych wartości 2x, 4x, 6x i 8x. Automatycznie odtworzy szczegółowe straty podczas pobierania, w tym piksele, kolory, tekstury itp. Jest to rozwiązanie do powiększania zdjęć, odpowiednie do drukowania, projektowania graficznego i udostępniania w mediach społecznościowych.
- 100% — darmowy powiększalnik zdjęć online, pozwalający uzyskać dużą wartość w skali CFG stabilnej dyfuzji.
- Podgląd oryginału i wyników wyjściowych obok siebie.
- Zapewnij wbudowaną funkcję powiększania/pomniejszania, aby zobaczyć szczegóły wyjściowe.
- Chroń prywatność, usuwając przesłane pliki z serwera po zakończeniu procesu.
Krok 1.Kliknij przycisk „Prześlij zdjęcie” i wybierz zdjęcie ze swojego urządzenia.
Krok 2.Wybierz poziom powiększenia; sprawdź szczegóły dzięki funkcji Zoom.
Krok 3.Po zakończeniu kliknij przycisk „Zapisz”, aby pobrać wynik końcowy.
Część 4: Często zadawane pytania dotyczące skali CFG w stabilnej dyfuzji
-
1. Kiedy muszę zmienić skalę CFG?
Jeśli chcesz, aby Stable Diffusion wygenerowało podpowiedź poza jej wiedzą, możesz potrzebować CFG, aby dopasować podpowiedź do wyniku obrazu. Oczywiście przy zwiększaniu wartości skali trzeba szukać jakości.
-
2. Czy istnieje różnica pomiędzy skalą CFG a siłą odszumiania?
Tak. Skala CFG służy do zbliżenia podpowiedzi do wyniku, podczas gdy siła odszumiania służy raczej określeniu kreatywności narzędzia AI. Dzięki idealnemu połączeniu tych dwóch elementów można zrównoważyć kreatywność i dokładność obrazu.
-
3. Co jest lepsze: wyższa czy niższa wartość w CFG?
Użytkownicy uważają, że ustawienie skali na wyższą wartość jest łatwiejsze, ponieważ zapewnia dokładne wyniki. Chociaż jakość nie jest dobra, możesz znaleźć inną alternatywę, aby zwiększyć jakość, taką jak AnyRec AI Image Upscaler.
-
4. Jakiej wersji Stable Diffusion powinienem używać ze skalą CFG?
Stable Diffusion 2 jest lepsza od pierwszej, zapewniając większą głębię, ekskluzywność i możliwość malowania modeli. Oczywiście użycie CFG w tej wersji zapewni dokładne wyniki.
-
5. Jaką wartość należy ustawić dla CFG?
Najlepsza wartość do wyboru to od 7 do 10. Chociaż wynik nie jest obiecujący, możesz poświęcić trochę czasu na obejrzenie najlepiej wygenerowanych zdjęć.
Wniosek
Skala CFG w stabilnej dyfuzji służy do kontrolowania bliskości wyniku obrazu do monitu wejściowego. Chociaż platformy takie jak DreamStudio, Lexica i Playground AI są bardziej skuteczne w eksperymentowaniu z ustawieniami, możesz także ustawić wyższą wartość skali Stable Diffusion CFG i użyć narzędzia AnyRec AI Image Upscaler, aby powiększyć rozmiar i odzyskać szczegóły jednym kliknięciem.