Co to jest skala CFG stabilnej dyfuzji – dodatek do narzędzia AI

Liama Millera
sie 03, 2023 / Zaktualizował: Liama Millera do Narzędzia sztucznej inteligencji

Stable Diffusion to generator zdjęć AI, który jest całkowicie darmowy i ma otwarte oprogramowanie. Widząc jego szybki rozwój, istnieje wiele ustawień w tym narzędziu. Na przykład Skala CFG w stabilnej dyfuzji. Jednak wiele osób nadal nie wie, czym jest to ustawienie i jak go używać podczas generowania obrazów. Cóż, dowiedz się więcej o skali CFG w Stable Diffusion czytając ten post.

Część 1: Co to jest skala CFG w stabilnej dyfuzji

Skala CFG lub Classifier Free Guidance to ustawienie, które ma wpływ na najbliższy wynik monitów wejściowych. Aby uzyskać bardziej szczegółowe wyjaśnienie, ustawienie większej wartości skali CFG spowoduje większe podobieństwo do podpowiedzi, ale będzie zniekształcone pod względem jakości. Tymczasem można to zrobić inaczej, w zamian za wyższą jakość.

Domyślna wartość skali CFG jest ustawiona na 7, aby zrównoważyć swobodę twórczą i kierunek. Z drugiej strony, wartość 1 prawdopodobnie pozwoli Stable Diffusion na swobodę, podczas gdy wartość 15 i wyższa będzie miała ograniczenia. Chociaż generator obrazu AI ogranicza CFG maksymalnie od 1 do 30, możesz ustawić skalę na 999 w stabilnym rozproszeniu, zarówno ujemną, jak i pozytywną, za pośrednictwem terminala.

Może to wydawać się prostym ustawieniem, ale generator obrazu AI utrudni kontrolę dzięki kompromisom z różnych wartości CFG. Aby jednak najskuteczniej wykorzystać skalę, możesz skorzystać z poniższej demonstracji, jak używać jej w trybie Stable Diffusion.

Część 2. Jak używać skali CFG w stabilnej dyfuzji

W tej demonstracji możesz rozpocząć eksperymenty z CFG w DreamStudio lub Playground. Dostępnych jest jednak więcej opcji, takich jak wersja demonstracyjna online Stable Diffusion, pełny interfejs sieciowy Stable Diffusion lub minimalna konfiguracja na RunPod.io.

Krok 1.Odwiedź DreamStudio, Lexica lub Playground AI i zarejestruj się. Lexica nie wymaga od użytkowników rejestracji, ale pozostałe dwie platformy wymagają konta Gmail lub Discord. Po wejściu wprowadź tekst w polu zachęty.

Krok 2.Po zapoznaniu się z monitami kliknij przycisk „Generuj”. W zależności od platformy, z której korzystasz, DreamStudio będzie miało skalę CFG, a Lexica - skalę nawigacji. Z drugiej strony, w prawej części interfejsu znajdziesz podpowiedzi dotyczące sztucznej inteligencji na placu zabaw.

Jak skalować CFG

Krok 3.Dostosuj parametr według własnych upodobań. Pamiętaj, że zwykle bardziej optymalne wyniki dają wartości od 7 do 11. Ale to nadal zależy od Twoich wymagań, więc nie spiesz się z eksperymentami, aż uzyskasz najlepszy wynik.

Jak uzyskać natychmiastowe wskazówki dotyczące CFG

Część 3. Porównanie obrazów w różnych skalach CFG

Jak widzisz różnice dla każdej korekty na skali CFG? Zmiany są widoczne na wyjściu, zwłaszcza jeśli przeskakujesz z małej wartości do większej. Nawet jeśli używasz tylko jednej platformy, różnica będzie widoczna w zniekształceniach i jakości po kilku poprawkach. Aby to zademonstrować, oto kilka zdjęć ze skali stabilnej dyfuzji i CFG:

Różnica skali CFG

Podpowiedź użyta na tym obrazku to Portret Toma Cruise'a w Monity o stabilnym rozproszeniu czerwonego koloru, wysoka jakość, 4K. Jest generowany w trybie stabilnej dyfuzji z określonymi wartościami CFG. Dzięki temu podobieństwo obrazu do monitu wejściowego jest bardziej widoczne.

Istnieje również kilka rzeczy, które można zobaczyć dla różnych wartości. Nasycenie kolorów i kontrast zwiększają się w miarę dodawania wartości skali CFG. Ale z drugiej strony, tuż powyżej wartości domyślnej jakość obrazu wyjściowego będzie bardziej rozmazana, co spowoduje utratę szczegółów.

Jeśli chcesz uniknąć wyników niskiej jakości, możesz zrobić dwie rzeczy. Najpierw zwiększ liczbę kroków próbnika. Ponieważ jednak w przypadku CFG jest tak samo, kroki próbnika mogą wydłużyć czas przetwarzania. Jeśli pierwsza metoda nie jest dla Ciebie korzystna, możesz zmienić próbniki, aby generować lepsze szczegóły obrazu, nawet przy wartości większej niż 7. Tutaj jest więcej próbek obrazy przeskalowane do rozdzielczości 4K dla niektórych wartości skali CFG.

Obrazy CFG

Dodatkowe wskazówki: jak powiększyć obrazy CFG o stabilnym rozproszeniu

Jeśli nie chcesz wprowadzać więcej poprawek w Stable Diffusion, innym sposobem na uzyskanie wysokiej jakości zdjęć AI jest użycie Narzędzie do skalowania obrazu AnyRec AI. Jest to narzędzie internetowe wykorzystujące technologię AI, obsługujące popularne formaty obrazów, takie jak PNG, BMP, JPEG, GIF i inne. Dzięki intuicyjnemu interfejsowi możesz zwiększyć poziom powiększenia zdjęcia do maksymalnych wartości 2x, 4x, 6x i 8x. Automatycznie odtworzy szczegółowe straty podczas pobierania, w tym piksele, kolory, tekstury itp. Jest to rozwiązanie do powiększania zdjęć, odpowiednie do drukowania, projektowania graficznego i udostępniania w mediach społecznościowych.

Krok 1.Kliknij przycisk „Prześlij zdjęcie” i wybierz zdjęcie ze swojego urządzenia.

AnyRec Prześlij zdjęcie

Krok 2.Wybierz poziom powiększenia; sprawdź szczegóły dzięki funkcji Zoom.

Powiększenie AnyRec

Krok 3.Po zakończeniu kliknij przycisk „Zapisz”, aby pobrać wynik końcowy.

AnyRec Zapisz nowy obraz

Część 4: Często zadawane pytania dotyczące skali CFG w stabilnej dyfuzji

Wniosek

Skala CFG w stabilnej dyfuzji służy do kontrolowania bliskości wyniku obrazu do monitu wejściowego. Chociaż platformy takie jak DreamStudio, Lexica i Playground AI są bardziej skuteczne w eksperymentowaniu z ustawieniami, możesz także ustawić wyższą wartość skali Stable Diffusion CFG i użyć narzędzia AnyRec AI Image Upscaler, aby powiększyć rozmiar i odzyskać szczegóły jednym kliknięciem.

Powiązane artykuły: