Was ist eine stabile Diffusions-CFG-Skala – eine Ergänzung des AI-Tools

Liam Müller
03. August 2023 / Aktualisiert von Liam Müller zu KI-Tools

Stable Diffusion ist ein KI-Fotogenerator, der völlig kostenlos und Open Source ist. Angesichts seines schnellen Wachstums gibt es in diesem Tool viele Einstellungen. Zum Beispiel die CFG-Skala in stabiler Diffusion. Viele Menschen wissen jedoch immer noch nicht, was diese Einstellung ist und wie man sie beim Generieren von Bildern verwendet. Erfahren Sie mehr über die CFG-Skala in Stable Diffusion, indem Sie diesen Beitrag lesen.

Teil 1: Was ist die CFG-Skala bei stabiler Diffusion?

Die CFG- oder Classifier Free Guidance-Skala ist die Einstellung, die zum nächstgelegenen Ergebnis der Eingabeaufforderungen beiträgt. Für eine ausführlichere Erklärung führt die Festlegung eines größeren CFG-Skalenwerts zu einer größeren Ähnlichkeit mit der Eingabeaufforderung, allerdings mit einer verzerrten Qualität. In der Zwischenzeit kann dies auch auf andere Weise erfolgen, mit einer höheren Qualität im Gegenzug.

Der standardmäßige CFG-Skalierungswert ist auf 7 eingestellt, um die kreative Freiheit und die Richtung auszugleichen. Andererseits wird ein Wert von 1 wahrscheinlich die Freiheit der stabilen Diffusion ermöglichen, während ein Wert von 15 und höher Einschränkungen mit sich bringt. Obwohl der AI-Bildgenerator die CFG auf maximal 1 bis 30 begrenzt, können Sie die Skala über das Terminal auf 999 in der stabilen Diffusion einstellen, sowohl negativ als auch positiv.

Es mag nach einer einfachen Einstellung klingen, aber der KI-Bildgenerator wird die Steuerung mit den Kompromissen verschiedener CFG-Werte erschweren. Um die Skala jedoch am effektivsten zu nutzen, können Sie der folgenden Demonstration folgen, wie Sie sie bei Stable Diffusion verwenden.

Teil 2. Verwendung der CFG-Skala bei stabiler Diffusion

In dieser Demonstration können Sie mit CFG auf DreamStudio oder Playground experimentieren. Es stehen Ihnen jedoch weitere Optionen zur Verfügung, z. B. die Stable Diffusion Online-Demo, die vollständige Stable Diffusion Web-Benutzeroberfläche oder eine minimale Einrichtung auf RunPod.io.

Schritt 1.Besuchen Sie DreamStudio, Lexica oder Playground AI und melden Sie sich an. Für Lexica ist keine Anmeldung erforderlich, für die anderen beiden Plattformen ist jedoch ein Gmail- oder Discord-Konto erforderlich. Sobald Sie angemeldet sind, geben Sie den Text in das Eingabeaufforderungsfeld ein.

Schritt 2.Klicken Sie auf die Schaltfläche „Generieren“, sobald Sie mit den Eingabeaufforderungen zufrieden sind. Abhängig von der von Ihnen verwendeten Plattform verfügt DreamStudio über CFG Scale, während Lexica über Guidance Scale verfügt. Andererseits finden Sie im rechten Teil der Benutzeroberfläche eine schnelle Anleitung zu Playground AI.

Wie man eine CFG-Skalierung durchführt

Schritt 3.Passen Sie den Parameter nach Ihren Wünschen an. Denken Sie daran, dass Werte zwischen 7 und 11 normalerweise eine optimalere Ausgabe liefern. Aber es hängt immer noch von Ihren Anforderungen ab. Nehmen Sie sich also Zeit für das Experimentieren, bis Sie das beste Ergebnis erzielen.

Anleitung zur CFG-Prompt

Teil 3. Vergleich verschiedener Bilder im CFG-Maßstab

Wie sehen Sie die Unterschiede bei jeder Anpassung auf der CFG-Skala? Die Änderungen sind in der Ausgabe sichtbar, insbesondere wenn Sie von einem kleinen zu einem größeren Wert springen. Selbst wenn Sie nur eine Plattform verwenden, lässt sich der Unterschied mit ein paar Anpassungen an der Verzerrung und der Qualität erkennen. Zur Veranschaulichung hier einige Bilder aus der Stable Diffusion- und CFG-Skala:

CFG-Skalenunterschied

Die in diesem Bild verwendete Eingabeaufforderung ist „Porträt von Tom Cruise“. Stabile Diffusionsaufforderungen von rotem Anzug, hohe Qualität, 4K. Es wird in stabiler Diffusion mit spezifischen CFG-Werten erzeugt. Dadurch wird die Ähnlichkeit des Bildes zur Eingabeaufforderung besser sichtbar.

Es gibt auch einige Dinge, die Sie für die verschiedenen Werte sehen können. Farbsättigung und Kontrast werden erhöht, wenn der CFG-Skalenwert hinzugefügt wird. Aber in einem anderen Punkt führt ein knapp über dem Standardwert liegender Wert dazu, dass das Ausgabebild unschärfer wird, was zu Detailverlusten führt.

Wenn Sie minderwertige Ergebnisse vermeiden möchten, können Sie zwei Dinge tun. Erhöhen Sie zunächst die Sampler-Schritte. Da dies jedoch auch bei CFG der Fall ist, können Sampler-Schritte zu einer längeren Verarbeitungszeit führen. Wenn Ihnen die erste Methode nicht gefällt, können Sie die Sampler ändern, um bessere Bilddetails zu erzeugen, selbst bei einem höheren Wert als 7. Hier finden Sie weitere Beispiele Bilder auf 4K hochskaliert für bestimmte CFG-Skalenwerte.

CFG-Bilder

Bonus-Tipps: So vergrößern Sie CFG-Bilder mit stabiler Diffusion

Wenn Sie keine weiteren Optimierungen an der stabilen Diffusion vornehmen möchten, können Sie auch hochwertige KI-Fotos erhalten AnyRec AI Image Upscaler. Es handelt sich um ein Online-Tool mit der Leistungsfähigkeit der KI-Technologie, das gängige Bildformate wie PNG, BMP, JPEG, GIF und mehr unterstützt. Mit der intuitiven Benutzeroberfläche können Sie die Vergrößerung eines Fotos auf die Maximalwerte 2x, 4x, 6x und 8x erhöhen. Der detaillierte Verlust beim Herunterladen, einschließlich Pixel, Farben, Texturen usw., wird automatisch wiederhergestellt. Dies ist die Lösung zum Vergrößern von Bildern, geeignet zum Drucken, für Grafikdesign und zum Teilen in sozialen Medien.

Schritt 1.Klicken Sie auf die Schaltfläche „Foto hochladen“ und wählen Sie das Bild von Ihrem Gerät aus.

AnyRec Foto hochladen

Schritt 2.Wählen Sie die Vergrößerungsstufe; Überprüfen Sie die Details mit der Zoom-Funktion.

AnyRec-Vergrößerung

Schritt 3.Wenn Sie zufrieden sind, klicken Sie auf die Schaltfläche „Speichern“, um das Endergebnis herunterzuladen.

AnyRec Neues Bild speichern

Teil 4: FAQs zur CFG-Skala in stabiler Diffusion

Abschluss

CFG-Skala in stabiler Diffusion wird verwendet, um die Nähe des Bildergebnisses zur Eingabeaufforderung zu steuern. Während Plattformen wie DreamStudio, Lexica und Playground AI beim Experimentieren mit der Einstellung effektiver sind, können Sie auch die Stable Diffusion CFG-Skala auf einen höheren Wert einstellen und AnyRec AI Image Upscaler verwenden, um die Größe zu vergrößern und die Details mit einem Klick wiederherzustellen.

In Verbindung stehende Artikel: