安定拡散CFGスケールとは – AIツールの追加

リアム・ミラー
2023年8月3日 / 更新者 リアム・ミラーAI ツール

Stable Diffusion は、完全に無料でオープンソースの AI 写真ジェネレーターです。その急速な成長を見て、このツールには多くの設定があります。たとえば、 安定拡散における CFG スケール。しかし、多くの人はこの設定が何なのか、また画像を生成する際にどのように使用するのかをまだ知りません。この投稿を読んで、安定拡散における CFG スケールについて詳しく調べてください。

パート 1: 安定拡散における CFG スケールとは

CFG または Classifier Free Guide スケールは、入力プロンプトの最も近い結果に寄与する設定です。さらに詳しく説明すると、CFG スケール値を大きくするとプロンプトに近づきますが、品質が歪んでしまいます。一方、これは、より高い品質と引き換えに別の方法で実行することもできます。

デフォルトの CFG スケール値は、クリエイティブな自由度と方向性のバランスを取るために 7 に設定されています。一方、値が 1 の場合は安定拡散に自由が与えられる可能性が高く、値が 15 以上の場合は制限があります。 AI 画像ジェネレーターでは CFG が最大 1 ~ 30 に制限されていますが、Stable Diffusion でスケールをマイナス、プラスともに 999 にターミナル経由で設定できます。

簡単な設定のように聞こえるかもしれませんが、AI 画像生成ではさまざまな CFG 値とのトレードオフにより制御が難しくなります。ただし、スケールを最も効果的に使用するには、安定した拡散でスケールを使用する方法についての以下のデモンストレーションに従うことができます。

パート 2. 安定拡散での CFG スケールの使用方法

このデモでは、DreamStudio または Playground で CFG の実験を開始できます。ただし、Stable Diffusion オンライン デモ、完全な Stable Diffusion Web UI、RunPod.io での最小限のセットアップなど、その他のオプションも利用できます。

ステップ1。DreamStudio、Lexica、または Playground AI にアクセスしてサインアップします。 Lexica ではユーザーがサインアップする必要はありませんが、他の 2 つのプラットフォームでは Gmail または Discord アカウントが必要です。入ったら、プロンプトボックスにテキストを入力します。

ステップ2。プロンプトに同意したら、「生成」ボタンをクリックします。使用するプラットフォームに応じて、DreamStudio には CFG スケールがあり、Lexica にはガイダンス スケールがあります。一方、インターフェイスの右側には、Playground AI に関するプロンプト ガイダンスが表示されます。

CFG スケールの方法

ステップ 3。お好みに応じてパラメータを調整してください。通常、値が 7 ~ 11 の場合、より最適な出力が得られることに注意してください。ただし、それは要件によって異なりますので、最良の結果が得られるまで時間をかけて実験してください。

CFG プロンプトガイダンスの使用方法

パート 3. さまざまな CFG スケール画像の比較

CFG スケールでの各調整の違いはどのようにわかりますか?特に小さな値から大きな値にジャンプする場合、変更は出力に表示されます。 1 つのプラットフォームしか使用していない場合でも、少し調整するだけで歪みと品質の違いがわかります。実証のために、安定拡散と CFG スケールからのいくつかの写真を次に示します。

CFGスケールの違い

この写真で使用されているプロンプトは、映画のトム・クルーズの肖像です。 安定した拡散プロンプト 赤いスーツ、高品質、4K。特定の CFG 値を使用して安定拡散で生成されます。その結果、画像と入力プロンプトの類似性がより目立つようになります。

さまざまな値についてもいくつかのことがわかります。 CFG スケール値が追加されると、色の彩度とコントラストが増加します。しかし、別の点では、デフォルト値をわずかに超えると、出力イメージの品質がぼやけ、詳細が失われます。

低品質の結果を避けたい場合は、できることが 2 つあります。まず、サンプラーのステップを増やします。ただし、CFG の場合も同様であるため、サンプラー ステップにより処理時間が長くなる可能性があります。最初の方法が気に入らない場合は、サンプラーを変更して、7 より大きい値であっても、より詳細な画像を生成できます。その他のサンプルは次のとおりです。 4Kにアップスケールされた画像 特定の CFG スケール値の場合。

CFG画像

ボーナスヒント: 安定した拡散 CFG 画像を拡大する方法

安定拡散でさらに調整したくない場合は、高品質の AI 写真を作成する別の方法は、次の方法です。 AnyRecAIイメージアップスケーラー。これは AI テクノロジーの力を備えたオンライン ツールで、PNG、BMP、JPEG、GIF などの一般的な画像形式をサポートしています。直感的なインターフェイスを使用して、写真の倍率レベルを最大値 2x、4x、6x、8x まで上げることができます。ダウンロード時に失われたピクセル、色、テクスチャなどの詳細な損失を自動的に回復します。これは、印刷、グラフィック デザイン、ソーシャル メディア共有に適した写真を拡大するためのソリューションです。

ステップ1。「写真をアップロード」ボタンをクリックして、デバイスから写真を選択します。

AnyRec アップロード写真

ステップ2。拡大レベルを選択します。ズーム機能で詳細を確認できます。

AnyRec倍率

ステップ 3。問題がなければ「保存」ボタンをクリックして、最終結果をダウンロードします。

AnyRec新しい画像を保存

パート 4: 安定拡散における CFG スケールに関する FAQ

結論

安定拡散における CFG スケール 画像結果の入力プロンプトへの近さを制御するために使用されます。 DreamStudio、Lexica、Playground AI などのプラットフォームは設定を試すのにより効果的ですが、Stable Diffusion CFG スケールをより高い値に設定し、AnyRec AI Image Upscaler を使用してサイズを拡大し、ワンクリックで詳細を復元することもできます。

関連記事: