¿Qué es la escala CFG de difusión estable? Adición de herramienta AI

liam molinero
Ago 03, 2023 / Actualizado por liam molinero a Herramientas de IA

Stable Diffusion es un generador de fotos de IA que es completamente gratuito y de código abierto. Al ver su rápido crecimiento, hay muchas configuraciones en esta herramienta. por ejemplo, el Escala CFG en Difusión Estable. Pero muchas personas aún no saben qué es esta configuración y cómo usarla al generar imágenes. Pues descubre más sobre la escala CFG en Difusión Estable leyendo este post.

Parte 1: ¿Qué es la escala CFG en difusión estable?

La escala CFG o Classifier Free Guidance es la configuración que contribuye al resultado más cercano de las indicaciones de entrada. Para una explicación más elaborada, poner un valor de escala CFG mayor dará como resultado una mayor semejanza con el indicador, pero se distorsionará en calidad. Mientras tanto, esto se puede hacer de otra manera, con una mayor calidad a cambio.

El valor predeterminado de la escala CFG se establece en 7 para equilibrar la libertad creativa y la dirección. Por otro lado, un valor de 1 probablemente permitirá que Stable Diffusion tenga libertad, mientras que un valor de 15 y superior tendrá restricciones. Aunque el generador de imágenes de IA limita CFG de 1 a 30 como máximo, puede configurar la escala en 999 en Difusión estable, tanto negativa como positiva, a través de la Terminal.

Puede parecer una configuración sencilla, pero el generador de imágenes de IA hará que sea más difícil de controlar con las compensaciones de varios valores de CFG. Pero para usar la escala de manera más efectiva, puede seguir la demostración a continuación sobre cómo usarla en Stable Diffusion.

Parte 2. Cómo usar la escala CFG en difusión estable

En esta demostración, puede comenzar a experimentar con CFG en DreamStudio o Playground. Sin embargo, hay más opciones disponibles para usted, como la demostración en línea de Stable Diffusion, la interfaz de usuario web completa de Stable Diffusion o una configuración mínima en RunPod.io.

Paso 1.Visite DreamStudio, Lexica o Playground AI y regístrese. Lexica no requiere que los usuarios se registren, pero las otras dos plataformas requieren una cuenta de Gmail o Discord. Una vez que esté dentro, ingrese el texto en el cuadro de aviso.

Paso 2.Haz clic en el botón "Generar" una vez que te hayas conformado con las indicaciones. Dependiendo de la plataforma que utilice, DreamStudio tendrá CFG Scale, mientras que Lexica tendrá Guidance Scale. Por otro lado, puede encontrar Orientación rápida en Playground AI en la parte derecha de la interfaz.

Cómo escalar CFG

Paso 3.Ajuste el parámetro según su gusto. Recuerda que entre 7 y 11 valores suele haber más rendimiento óptimo. Pero aún depende de sus requisitos, así que tómese su tiempo con la experimentación hasta que obtenga el mejor resultado.

Cómo CFG Orientación rápida

Parte 3. Comparación de diferentes imágenes de escala CFG

¿Cómo ves las diferencias para cada ajuste en la escala CFG? Los cambios son visibles en la salida, especialmente si salta de un valor pequeño a uno más grande. Incluso si solo está utilizando una plataforma, la diferencia notará la distorsión y la calidad con algunos ajustes. Para demostrarlo, aquí hay algunas imágenes de la escala Stable Diffusion y CFG:

Diferencia de escala CFG

El mensaje utilizado en esta imagen es Retrato de Tom Cruise en el Indicaciones de difusión estable de traje rojo, alta calidad, 4K. Se genera en Difusión Estable con valores CFG específicos. Como resultado, la similitud de la imagen con el indicador de entrada es más visible.

También hay algunas cosas que puede ver para los diferentes valores. La saturación de color y el contraste aumentan a medida que se agrega el valor de la escala CFG. Pero en otro punto, justo por encima del valor predeterminado, la imagen de salida tendrá una calidad más borrosa, lo que provocará una pérdida de detalles.

Si desea evitar resultados de baja calidad, hay dos cosas que puede hacer. Primero, aumente los pasos del muestreador. Pero dado que es lo mismo con CFG, los pasos de muestra pueden crear un tiempo de procesamiento más largo. Si el primer método no es un favor para usted, puede cambiar las muestras para generar mejores detalles de imagen, incluso a un valor superior a 7. Aquí hay más muestras imágenes mejoradas a 4K para ciertos valores de la escala CFG.

Imágenes CFG

Consejos extra: Cómo ampliar imágenes CFG de difusión estable

Si no desea hacer más ajustes en Stable Diffusion, entonces otra forma de tener fotos AI de alta calidad es usar AnyRec AI Image Upscaler. Es una herramienta en línea con el poder de la tecnología AI, compatible con formatos de imagen populares, como PNG, BMP, JPEG, GIF y más. Con su interfaz intuitiva, puede aumentar el nivel de ampliación de una foto a valores máximos de 2x, 4x, 6x y 8x. Recuperará automáticamente la pérdida detallada en la descarga, incluidos píxeles, colores, texturas, etc. Esta es la solución para ampliar imágenes, adecuada para imprimir, diseñar gráficos y compartir en redes sociales.

Paso 1.Haga clic en el botón "Subir foto" y elija la imagen de su dispositivo.

AnyRec Subir foto

Paso 2.Elija el nivel de Ampliación; compruebe los detalles con la función Zoom.

Ampliación AnyRec

Paso 3.Haga clic en el botón "Guardar" cuando esté satisfecho para descargar el resultado final.

AnyRec Guardar nueva imagen

Parte 4: Preguntas frecuentes sobre la escala CFG en difusión estable

Conclusión

Escala CFG en Difusión Estable se utiliza para controlar la proximidad del resultado de la imagen al indicador de entrada. Si bien las plataformas como DreamStudio, Lexica y Playground AI son más efectivas para experimentar con la configuración, también puede configurar el valor más alto de la escala Stable Diffusion CFG y usar AnyRec AI Image Upscaler para ampliar el tamaño y recuperar los detalles con un solo clic.

Artículos relacionados: