¿Qué es la escala CFG de difusión estable? Adición de herramienta AI
Stable Diffusion es un generador de fotos de IA que es completamente gratuito y de código abierto. Al ver su rápido crecimiento, hay muchas configuraciones en esta herramienta. por ejemplo, el Escala CFG en Difusión Estable. Pero muchas personas aún no saben qué es esta configuración y cómo usarla al generar imágenes. Pues descubre más sobre la escala CFG en Difusión Estable leyendo este post.
Lista de guías
Parte 1: ¿Qué es la escala CFG en difusión estable? Parte 2: Cómo usar la escala CFG en difusión estable Parte 3: Comparación de diferentes imágenes de escala CFG Parte 4: Preguntas frecuentes sobre la escala CFG en difusión estableParte 1: ¿Qué es la escala CFG en difusión estable?
La escala CFG o Classifier Free Guidance es la configuración que contribuye al resultado más cercano de las indicaciones de entrada. Para una explicación más elaborada, poner un valor de escala CFG mayor dará como resultado una mayor semejanza con el indicador, pero se distorsionará en calidad. Mientras tanto, esto se puede hacer de otra manera, con una mayor calidad a cambio.
El valor predeterminado de la escala CFG se establece en 7 para equilibrar la libertad creativa y la dirección. Por otro lado, un valor de 1 probablemente permitirá que Stable Diffusion tenga libertad, mientras que un valor de 15 y superior tendrá restricciones. Aunque el generador de imágenes de IA limita CFG de 1 a 30 como máximo, puede configurar la escala en 999 en Difusión estable, tanto negativa como positiva, a través de la Terminal.
Puede parecer una configuración sencilla, pero el generador de imágenes de IA hará que sea más difícil de controlar con las compensaciones de varios valores de CFG. Pero para usar la escala de manera más efectiva, puede seguir la demostración a continuación sobre cómo usarla en Stable Diffusion.
Parte 2. Cómo usar la escala CFG en difusión estable
En esta demostración, puede comenzar a experimentar con CFG en DreamStudio o Playground. Sin embargo, hay más opciones disponibles para usted, como la demostración en línea de Stable Diffusion, la interfaz de usuario web completa de Stable Diffusion o una configuración mínima en RunPod.io.
Paso 1.Visite DreamStudio, Lexica o Playground AI y regístrese. Lexica no requiere que los usuarios se registren, pero las otras dos plataformas requieren una cuenta de Gmail o Discord. Una vez que esté dentro, ingrese el texto en el cuadro de aviso.
Paso 2.Haz clic en el botón "Generar" una vez que te hayas conformado con las indicaciones. Dependiendo de la plataforma que utilice, DreamStudio tendrá CFG Scale, mientras que Lexica tendrá Guidance Scale. Por otro lado, puede encontrar Orientación rápida en Playground AI en la parte derecha de la interfaz.
Paso 3.Ajuste el parámetro según su gusto. Recuerda que entre 7 y 11 valores suele haber más rendimiento óptimo. Pero aún depende de sus requisitos, así que tómese su tiempo con la experimentación hasta que obtenga el mejor resultado.
Parte 3. Comparación de diferentes imágenes de escala CFG
¿Cómo ves las diferencias para cada ajuste en la escala CFG? Los cambios son visibles en la salida, especialmente si salta de un valor pequeño a uno más grande. Incluso si solo está utilizando una plataforma, la diferencia notará la distorsión y la calidad con algunos ajustes. Para demostrarlo, aquí hay algunas imágenes de la escala Stable Diffusion y CFG:
El mensaje utilizado en esta imagen es Retrato de Tom Cruise en el Indicaciones de difusión estable de traje rojo, alta calidad, 4K. Se genera en Difusión Estable con valores CFG específicos. Como resultado, la similitud de la imagen con el indicador de entrada es más visible.
También hay algunas cosas que puede ver para los diferentes valores. La saturación de color y el contraste aumentan a medida que se agrega el valor de la escala CFG. Pero en otro punto, justo por encima del valor predeterminado, la imagen de salida tendrá una calidad más borrosa, lo que provocará una pérdida de detalles.
Si desea evitar resultados de baja calidad, hay dos cosas que puede hacer. Primero, aumente los pasos del muestreador. Pero dado que es lo mismo con CFG, los pasos de muestra pueden crear un tiempo de procesamiento más largo. Si el primer método no es un favor para usted, puede cambiar las muestras para generar mejores detalles de imagen, incluso a un valor superior a 7. Aquí hay más muestras imágenes mejoradas a 4K para ciertos valores de la escala CFG.
Consejos extra: Cómo ampliar imágenes CFG de difusión estable
Si no desea hacer más ajustes en Stable Diffusion, entonces otra forma de tener fotos AI de alta calidad es usar AnyRec AI Image Upscaler. Es una herramienta en línea con el poder de la tecnología AI, compatible con formatos de imagen populares, como PNG, BMP, JPEG, GIF y más. Con su interfaz intuitiva, puede aumentar el nivel de ampliación de una foto a valores máximos de 2x, 4x, 6x y 8x. Recuperará automáticamente la pérdida detallada en la descarga, incluidos píxeles, colores, texturas, etc. Esta es la solución para ampliar imágenes, adecuada para imprimir, diseñar gráficos y compartir en redes sociales.
- Ampliadora de fotos en línea gratuita 100% para un gran valor de escala CFG de difusión estable.
- Vista previa en paralelo de los resultados originales y de salida.
- Proporcione una función incorporada de acercar/alejar para ver los detalles de salida.
- Proteja la privacidad eliminando las cargas del servidor después del proceso.
Paso 1.Haga clic en el botón "Subir foto" y elija la imagen de su dispositivo.
Paso 2.Elija el nivel de Ampliación; compruebe los detalles con la función Zoom.
Paso 3.Haga clic en el botón "Guardar" cuando esté satisfecho para descargar el resultado final.
Parte 4: Preguntas frecuentes sobre la escala CFG en difusión estable
-
1. ¿Cuándo debo cambiar la báscula CFG?
Si desea que Stable Diffusion genere el aviso fuera de su conocimiento, es posible que necesite CFG para alinear el aviso con el resultado de la imagen. Eso sí, hay que buscar la calidad a la hora de aumentar el valor de escala.
-
2. ¿Hay alguna diferencia entre la escala CFG y la fuerza de eliminación de ruido?
Sí. La escala CFG funciona para la cercanía del indicador con el resultado, mientras que la fuerza de eliminación de ruido es más para determinar la creatividad de la herramienta con IA. Con la combinación perfecta de estos dos, puede equilibrar la creatividad y la precisión de la imagen.
-
3. ¿Qué es mejor: un valor más alto o más bajo en CFG?
Los usuarios encuentran más fácil ajustar la escala a un valor más alto, ya que produce resultados precisos. Aunque la calidad no es buena, puedes encontrar otra alternativa para aumentar la calidad, como AnyRec AI Image Upscaler.
-
4. ¿Qué versión de difusión estable debo usar con la báscula CFG?
Stable Diffusion 2 es mejor que el primero, ya que proporciona modelos más profundos, de mayor escala y sin pintar. Por supuesto, usar CFG con esta versión creará resultados precisos.
-
5. ¿Qué valor se debe configurar para CFG?
El mejor valor a elegir es entre 7 y 10. Si bien el resultado no es prometedor, puede tomarse su tiempo para ver las imágenes mejor generadas.
Conclusión
Escala CFG en Difusión Estable se utiliza para controlar la proximidad del resultado de la imagen al indicador de entrada. Si bien las plataformas como DreamStudio, Lexica y Playground AI son más efectivas para experimentar con la configuración, también puede configurar el valor más alto de la escala Stable Diffusion CFG y usar AnyRec AI Image Upscaler para ampliar el tamaño y recuperar los detalles con un solo clic.