מהי פיזור יציב וכיצד למקסם את העוצמה שלו

ליאם מילר
26 יולי 2023 / עודכן על ידי ליאם מילר ל כלי AI

התקדמות הבינה המלאכותית משתלטת כעת על כמה תוכניות שיעזרו ליצור תמונות. ייתכן שתראה את כלי הדיפוזיה היציבה. אבל מה זה דיפוזיה יציבה? זהו כלי ליצירת תמונות. המטרה העיקרית שלו היא ליצור תמונות באמצעות הנחיות, ואנשים מוצאים את זה מושך ומהנה ליצור דמויות ואלמנטים שונים ביחד. למד עוד על מהי דיפוזיה יציבה וגלה כיצד זה עובד.

חלק 1: מהו דיפוזיה יציבה

זהו מודל למידה עמוקה, טקסט לתמונה, יצירת תמונות על ידי הזנת הנחיות לתיאור הנושא העיקרי. לדוגמה, אתה יכול לשים 'חתול', והכלי יפיק תמונה של חתול. עם זאת, זה יכול להדגיש או להוסיף פרטים נוספים כאשר אתה מזין הנחיות מורכבות. הרשת העצבית הגנרטיבית הופכת ליותר מכלי בינה מלאכותית, מכיוון שהיא מותנית גם במשימות אחרות כגון ציור חוץ, ציור ותרגום תמונה לתמונה באמצעות הנחיות טקסט.

Stable Diffusion פותח ומומן על ידי Stability AI, אך לקבוצת CompVis באוניברסיטת Ludwig Maximilian במינכן יש את הרישיון הטכני למודל הדיפוזיה הסמויה. יתר על כן, הפיתוח הובל על ידי החוקרים פטריק איסר ורובין רומבך, תוך שהם משיגים יותר נתוני הכשרה מארגונים ללא מטרות רווח בגרמניה כתומכים בפרויקטים. מאוחר יותר באוקטובר 2022 גייסה החברה US$101 מיליון לאחר שהציגה אותו לראשונה באוגוסט 2022.

דיפוזיה יציבה

חלק 2. מהו דיפוזיה יציבה של VAE

ייתכן שנתקלת בכך בעת השימוש במחולל התמונות של AI, ו-VAE מועיל עבור הכלי. VAE ראשי תיבות של Variable Auto Encoder, המשמש לכוונון עדין של המפענח כדי לצייר פרטים טובים יותר. זהו תוספת לכלי הבינה המלאכותית, מכיוון שהוא יכול לעזור לקבל תמונות חדות יותר וצבעים מרהיבים ולשפר את יצירת הידיים והפנים.

כמובן, VAE מיועד ליותר מסתם דיפוזיה יציבה מכיוון שלכל הדגמים יש VAEs מובנים כדי להבין את הפרטים. ההשוואה תהיה התוצאה בין כל דגם וכיצד הם ייצאו כאשר תדחסו את התמונות. יתר על כן, ישנם קבצי VAE נפרדים שתוכל להוריד במכשיר שלך. כדי לנסות מפענח אחד, אתה יכול להשתמש בדברים הבאים:

Vae Files

חלק 3. מה זה Dreambooth על דיפוזיה יציבה וכיצד להתקין

DreamBooth הוא מודל לדור למידה עמוקה שמכוון את התמונות שנוצרו, במיוחד את הנושא הספציפי. בתחילה, הוא מבוסס על מודל הטקסט לתמונה של Imagen, אך למרבה הצער, ל-Image אין את המשקולות המאומנות מראש כמו Stable Diffusion או כלי AI אחרים. DreamBooth פותחה עוד יותר על ידי חוקרים של גוגל וכמה עמיתים מאוניברסיטת בוסטון ב-2022.

עבודתו של המודל היא לשנות ולכוונן את התמונות שנוצרו, אך היא גם מסוגלת להציג נושאים מוכרים בכל סביבה ומצב. מכיוון שרוב דגמי הדיפוזיה שהוכשרו מראש עדיין צריכים להשתפר בקטגוריה זו, DreamBooth יגביר את האימון למודלים של דיפוזיה. עם חמש תמונות בלבד, ניתן לבצע שינוי תמונה עם פלטפורמות כמו Stable Diffusion. להלן הדרכה קצרה כיצד להשתמש ב-DreamBooth בדיפוזיה יציבה:

שלב 1.ראשית, עליך להיות בעל תמונות הדרכה של נושא אחד לשימוש ב-DreamBooth. ודא שלמצולם יש תמונות שצולמו. המשך לשנות את גודל התמונות ל-512x512 פיקסלים.

שלב 2.פתח את DreamBooth והיכנס הודעת מופע ו הודעת כיתה. עבד את השינויים על ידי לחיצה על לְשַׂחֵק כפתור מהחלק השמאלי של הממשק.

הודעת מופע של Dreambooth

שלב 3.בסיום, בדוק את זה ותקבל כמה דוגמאות שנוצרו על ידי המודל. אתה יכול להוריד את קובץ נקודת הבידוק של הדגם מ-Google Drive ולהתקין אותו ב-GUI.

מבחן Dreambooth

חלק 4. מהו סולם CFG בדיפוזיה יציבה

אתה יכול למצוא ערך זה מוגדר בתוך מודל מחולל התמונות. ומכיוון שזה חיוני, עליך ללמוד מה כדאי לבצע אופטימיזציה של תמונות. Classifier Free Guidance Scale מאפשר למשתמשים להתאים את הקרבה של התוצאה מתמונת הקלט או ההנחיות בהן נעשה שימוש. לדוגמה, כאשר תתאים את קנה המידה של CFG לערך מצוין יותר, הפלט יהיה דומה יותר לתמונת הקלט אך צפוי להיות מעוות. מצד שני, סולם CGF נמוך יותר יביא את הפלט רחוק מההנחיה הראשית תוך יצירת איכות טובה יותר.

אבל מתי אתה צריך להשתמש בסולם CFG ב-Stable Diffusion? התשובה פשוטה: מחולל הצילום של AI אינו יכול ליצור משהו שאינו בקיעת הידע שלו, כך שקנה המידה של CFG יעזור לך לחבר מספר נושאים על ידי הגדלת הערך שלו. החיסרון היחיד הוא עלות איכות התמונה, שהיא פרופורציונלית להנחיות. אם מעוניינים בכלי זה, עליכם להתאמן בכיול הסולם כדי למצוא את הנקודה המתוקה.

סולם CFG

חלק 5. מה זה דיפוזיה יציבה של חוזק

שיטה זו יוזמת תהליך שמוסיף רעש לתמונות הקלט. זה רק א יוקרה דיפוזיה יציבה. זה ערך מצוין עבור Stable Diffusion, מכיוון שהוא יכול לעבור דרך תמונה לתמונה (img2img) או InPaint. כמות הרעש נשלטת על ידי Denoise Strength, ממינימום של 0 למקסימום של 1. הצבת הערך ל-0 תפחית את הרעש לאף, ותיצור תמונה דומה לתמונת הקלט. אחרת, הערך של 1 יחליף את הקלט ברעש.

אתה יכול להשתמש ב-Denoise Strength כשיטה מעשית כדי לקבוע את הקרבה של הפלט עם השפעת תמונות הקלט. דוגמה מצוינת היא חוזק ה-Denoising נמוך יותר שגורם לתמונות שנוצרו להיראות קרוב יותר לקלט, הגדרה אידיאלית לשינויים קלים. מצד שני, Higher Denoising Strength כנראה יגדיל את השונות תוך הפחתת הדמיון של תמונות הקלט והפלט. לכן, ערכים גבוהים יותר מועילים לשינויים משמעותיים.

חוזק משפיל

חלק 6. מה זה קליפ דלג על פיזור יציב וכיצד להשתמש

CLIP ידוע כשכבת הטבעה המשמשת לניתוח טקסטים. המבנה שלו מורכב משכבות, אשר לכל אדם, ספציפיות יותר מהקודמת. לדוגמה, שכבה 1 יכולה להיות "אדם", ושכבה 2 תהיה "נקבה" או "זכר". לאחר מכן, השכבה הבאה תהיה "הורה, אבא, גבר, ילד וכו'."

מטרתו היא לקבל את מודל הטקסט המדויק, שעוצר את הרשימה הארוכה של השכבות, בסופו של דבר מערבב יותר נתונים ונותן לך יותר ממה שאתה צריך. הדוגמה הטובה ביותר לכך היא דגם ה-1.5 עם 12 דרגות עמוקות. לכל שכבה יש הטבעת טקסט וניתן לערבב עם פרטים אחרים, כמו גודל, צבע וכו'. CLIP מדלג על ממד מרחב הטקסט ומגיע לפלט המדויק. הנה איך להשתמש בו:

שלב 1.מ-Stable Diffusion Checkpoint, עבור להגדרות ובחר "דיפוזיה יציבה".

שלב 2.גלול מטה ועבור אל "דילוג על קליפ". הגדר אותו לערך הרצוי ולאחר מכן גלול למעלה כדי ללחוץ על כפתור "החל הגדרות".

קליפ דלג

חלק 7. מהי מהירות יצירת דיפוזיה יציבה וכיצד להאיץ

כשאתה מסתכל על המהירות של מחולל בינה מלאכותית, אתה מצפה שייקח קצת זמן להראות תוצאות. עם זאת, ל-Stable Diffusion יש מהירות יצירה של 10 שניות. זה מיועד רק לשימוש כללי של הכלי המקוון, אבל הזמן עדיין יכול לקצץ עד ארבע שניות בעת הרשמה לתוכנית הראשית או הסטנדרטית. זוהי דרך אחת להאיץ את מהירות הדגם, אך הדיוק של התוצאה מתרחק מהקלט הנחיות דיפוזיה יציבה. יתר על כן, הכלי חינמי עם מספר מגבלות תכונות בלבד מהתוכניות המתומחרות. אז איך מאיצים את מהירות הייצור בזמן שלא משלמים?

הדרישה היחידה להאצה היא כרטיס Nvidia, שיכול להיות בסדרות 4000, 3000, 2000 ואפילו 1000. אתה יכול להשתמש ב- Lovelace, Ampere, Pascal Turing וכו'. לחלופין, השתמש ברמת דיוק נמוכה יותר כמו float16 והפעל פחות צעדי הסקה.

טיפים לבונוס: שנה את גודל תוצאות הדיפוזיה היציבה

לאחר שלמדת על מודל הבינה המלאכותית, יש עוד דבר אחד שאתה צריך לדעת: גודל הקבצים הוא גורם עצום לתמונות, והם יכולים לאכול את שטח האחסון שלך בגלל גדלי קבצים גדולים יותר. אבל עם מדחס תמונה בחינם של AnyRec באינטרנט, דחיסת התמונות תהיה נוחה. לכלי המקוון יש את טכנולוגיית הבינה המלאכותית העדכנית ביותר כדי לסייע באופטימיזציה של ההעלאות תוך הפחתת גודל הקובץ. ככל שהוא יוצר קבצים קטנים יותר, המשתמש יכול לייבא תמונות נוספות מהתיקייה המקומית, והמדחס יטען אותן באופן מיידי.

חלק 8. שאלות נפוצות לגבי דיפוזיה יציבה

סיכום

הפוסט הזה מסביר מה זה דיפוזיה יציבה וכיצד זה עובד עם Clip Skip, VAE, DreamBooth, CFG Scale ו-Denoising Strength. מצד שני, אתה יכול להשתמש ב- AnyRec Free Image Compressor Online כדי להקטין את גדלי הקבצים של התמונות שנוצרו. זה לגמרי בחינם וללא הגבלה לשימוש!

מאמרים קשורים: