האם אוכל להשתמש ב-Stable Diffusion במצב לא מקוון?

כן. ניתן להשתמש בכלי ללא חיבור לאינטרנט. הסיבה לכך היא שהוא יכול לאחסן את הנתונים הסינתטיים באופן מקומי, מה שמעניק לדגמי הבינה המלאכותית הכשרה להתרגל ללא רשת אינטרנט.

מהם החסרונות של מחולל צילום AI?

מלבד היתרונות שלו, הכלי יכול להיות אינטנסיבי מבחינה חישובית, תוך שהוא גוזל זמן בעת התמודדות עם תמונות וסרטונים עם נתונים נרחבים יותר. אחד נוסף הוא שהאיכות תלויה בנתוני הקלט ובפרמטרי הרשת שבהם נעשה שימוש. זה אומר שאין ערובה שתקבל תמונה באיכות גבוהה.

האם אני צריך ציוד מתקדם בעת שימוש בדיפוזיה יציבה?

לא. ניתן להשתמש במחולל התמונות ללא גרסת המחשב העדכנית ביותר. גם אם יש לך את הגרסה המאוחרת יותר, זה יספיק להשתמש במחולל AI.

היכן ניתן לקבל הנחיות טקסט?

ל-Stable Diffusion יש מהנדס הודעות טקסט מובנה שעוזר לך לחפש הנחיות. פשוט הזן טקסט ולחץ על כפתור החיפוש. התוצאות יופיעו תוך שניות עם תמונות כדוגמאות.

איזה GPU אני צריך כדי להפעיל את הכלי המקוון?

מכיוון שהוא תומך ברוב ה-GPUs, אתה יכול להפעיל את מחולל תמונות AI עם Nvidia ו-AMD בנפח 6GB

דיפוזיה יציבה

דיפוזיה יציבה

מהי פיזור יציב וכיצד למקסם את העוצמה שלו

26 יולי 2023 / עודכן על ידי ליאם מילר ל כלי AI

התקדמות הבינה המלאכותית משתלטת כעת על כמה תוכניות שיעזרו ליצור תמונות. ייתכן שתראה את כלי הדיפוזיה היציבה. אבל מה זה דיפוזיה יציבה? זהו כלי ליצירת תמונות. המטרה העיקרית שלו היא ליצור תמונות באמצעות הנחיות, ואנשים מוצאים את זה מושך ומהנה ליצור דמויות ואלמנטים שונים ביחד. למד עוד על מהי דיפוזיה יציבה וגלה כיצד זה עובד.

רשימת מדריכים

חלק 1: מהו דיפוזיה יציבה חלק 2: מהו דיפוזיה יציבה של VAE חלק 3: מה זה Dreambooth בדיפוזיה יציבה וכיצד להתקין חלק 4: מהו סולם CFG בדיפוזיה יציבה חלק 5: מה זה דיפוזיה יציבה של חוזק חלק 6: מה זה קליפ דלג על פיזור יציב וכיצד להשתמש חלק 7: מהי מהירות יצירת דיפוזיה יציבה וכיצד להאיץ חלק 8: שאלות נפוצות על דיפוזיה יציבה

חלק 1: מהו דיפוזיה יציבה

זהו מודל למידה עמוקה, טקסט לתמונה, יצירת תמונות על ידי הזנת הנחיות לתיאור הנושא העיקרי. לדוגמה, אתה יכול לשים 'חתול', והכלי יפיק תמונה של חתול. עם זאת, זה יכול להדגיש או להוסיף פרטים נוספים כאשר אתה מזין הנחיות מורכבות. הרשת העצבית הגנרטיבית הופכת ליותר מכלי בינה מלאכותית, מכיוון שהיא מותנית גם במשימות אחרות כגון ציור חוץ, ציור ותרגום תמונה לתמונה באמצעות הנחיות טקסט.

Stable Diffusion פותח ומומן על ידי Stability AI, אך לקבוצת CompVis באוניברסיטת Ludwig Maximilian במינכן יש את הרישיון הטכני למודל הדיפוזיה הסמויה. יתר על כן, הפיתוח הובל על ידי החוקרים פטריק איסר ורובין רומבך, תוך שהם משיגים יותר נתוני הכשרה מארגונים ללא מטרות רווח בגרמניה כתומכים בפרויקטים. מאוחר יותר באוקטובר 2022 גייסה החברה US$101 מיליון לאחר שהציגה אותו לראשונה באוגוסט 2022.

חלק 2. מהו דיפוזיה יציבה של VAE

ייתכן שנתקלת בכך בעת השימוש במחולל התמונות של AI, ו-VAE מועיל עבור הכלי. VAE ראשי תיבות של Variable Auto Encoder, המשמש לכוונון עדין של המפענח כדי לצייר פרטים טובים יותר. זהו תוספת לכלי הבינה המלאכותית, מכיוון שהוא יכול לעזור לקבל תמונות חדות יותר וצבעים מרהיבים ולשפר את יצירת הידיים והפנים.

כמובן, VAE מיועד ליותר מסתם דיפוזיה יציבה מכיוון שלכל הדגמים יש VAEs מובנים כדי להבין את הפרטים. ההשוואה תהיה התוצאה בין כל דגם וכיצד הם ייצאו כאשר תדחסו את התמונות. יתר על כן, ישנם קבצי VAE נפרדים שתוכל להוריד במכשיר שלך. כדי לנסות מפענח אחד, אתה יכול להשתמש בדברים הבאים:

Orangemix/כל דבר VAE לאנימה.
Kl-f8-anime2 עבור אנימה.
Vae-ft-mse-840000-ema-גזם עבור ריאליזם או ציורים.

חלק 3. מה זה Dreambooth על דיפוזיה יציבה וכיצד להתקין

DreamBooth הוא מודל לדור למידה עמוקה שמכוון את התמונות שנוצרו, במיוחד את הנושא הספציפי. בתחילה, הוא מבוסס על מודל הטקסט לתמונה של Imagen, אך למרבה הצער, ל-Image אין את המשקולות המאומנות מראש כמו Stable Diffusion או כלי AI אחרים. DreamBooth פותחה עוד יותר על ידי חוקרים של גוגל וכמה עמיתים מאוניברסיטת בוסטון ב-2022.

עבודתו של המודל היא לשנות ולכוונן את התמונות שנוצרו, אך היא גם מסוגלת להציג נושאים מוכרים בכל סביבה ומצב. מכיוון שרוב דגמי הדיפוזיה שהוכשרו מראש עדיין צריכים להשתפר בקטגוריה זו, DreamBooth יגביר את האימון למודלים של דיפוזיה. עם חמש תמונות בלבד, ניתן לבצע שינוי תמונה עם פלטפורמות כמו Stable Diffusion. להלן הדרכה קצרה כיצד להשתמש ב-DreamBooth בדיפוזיה יציבה:

שלב 1.ראשית, עליך להיות בעל תמונות הדרכה של נושא אחד לשימוש ב-DreamBooth. ודא שלמצולם יש תמונות שצולמו. המשך לשנות את גודל התמונות ל-512x512 פיקסלים.

שלב 2.פתח את DreamBooth והיכנס הודעת מופע ו הודעת כיתה. עבד את השינויים על ידי לחיצה על לְשַׂחֵק כפתור מהחלק השמאלי של הממשק.

שלב 3.בסיום, בדוק את זה ותקבל כמה דוגמאות שנוצרו על ידי המודל. אתה יכול להוריד את קובץ נקודת הבידוק של הדגם מ-Google Drive ולהתקין אותו ב-GUI.

חלק 4. מהו סולם CFG בדיפוזיה יציבה

אתה יכול למצוא ערך זה מוגדר בתוך מודל מחולל התמונות. ומכיוון שזה חיוני, עליך ללמוד מה כדאי לבצע אופטימיזציה של תמונות. Classifier Free Guidance Scale מאפשר למשתמשים להתאים את הקרבה של התוצאה מתמונת הקלט או ההנחיות בהן נעשה שימוש. לדוגמה, כאשר תתאים את קנה המידה של CFG לערך מצוין יותר, הפלט יהיה דומה יותר לתמונת הקלט אך צפוי להיות מעוות. מצד שני, סולם CGF נמוך יותר יביא את הפלט רחוק מההנחיה הראשית תוך יצירת איכות טובה יותר.

אבל מתי אתה צריך להשתמש בסולם CFG ב-Stable Diffusion? התשובה פשוטה: מחולל הצילום של AI אינו יכול ליצור משהו שאינו בקיעת הידע שלו, כך שקנה המידה של CFG יעזור לך לחבר מספר נושאים על ידי הגדלת הערך שלו. החיסרון היחיד הוא עלות איכות התמונה, שהיא פרופורציונלית להנחיות. אם מעוניינים בכלי זה, עליכם להתאמן בכיול הסולם כדי למצוא את הנקודה המתוקה.

חלק 5. מה זה דיפוזיה יציבה של חוזק

שיטה זו יוזמת תהליך שמוסיף רעש לתמונות הקלט. זה רק א יוקרה דיפוזיה יציבה. זה ערך מצוין עבור Stable Diffusion, מכיוון שהוא יכול לעבור דרך תמונה לתמונה (img2img) או InPaint. כמות הרעש נשלטת על ידי Denoise Strength, ממינימום של 0 למקסימום של 1. הצבת הערך ל-0 תפחית את הרעש לאף, ותיצור תמונה דומה לתמונת הקלט. אחרת, הערך של 1 יחליף את הקלט ברעש.

אתה יכול להשתמש ב-Denoise Strength כשיטה מעשית כדי לקבוע את הקרבה של הפלט עם השפעת תמונות הקלט. דוגמה מצוינת היא חוזק ה-Denoising נמוך יותר שגורם לתמונות שנוצרו להיראות קרוב יותר לקלט, הגדרה אידיאלית לשינויים קלים. מצד שני, Higher Denoising Strength כנראה יגדיל את השונות תוך הפחתת הדמיון של תמונות הקלט והפלט. לכן, ערכים גבוהים יותר מועילים לשינויים משמעותיים.

חלק 6. מה זה קליפ דלג על פיזור יציב וכיצד להשתמש

CLIP ידועה כשכבת הטמעה המשמשת לניתוח טקסטים. המבנה שלה מורכב משכבות, אשר לכל אדם ספציפיות יותר מהקודמת. לדוגמה, שכבה 1 יכולה להיות "אדם", ושכבה 2 תהיה "נקבה" או "זכר". לאחר מכן, השכבה הבאה תהיה "הורה, אב, גבר, ילד וכו'".

מטרתו היא לקבל את מודל הטקסט המדויק, שעוצר את הרשימה הארוכה של השכבות, בסופו של דבר מערבב יותר נתונים ונותן לך יותר ממה שאתה צריך. הדוגמה הטובה ביותר לכך היא דגם ה-1.5 עם 12 דרגות עמוקות. לכל שכבה יש הטבעת טקסט וניתן לערבב עם פרטים אחרים, כמו גודל, צבע וכו'. CLIP מדלג על ממד מרחב הטקסט ומגיע לפלט המדויק. הנה איך להשתמש בו:

שלב 1.מנקודת הבדיקה של דיפוזיה יציבה, עבור להגדרות ובחר "דיפוזיה יציבה".

שלב 2.גללו מטה ועברו אל "דילוג על קליפ". הגדירו אותו לערך הרצוי, לאחר מכן גללו למעלה כדי ללחוץ על כפתור "החל הגדרות".

חלק 7. מהי מהירות יצירת דיפוזיה יציבה וכיצד להאיץ

כשאתה מסתכל על המהירות של מחולל בינה מלאכותית, אתה מצפה שייקח קצת זמן להראות תוצאות. עם זאת, ל-Stable Diffusion יש מהירות יצירה של 10 שניות. זה מיועד רק לשימוש כללי של הכלי המקוון, אבל הזמן עדיין יכול לקצץ עד ארבע שניות בעת הרשמה לתוכנית הראשית או הסטנדרטית. זוהי דרך אחת להאיץ את מהירות הדגם, אך הדיוק של התוצאה מתרחק מהקלט הנחיות דיפוזיה יציבה. יתר על כן, הכלי חינמי עם מספר מגבלות תכונות בלבד מהתוכניות המתומחרות. אז איך מאיצים את מהירות הייצור בזמן שלא משלמים?

הדרישה היחידה להאצה היא כרטיס Nvidia, שיכול להיות בסדרות 4000, 3000, 2000 ואפילו 1000. אתה יכול להשתמש ב- Lovelace, Ampere, Pascal Turing וכו'. לחלופין, השתמש ברמת דיוק נמוכה יותר כמו float16 והפעל פחות צעדי הסקה.

טיפים לבונוס: שנה את גודל תוצאות הדיפוזיה היציבה

לאחר שלמדת על מודל הבינה המלאכותית, יש עוד דבר אחד שאתה צריך לדעת: גודל הקבצים הוא גורם עצום לתמונות, והם יכולים לאכול את שטח האחסון שלך בגלל גדלי קבצים גדולים יותר. אבל עם מדחס תמונה בחינם של AnyRec באינטרנט, דחיסת התמונות תהיה נוחה. לכלי המקוון יש את טכנולוגיית הבינה המלאכותית העדכנית ביותר כדי לסייע באופטימיזציה של ההעלאות תוך הפחתת גודל הקובץ. ככל שהוא יוצר קבצים קטנים יותר, המשתמש יכול לייבא תמונות נוספות מהתיקייה המקומית, והמדחס יטען אותן באופן מיידי.

דחוס תמונות שנוצרו בדיפוזיה יציבה באיכות.
אין להחיל סימן מים על התמונות הדחוסות.
תמיכה בפורמטים כמו JPEG, GIF, TIFF, BMP, PNG ועוד.
תקן אוטומטית את הפיקסלים החדשים המעוותים, המטושטשים ומילוי התמונה.

חלק 8. שאלות נפוצות לגבי דיפוזיה יציבה

1. האם אני יכול להשתמש ב-Stable Diffusion במצב לא מקוון?

כן. ניתן להשתמש בכלי ללא חיבור לאינטרנט. הסיבה לכך היא שהוא יכול לאחסן את הנתונים הסינתטיים באופן מקומי, מה שמעניק לדגמי הבינה המלאכותית הכשרה להתרגל ללא רשת אינטרנט.
2. מהם החסרונות של מחולל צילום AI?

מלבד היתרונות שלו, הכלי יכול להיות אינטנסיבי מבחינה חישובית, תוך שהוא גוזל זמן בעת התמודדות עם תמונות וסרטונים עם נתונים נרחבים יותר. אחד נוסף הוא שהאיכות תלויה בנתוני הקלט ובפרמטרי הרשת שבהם נעשה שימוש. זה אומר שאין ערובה שתקבל תמונה באיכות גבוהה.
3. האם אני צריך ציוד מתקדם בעת שימוש בדיפוזיה יציבה?

לא. ניתן להשתמש במחולל התמונות ללא גרסת המחשב העדכנית ביותר. גם אם יש לך את הגרסה המאוחרת יותר, זה יספיק להשתמש במחולל AI.
4. היכן ניתן לקבל הנחיות טקסט?

ל-Stable Diffusion יש מהנדס הודעות טקסט מובנה שעוזר לך לחפש הנחיות. פשוט הזן טקסט ולחץ על כפתור החיפוש. התוצאות יופיעו תוך שניות עם תמונות כדוגמאות.
5. איזה GPU אני צריך כדי להפעיל את הכלי המקוון?

מכיוון שהוא תומך ברוב ה-GPUs, אתה יכול להפעיל את מחולל תמונות AI עם Nvidia ו-AMD בנפח 6GB

סיכום

הפוסט הזה מסביר מה זה דיפוזיה יציבה וכיצד זה עובד עם Clip Skip, VAE, DreamBooth, CFG Scale ו-Denoising Strength. מצד שני, אתה יכול להשתמש ב- AnyRec Free Image Compressor Online כדי להקטין את גדלי הקבצים של התמונות שנוצרו. זה לגמרי בחינם וללא הגבלה לשימוש!