ما هو الانتشار المستقر وكيفية تعظيم قوته
إن تقدم الذكاء الاصطناعي يتولى الآن بعض البرامج التي من شأنها أن تساعد في توليد الصور. قد ترى أداة الانتشار المستقر. لكن ما هو الانتشار المستقر؟ هذه أداة لتوليد الصور. والغرض الأساسي منه هو إنشاء صور باستخدام المطالبات، ويجد الأشخاص أنه من الجذاب والممتع إنشاء شخصيات وعناصر مختلفة معًا. تعرف على المزيد حول ما هو Stable Diffusion واكتشف كيف يعمل.
قائمة الدليل
الجزء 1: ما هو الانتشار المستقر الجزء 2: ما هو الانتشار المستقر VAE الجزء 3: ما هو Dreambooth على الانتشار المستقر وكيفية التثبيت الجزء 4: ما هو مقياس CFG في الانتشار المستقر الجزء 5: ما هو الانتشار المستقر لقوة تقليل الضوضاء الجزء 6: ما هو Clip Skip Stable Diffusion وكيفية استخدامه الجزء 7: ما هي سرعة توليد الانتشار المستقر وكيفية تسريعها الجزء 8: الأسئلة الشائعة حول الانتشار المستقرالجزء 1: ما هو الانتشار المستقر
إنه نموذج للتعلم العميق، تحويل النص إلى صورة، وإنشاء صور عن طريق إدخال مطالبات لوصف الموضوع الرئيسي. على سبيل المثال، يمكنك وضع "قطة"، وستقوم الأداة بإنشاء صورة قطة. ومع ذلك، يمكنه التأكيد بشكل أكبر على التفاصيل أو إضافتها عند إدخال مطالبات معقدة. تصبح الشبكة العصبية التوليدية أكثر من مجرد أداة للذكاء الاصطناعي، لأنها مشروطة أيضًا بمهام أخرى مثل الرسم الخارجي، والتلوين الداخلي، والترجمة من صورة إلى صورة عبر المطالبات النصية.
تم تطوير Stable Diffusion وتمويله بواسطة Stability AI، لكن مجموعة CompVis في جامعة Ludwig Maximilian في ميونيخ لديها الترخيص الفني لنموذج الانتشار الكامن. علاوة على ذلك، قاد عملية التطوير الباحثان باتريك إيسر وروبن رومباك، وحصلا على المزيد من بيانات التدريب من المنظمات غير الربحية في ألمانيا كداعمين للمشاريع. وفي وقت لاحق من أكتوبر 2022، جمعت الشركة $101 مليون دولار أمريكي بعد طرحها مبدئيًا في أغسطس 2022.
الجزء 2. ما هو الانتشار المستقر VAE
ربما واجهت هذا عند استخدام منشئ الصور المزود بالذكاء الاصطناعي، ويعد VAE مفيدًا لهذه الأداة. يرمز VAE إلى Variable Auto Encoder، ويستخدم لضبط وحدة فك التشفير لرسم تفاصيل أفضل. إنها إضافة إلى أداة الذكاء الاصطناعي، حيث يمكن أن تساعد في الحصول على صور أكثر وضوحًا وألوانًا نابضة بالحياة وتحسين إنتاج الأيدي والوجوه.
بالطبع، VAE مخصص لأكثر من مجرد نشر مستقر لأن جميع الطرز تحتوي على VAEs مدمجة للعمل على التفاصيل. ستكون المقارنة هي النتيجة بين كل نموذج وكيف ستظهر عند ضغط الصور. علاوة على ذلك، هناك ملفات VAE منفصلة يمكنك تنزيلها على جهازك. لتجربة وحدة فك ترميز واحدة، يمكنك استخدام ما يلي:
- Orangemix/أي شيء VAE للأنيمي.
- Kl-f8-anime2 للأنمي.
- Vae-ft-mse-840000-ema-مشذب للواقعية أو اللوحات.
الجزء 3. ما هو Dreambooth في الانتشار المستقر وكيفية التثبيت
DreamBooth هو نموذج لتوليد التعلم العميق يعمل على تحسين الصور التي تم إنشاؤها، وخاصة الموضوع المحدد. في البداية، يعتمد على نموذج Imagen لتحويل النص إلى صورة، ولكن لسوء الحظ، لا تمتلك Imagen الأوزان المدربة مسبقًا مثل Stable Diffusion أو أدوات الذكاء الاصطناعي الأخرى. تم تطوير DreamBooth بواسطة باحثين في Google وبعض الزملاء من جامعة بوسطن في عام 2022.
يتمثل عمل النموذج في تعديل الصور التي تم إنشاؤها وضبطها بشكل دقيق، ولكنه قادر أيضًا على عرض مواضيع مألوفة في أي مكان أو موقف. نظرًا لأن معظم نماذج النشر المدربة مسبقًا لا تزال بحاجة إلى التحسين في هذه الفئة، فسيعمل DreamBooth على تعزيز التدريب على نماذج النشر. من خلال خمس صور فقط، يمكن إجراء تعديل الصورة باستخدام منصات مثل Stable Diffusion. فيما يلي تعليمات قصيرة حول كيفية استخدام DreamBooth على Stable Diffusion:
الخطوة 1.أولاً، يجب أن يكون لديك صور تدريبية لموضوع واحد لاستخدامها في DreamBooth. تأكد من أن الموضوع يحتوي على صور تم التقاطها. تابع تغيير حجم الصور إلى 512 × 512 بكسل.
الخطوة 2.افتح DreamBooth وأدخل موجه المثيل و موجه الصف. قم بمعالجة التغييرات بالنقر فوق يلعب زر من الجزء الأيسر من الواجهة.
الخطوه 3.عند الانتهاء، اختبره، وستتلقى بعض العينات التي تم إنشاؤها بواسطة النموذج. يمكنك تنزيل ملف نقطة التفتيش النموذجي من Google Drive الخاص بك وتثبيته في واجهة المستخدم الرسومية.
الجزء 4. ما هو مقياس CFG في الانتشار المستقر
يمكنك العثور على مجموعة القيمة هذه ضمن نموذج مولد الصور. وبما أنه أمر ضروري، يجب عليك معرفة ما يستحق تحسين الصور. يتيح مقياس التوجيه المجاني لـ Classifier للمستخدمين ضبط مدى قرب النتيجة من صورة الإدخال أو المطالبات المستخدمة. على سبيل المثال، عندما تقوم بضبط مقياس CFG على قيمة أكثر ممتازة، سيكون الإخراج أكثر تشابهًا مع الصورة المدخلة ولكن من المتوقع أن يكون مشوهًا. من ناحية أخرى، فإن مقياس CGF الأقل سيحصل على المخرجات بعيدًا عن الموجه الأساسي مع توليد جودة أفضل.
ولكن متى تحتاج إلى استخدام مقياس CFG في الانتشار المستقر؟ الجواب بسيط: لا يمكن لمولد الصور الذي يعمل بالذكاء الاصطناعي إنشاء شيء ليس ضمن نطاق معرفته، لذا سيساعدك مقياس CFG على ضم موضوعات متعددة عن طريق زيادة قيمته. العيب الوحيد هو تكلفة جودة الصورة، والتي تتناسب مع المطالبات. إذا كنت مهتمًا بهذه الأداة، فيجب عليك التدرب على معايرة المقياس للعثور على النقطة المثالية.
الجزء 5. ما هو الانتشار المستقر لقوة تقليل الضوضاء
تبدأ هذه الطريقة عملية تضيف ضوضاء إلى الصور المدخلة. إنها مجرد أ راقي الانتشار المستقر. إنها قيمة ممتازة لـ Stable Diffusion، حيث يمكنها الانتقال من صورة إلى صورة (img2img) أو InPaint. يتم التحكم في مقدار الضوضاء بواسطة Denoise Strength، من الحد الأدنى 0 إلى الحد الأقصى 1. سيؤدي وضع القيمة إلى 0 إلى تقليل الضوضاء إلى لا شيء، مما يؤدي إلى إنشاء صورة مشابهة للصورة المدخلة. وبخلاف ذلك، فإن القيمة 1 ستستبدل المدخلات بالضوضاء.
يمكنك استخدام Denoise Strength كطريقة عملية لتحديد مدى قرب المخرجات من تأثير الصور المدخلة. ومن الأمثلة الرائعة على ذلك انخفاض قوة تقليل الضوضاء التي تجعل الصور التي تم إنشاؤها تبدو أقرب إلى الإدخال، وهو إعداد مثالي للتعديلات الطفيفة. من ناحية أخرى، من المرجح أن تؤدي قوة تقليل الضوضاء الأعلى إلى زيادة التباين مع تقليل تشابه صور الإدخال والإخراج. ولذلك، فإن القيم الأعلى مفيدة لإجراء تعديلات كبيرة.
الجزء 6. ما هو Clip Skip Stable Diffusion وكيفية استخدامه
تُعرف CLIP بأنها طبقة التضمين المستخدمة لتحليل النصوص. يتكون هيكلها من طبقات تكون أكثر تحديدًا لكل فرد من الطبقة السابقة. على سبيل المثال، يمكن أن تكون الطبقة الأولى "شخص"، والطبقة الثانية ستكون "أنثى" أو "ذكر". بعد ذلك، ستكون الطبقة التالية هي "الوالد، الأب، الرجل، الصبي، إلخ."
والغرض منه هو الحصول على نموذج نصي دقيق، والذي يوقف القائمة الطويلة من الطبقات، ويمزج في النهاية المزيد من البيانات ويمنحك أكثر مما تحتاج. وأفضل مثال على ذلك هو الطراز 1.5 بعمق 12 رتبة. تحتوي كل طبقة على نص مدمج ويمكن مزجه مع تفاصيل أخرى، مثل الحجم واللون وما إلى ذلك. يتخطى CLIP بُعد مساحة النص ويصل إلى الإخراج الدقيق. وإليك كيفية استخدامه:
الخطوة 1.من نقطة تفتيش الانتشار المستقر، انتقل إلى الإعدادات وحدد "الانتشار المستقر".
الخطوة 2.قم بالتمرير لأسفل وانتقل إلى "Clip Skip". يرجى ضبطها على القيمة المطلوبة، ثم قم بالتمرير لأعلى للنقر على زر "تطبيق الإعدادات".
الجزء 7. ما هي سرعة توليد الانتشار المستقر وكيفية تسريعها
عندما تنظر إلى سرعة مولد الذكاء الاصطناعي، تتوقع أن الأمر سيستغرق بعض الوقت لإظهار النتائج. ومع ذلك، فإن سرعة التوليد المستقرة تبلغ 10 ثوانٍ. هذا فقط للاستخدام العام للأداة عبر الإنترنت، ولكن لا يزال من الممكن تقليل الوقت لمدة تصل إلى أربع ثوانٍ عند الاشتراك في الخطة الأساسية أو القياسية. هذه إحدى الطرق لتسريع سرعة النموذج، لكن دقة النتيجة تبتعد عن المدخلات يطالب نشر مستقر. علاوة على ذلك، فإن الأداة مجانية مع بعض القيود على الميزات في الخطط ذات الأسعار. إذًا، كيف يمكنك تسريع سرعة التوليد دون الدفع؟
الشرط الوحيد للتسريع هو بطاقة Nvidia، والتي يمكن أن تكون في سلسلة 4000، 3000، 2000، وحتى 1000. يمكنك استخدام Lovelace وAmpere وPascal Turing وما إلى ذلك. للحصول على بديل، استخدم دقة أقل مثل float16 وقم بتشغيل خطوات استدلال أقل.
نصائح إضافية: تغيير حجم نتائج الانتشار المستقر
بعد التعرف على نموذج الذكاء الاصطناعي، هناك شيء آخر عليك معرفته: حجم الملف عامل كبير بالنسبة للصور، ويمكنها استهلاك مساحة التخزين الخاصة بك بسبب أحجام الملفات الكبيرة. ولكن مع برنامج AnyRec Free Image Compressor عبر الإنترنتسيكون ضغط الصور أمرًا مريحًا. تحتوي الأداة عبر الإنترنت على أحدث تقنيات الذكاء الاصطناعي للمساعدة في تحسين التحميلات مع تقليل حجم الملف. نظرًا لأنه ينشئ ملفات أصغر، يمكن للمستخدم استيراد المزيد من الصور من المجلد المحلي، وسيقوم الضاغط بتحميلها على الفور.
- ضغط الانتشار المستقر الصور التي تم إنشاؤها بجودة عالية.
- لا يوجد أي علامة مائية مطبقة على الصور المضغوطة.
- دعم التنسيقات مثل JPEG وGIF وTIFF وBMP وPNG والمزيد.
- الإصلاح التلقائي لوحدات البكسل الجديدة المشوهة والضبابية وملء الصورة.
الجزء 8. الأسئلة الشائعة حول الانتشار المستقر
-
1. هل يمكنني استخدام Stable Diffusion دون الاتصال بالإنترنت؟
نعم. يمكن استخدام الأداة دون اتصال بالإنترنت. وذلك لأنه يمكنه تخزين البيانات الاصطناعية محليًا، مما يمنح نماذج الذكاء الاصطناعي التدريب على استخدامها بدون شبكة إنترنت.
-
2. ما هي عيوب مولد الصور بالذكاء الاصطناعي؟
إلى جانب فوائدها، يمكن أن تكون الأداة مكثفة حسابيًا، بينما تستهلك وقتًا عند التعامل مع الصور ومقاطع الفيديو مع بيانات أكثر شمولاً. والشيء الآخر هو أن الجودة تعتمد على بيانات الإدخال ومعلمات الشبكة المستخدمة. هذا يعني أنه ليس هناك ما يضمن حصولك على صورة عالية الجودة.
-
3. هل أحتاج إلى معدات متطورة عند استخدام Stable Diffusion؟
لا، يمكن استخدام منشئ الصور بدون أحدث إصدار للكمبيوتر. حتى لو كان لديك الإصدار الأحدث، فسيكون ذلك كافيًا لاستخدام مولد الذكاء الاصطناعي.
-
4. أين يمكن الحصول على المطالبات النصية؟
يحتوي Stable Diffusion على مهندس موجه نصي مدمج يساعدك في البحث عن المطالبات. فقط أدخل النص وانقر على زر البحث. ستظهر النتائج في ثوانٍ مع الصور كعينات.
-
5. ما هي وحدة معالجة الرسومات (GPU) التي أحتاجها لتشغيل الأداة عبر الإنترنت؟
نظرًا لأنه يدعم معظم وحدات معالجة الرسومات، يمكنك تشغيل منشئ الصور AI باستخدام Nvidia وAMD بسعة 6 جيجابايت
استنتاج
يشرح هذا المنصب ما هو الانتشار المستقر وكيفية عمله مع Clip Skip وVAE وDreamBooth وCFG Scale وDenoising Strength. من ناحية أخرى، يمكنك استخدام AnyRec Free Image Compressor Online لتقليل أحجام ملفات الصور التي تم إنشاؤها. إنه مجاني تمامًا وغير محدود للاستخدام!