ما هو الانتشار المستقر وكيفية تعظيم قوته

ليام ميلر
26 يوليو 2023 / تم التحديث بواسطة ليام ميلر إلى أدوات الذكاء الاصطناعي

إن تقدم الذكاء الاصطناعي يتولى الآن بعض البرامج التي من شأنها أن تساعد في توليد الصور. قد ترى أداة الانتشار المستقر. لكن ما هو الانتشار المستقر؟ هذه أداة لتوليد الصور. والغرض الأساسي منه هو إنشاء صور باستخدام المطالبات، ويجد الأشخاص أنه من الجذاب والممتع إنشاء شخصيات وعناصر مختلفة معًا. تعرف على المزيد حول ما هو Stable Diffusion واكتشف كيف يعمل.

الجزء 1: ما هو الانتشار المستقر

إنه نموذج للتعلم العميق، تحويل النص إلى صورة، وإنشاء صور عن طريق إدخال مطالبات لوصف الموضوع الرئيسي. على سبيل المثال، يمكنك وضع "قطة"، وستقوم الأداة بإنشاء صورة قطة. ومع ذلك، يمكنه التأكيد بشكل أكبر على التفاصيل أو إضافتها عند إدخال مطالبات معقدة. تصبح الشبكة العصبية التوليدية أكثر من مجرد أداة للذكاء الاصطناعي، لأنها مشروطة أيضًا بمهام أخرى مثل الرسم الخارجي، والتلوين الداخلي، والترجمة من صورة إلى صورة عبر المطالبات النصية.

تم تطوير Stable Diffusion وتمويله بواسطة Stability AI، لكن مجموعة CompVis في جامعة Ludwig Maximilian في ميونيخ لديها الترخيص الفني لنموذج الانتشار الكامن. علاوة على ذلك، قاد عملية التطوير الباحثان باتريك إيسر وروبن رومباك، وحصلا على المزيد من بيانات التدريب من المنظمات غير الربحية في ألمانيا كداعمين للمشاريع. وفي وقت لاحق من أكتوبر 2022، جمعت الشركة $101 مليون دولار أمريكي بعد طرحها مبدئيًا في أغسطس 2022.

انتشار مستقر

الجزء 2. ما هو الانتشار المستقر VAE

ربما واجهت هذا عند استخدام منشئ الصور المزود بالذكاء الاصطناعي، ويعد VAE مفيدًا لهذه الأداة. يرمز VAE إلى Variable Auto Encoder، ويستخدم لضبط وحدة فك التشفير لرسم تفاصيل أفضل. إنها إضافة إلى أداة الذكاء الاصطناعي، حيث يمكن أن تساعد في الحصول على صور أكثر وضوحًا وألوانًا نابضة بالحياة وتحسين إنتاج الأيدي والوجوه.

بالطبع، VAE مخصص لأكثر من مجرد نشر مستقر لأن جميع الطرز تحتوي على VAEs مدمجة للعمل على التفاصيل. ستكون المقارنة هي النتيجة بين كل نموذج وكيف ستظهر عند ضغط الصور. علاوة على ذلك، هناك ملفات VAE منفصلة يمكنك تنزيلها على جهازك. لتجربة وحدة فك ترميز واحدة، يمكنك استخدام ما يلي:

ملفات فاي

الجزء 3. ما هو Dreambooth في الانتشار المستقر وكيفية التثبيت

DreamBooth هو نموذج لتوليد التعلم العميق يعمل على تحسين الصور التي تم إنشاؤها، وخاصة الموضوع المحدد. في البداية، يعتمد على نموذج Imagen لتحويل النص إلى صورة، ولكن لسوء الحظ، لا تمتلك Imagen الأوزان المدربة مسبقًا مثل Stable Diffusion أو أدوات الذكاء الاصطناعي الأخرى. تم تطوير DreamBooth بواسطة باحثين في Google وبعض الزملاء من جامعة بوسطن في عام 2022.

يتمثل عمل النموذج في تعديل الصور التي تم إنشاؤها وضبطها بشكل دقيق، ولكنه قادر أيضًا على عرض مواضيع مألوفة في أي مكان أو موقف. نظرًا لأن معظم نماذج النشر المدربة مسبقًا لا تزال بحاجة إلى التحسين في هذه الفئة، فسيعمل DreamBooth على تعزيز التدريب على نماذج النشر. من خلال خمس صور فقط، يمكن إجراء تعديل الصورة باستخدام منصات مثل Stable Diffusion. فيما يلي تعليمات قصيرة حول كيفية استخدام DreamBooth على Stable Diffusion:

الخطوة 1.أولاً، يجب أن يكون لديك صور تدريبية لموضوع واحد لاستخدامها في DreamBooth. تأكد من أن الموضوع يحتوي على صور تم التقاطها. تابع تغيير حجم الصور إلى 512 × 512 بكسل.

الخطوة 2.افتح DreamBooth وأدخل موجه المثيل و موجه الصف. قم بمعالجة التغييرات بالنقر فوق يلعب زر من الجزء الأيسر من الواجهة.

موجه مثيل Dreambooth

الخطوه 3.عند الانتهاء، اختبره، وستتلقى بعض العينات التي تم إنشاؤها بواسطة النموذج. يمكنك تنزيل ملف نقطة التفتيش النموذجي من Google Drive الخاص بك وتثبيته في واجهة المستخدم الرسومية.

اختبار دريم بوث

الجزء 4. ما هو مقياس CFG في الانتشار المستقر

يمكنك العثور على مجموعة القيمة هذه ضمن نموذج مولد الصور. وبما أنه أمر ضروري، يجب عليك معرفة ما يستحق تحسين الصور. يتيح مقياس التوجيه المجاني لـ Classifier للمستخدمين ضبط مدى قرب النتيجة من صورة الإدخال أو المطالبات المستخدمة. على سبيل المثال، عندما تقوم بضبط مقياس CFG على قيمة أكثر ممتازة، سيكون الإخراج أكثر تشابهًا مع الصورة المدخلة ولكن من المتوقع أن يكون مشوهًا. من ناحية أخرى، فإن مقياس CGF الأقل سيحصل على المخرجات بعيدًا عن الموجه الأساسي مع توليد جودة أفضل.

ولكن متى تحتاج إلى استخدام مقياس CFG في الانتشار المستقر؟ الجواب بسيط: لا يمكن لمولد الصور الذي يعمل بالذكاء الاصطناعي إنشاء شيء ليس ضمن نطاق معرفته، لذا سيساعدك مقياس CFG على ضم موضوعات متعددة عن طريق زيادة قيمته. العيب الوحيد هو تكلفة جودة الصورة، والتي تتناسب مع المطالبات. إذا كنت مهتمًا بهذه الأداة، فيجب عليك التدرب على معايرة المقياس للعثور على النقطة المثالية.

مقياس CFG

الجزء 5. ما هو الانتشار المستقر لقوة تقليل الضوضاء

تبدأ هذه الطريقة عملية تضيف ضوضاء إلى الصور المدخلة. إنها مجرد أ راقي الانتشار المستقر. إنها قيمة ممتازة لـ Stable Diffusion، حيث يمكنها الانتقال من صورة إلى صورة (img2img) أو InPaint. يتم التحكم في مقدار الضوضاء بواسطة Denoise Strength، من الحد الأدنى 0 إلى الحد الأقصى 1. سيؤدي وضع القيمة إلى 0 إلى تقليل الضوضاء إلى لا شيء، مما يؤدي إلى إنشاء صورة مشابهة للصورة المدخلة. وبخلاف ذلك، فإن القيمة 1 ستستبدل المدخلات بالضوضاء.

يمكنك استخدام Denoise Strength كطريقة عملية لتحديد مدى قرب المخرجات من تأثير الصور المدخلة. ومن الأمثلة الرائعة على ذلك انخفاض قوة تقليل الضوضاء التي تجعل الصور التي تم إنشاؤها تبدو أقرب إلى الإدخال، وهو إعداد مثالي للتعديلات الطفيفة. من ناحية أخرى، من المرجح أن تؤدي قوة تقليل الضوضاء الأعلى إلى زيادة التباين مع تقليل تشابه صور الإدخال والإخراج. ولذلك، فإن القيم الأعلى مفيدة لإجراء تعديلات كبيرة.

قوة تقليل الضوضاء

الجزء 6. ما هو Clip Skip Stable Diffusion وكيفية استخدامه

تُعرف CLIP بأنها طبقة التضمين المستخدمة لتحليل النصوص. يتكون هيكلها من طبقات تكون أكثر تحديدًا لكل فرد من الطبقة السابقة. على سبيل المثال، يمكن أن تكون الطبقة الأولى "شخص"، والطبقة الثانية ستكون "أنثى" أو "ذكر". بعد ذلك، ستكون الطبقة التالية هي "الوالد، الأب، الرجل، الصبي، إلخ."

والغرض منه هو الحصول على نموذج نصي دقيق، والذي يوقف القائمة الطويلة من الطبقات، ويمزج في النهاية المزيد من البيانات ويمنحك أكثر مما تحتاج. وأفضل مثال على ذلك هو الطراز 1.5 بعمق 12 رتبة. تحتوي كل طبقة على نص مدمج ويمكن مزجه مع تفاصيل أخرى، مثل الحجم واللون وما إلى ذلك. يتخطى CLIP بُعد مساحة النص ويصل إلى الإخراج الدقيق. وإليك كيفية استخدامه:

الخطوة 1.من نقطة تفتيش الانتشار المستقر، انتقل إلى الإعدادات وحدد "الانتشار المستقر".

الخطوة 2.قم بالتمرير لأسفل وانتقل إلى "Clip Skip". يرجى ضبطها على القيمة المطلوبة، ثم قم بالتمرير لأعلى للنقر على زر "تطبيق الإعدادات".

مقطع تخطي

الجزء 7. ما هي سرعة توليد الانتشار المستقر وكيفية تسريعها

عندما تنظر إلى سرعة مولد الذكاء الاصطناعي، تتوقع أن الأمر سيستغرق بعض الوقت لإظهار النتائج. ومع ذلك، فإن سرعة التوليد المستقرة تبلغ 10 ثوانٍ. هذا فقط للاستخدام العام للأداة عبر الإنترنت، ولكن لا يزال من الممكن تقليل الوقت لمدة تصل إلى أربع ثوانٍ عند الاشتراك في الخطة الأساسية أو القياسية. هذه إحدى الطرق لتسريع سرعة النموذج، لكن دقة النتيجة تبتعد عن المدخلات يطالب نشر مستقر. علاوة على ذلك، فإن الأداة مجانية مع بعض القيود على الميزات في الخطط ذات الأسعار. إذًا، كيف يمكنك تسريع سرعة التوليد دون الدفع؟

الشرط الوحيد للتسريع هو بطاقة Nvidia، والتي يمكن أن تكون في سلسلة 4000، 3000، 2000، وحتى 1000. يمكنك استخدام Lovelace وAmpere وPascal Turing وما إلى ذلك. للحصول على بديل، استخدم دقة أقل مثل float16 وقم بتشغيل خطوات استدلال أقل.

نصائح إضافية: تغيير حجم نتائج الانتشار المستقر

بعد التعرف على نموذج الذكاء الاصطناعي، هناك شيء آخر عليك معرفته: حجم الملف عامل كبير بالنسبة للصور، ويمكنها استهلاك مساحة التخزين الخاصة بك بسبب أحجام الملفات الكبيرة. ولكن مع برنامج AnyRec Free Image Compressor عبر الإنترنتسيكون ضغط الصور أمرًا مريحًا. تحتوي الأداة عبر الإنترنت على أحدث تقنيات الذكاء الاصطناعي للمساعدة في تحسين التحميلات مع تقليل حجم الملف. نظرًا لأنه ينشئ ملفات أصغر، يمكن للمستخدم استيراد المزيد من الصور من المجلد المحلي، وسيقوم الضاغط بتحميلها على الفور.

الجزء 8. الأسئلة الشائعة حول الانتشار المستقر

استنتاج

يشرح هذا المنصب ما هو الانتشار المستقر وكيفية عمله مع Clip Skip وVAE وDreamBooth وCFG Scale وDenoising Strength. من ناحية أخرى، يمكنك استخدام AnyRec Free Image Compressor Online لتقليل أحجام ملفات الصور التي تم إنشاؤها. إنه مجاني تمامًا وغير محدود للاستخدام!

مقالات ذات صلة: