Kararlı Difüzyon Nedir ve Gücü Nasıl En Üst Düzeye Çıkarılır?

Liam Miller
26 Tem 2023 / Güncelleyen Liam Miller ile AI Araçları

Yapay Zekanın ilerleyişi artık resim oluşturmaya yardımcı olacak bazı programları devralıyor. Kararlı Dağıtım aracını görebilirsiniz. Ancak Kararlı Difüzyon Nedir?? Bu bir görüntü oluşturma aracıdır. Temel amacı, istemleri kullanarak resimler oluşturmaktır ve insanlar, çeşitli karakterleri ve öğeleri bir arada oluşturmayı çekici ve eğlenceli bulmaktadır. Kararlı Difüzyonun ne olduğu hakkında daha fazla bilgi edinin ve nasıl çalıştığını öğrenin.

Bölüm 1: Kararlı Difüzyon Nedir?

Bu, ana konuyu açıklamak için bilgi istemleri girerek resimler oluşturan, derin öğrenmeli, metinden resme modelidir. Örneğin, 'kedi' yazdığınızda araç bir kedi resmi oluşturacaktır. Ancak, karmaşık istemleri girdiğinizde daha fazla vurgu yapabilir veya daha fazla ayrıntı ekleyebilir. Üretken sinir ağı, bir yapay zeka aracından daha fazlası haline geliyor; çünkü aynı zamanda dış boyama, iç boyama ve metin komutları aracılığıyla görüntüden görüntüye çeviri gibi diğer görevlerle de koşullandırılıyor.

Stable Diffusion, Stability AI tarafından geliştirildi ve finanse edildi, ancak Münih Ludwig Maximilian Üniversitesi'ndeki CompVis grubu, gizli difüzyon modelinin teknik lisansına sahip. Ayrıca geliştirme, araştırmacılar Patrick Esser ve Robin Rombach tarafından yürütüldü ve projelerin destekçisi olarak Almanya'daki kar amacı gütmeyen kuruluşlardan daha fazla eğitim verisi elde edildi. Şirket, ilk olarak Ağustos 2022'de piyasaya sürdükten sonra Ekim 2022'de $101 milyon ABD doları topladı.

Kararlı Difüzyon

Bölüm 2. VAE Kararlı Difüzyon Nedir?

AI fotoğraf oluşturucuyu kullanırken bu durumla karşılaşmış olabilirsiniz ve VAE araç için faydalıdır. VAE, daha iyi ayrıntılar oluşturmak üzere kod çözücüye ince ayar yapmak için kullanılan Değişken Otomatik Kodlayıcı anlamına gelir. Daha net görüntüler ve canlı renkler elde etmeye ve el ve yüz oluşumunu iyileştirmeye yardımcı olabileceğinden, AI aracına yapılan bir eklentidir.

Elbette VAE, Kararlı Difüzyondan çok daha fazlası içindir çünkü tüm modellerde ayrıntıları çözmek için yerleşik VAE'ler bulunur. Karşılaştırma, her model arasındaki sonuç ve resimleri sıkıştırdığınızda nasıl ortaya çıkacakları olacaktır. Üstelik cihazınıza indirebileceğiniz ayrı VAE dosyaları da bulunmaktadır. Bir kod çözücüyü denemek için aşağıdakileri kullanabilirsiniz:

Vae Dosyaları

Bölüm 3. Kararlı Difüzyonda Dreambooth Nedir ve Nasıl Kurulur

DreamBooth, oluşturulan resimlere, özellikle de belirli konuya ince ayar yapan, derin öğrenme oluşturma modelidir. Başlangıçta Imagen'in metinden görüntüye modelini temel alıyor ancak ne yazık ki Imagen, Stabil Difüzyon veya diğer AI araçları gibi önceden eğitilmiş ağırlıklara sahip değil. DreamBooth, 2022 yılında Google Araştırmacıları ve Boston Üniversitesi'nden bazı meslektaşları tarafından daha da geliştirildi.

Modelin işi, oluşturulan fotoğrafları değiştirmek ve ince ayar yapmaktır, ancak aynı zamanda tanıdık nesneleri her türlü ortam ve durumda oluşturma yeteneğine de sahiptir. Çoğu önceden eğitilmiş dağıtım modelinin bu kategoride hala iyileştirilmesi gerektiğinden DreamBooth, dağıtım modellerine yönelik eğitimi artıracaktır. Yalnızca beş görüntüyle görüntü değişikliği Stable Diffusion gibi platformlarla yapılabilir. DreamBooth'un Kararlı Difüzyonda nasıl kullanılacağına dair kısa bir talimat:

Aşama 1.Öncelikle DreamBooth'ta kullanmak için bir konunun eğitim görsellerine sahip olmanız gerekir. Konunun çekilmiş resimlerinin olduğundan emin olun. Resimleri 512x512 piksele yeniden boyutlandırmaya devam edin.

Adım 2.DreamBooth'u açın ve girin Örnek İstemi ve Sınıf İstemi. Değişiklikleri tıklayarak işleyin Oynamak Arayüzün sol kısmındaki düğme.

Dreambooth Örnek İstemi

Aşama 3.İşiniz bittiğinde test edin; model tarafından oluşturulan birkaç örnek alacaksınız. Model kontrol noktası dosyasını Google Drive'ınızdan indirebilir ve GUI'ye yükleyebilirsiniz.

Rüya Kabini Testi

Bölüm 4. Kararlı Difüzyonda CFG Ölçeği Nedir?

Bu değer kümesini fotoğraf oluşturucu modelinde bulabilirsiniz. Ve bu çok önemli olduğundan, görüntüleri optimize etmeye değer olanı öğrenmelisiniz. Sınıflandırıcı Ücretsiz Rehberlik Ölçeği, kullanıcıların, kullanılan giriş görüntüsünden veya istemlerden sonucun yakınlığını ayarlamasına olanak tanır. Örneğin, CFG Ölçeği'ni daha mükemmel bir değere ayarladığınızda çıktı, giriş görüntüsüne daha benzer olur ancak bozulması beklenir. Öte yandan, daha düşük bir CGF ölçeği, daha iyi kalite üretirken çıktıyı birincil istemden uzaklaştıracaktır.

Ancak Kararlı Difüzyonda CFG ölçeğini ne zaman kullanmanız gerekir? Cevap basit: Yapay Zeka fotoğraf üreteci kendi bilgisi dahilinde olmayan bir şey yaratamaz, bu nedenle CFG ölçeği, değerini artırarak birden fazla nesneyi birleştirmenize yardımcı olacaktır. Tek dezavantajı, istemlerle orantılı olan görüntü kalitesinin pahalı olmasıdır. Bu araçla ilgileniyorsanız, en uygun noktayı bulmak için teraziyi kalibre etme alıştırması yapmalısınız.

CFG Ölçeği

Bölüm 5. Gürültü Giderme Mukavemeti Kararlı Difüzyon Nedir?

Bu yöntem, giriş görüntülerine gürültü ekleyen bir işlemi başlatır. Bu sadece bir Kararlı Difüzyon yükseltici. Görüntüden görüntüye (img2img) veya InPaint'ten geçebildiği için Kararlı Difüzyon için mükemmel bir değerdir. Gürültü miktarı Gürültü Giderme Gücü tarafından minimum 0'dan maksimum 1'e kadar kontrol edilir. Değerin 0'a ayarlanması gürültüyü sıfıra indirerek giriş görüntüsüne benzer bir görüntü oluşturur. Aksi halde 1 değeri girişin yerini gürültüyle alacaktır.

Çıktının giriş görüntülerinin etkisiyle yakınlığını belirlemek için Gürültü Giderme Gücü'nü pratik bir yöntem olarak kullanabilirsiniz. Bunun harika bir örneği, oluşturulan görüntülerin girişe daha yakın görünmesini sağlayan daha düşük Gürültü Giderme Gücüdür; bu, küçük değişiklikler için ideal bir ayardır. Öte yandan, Yüksek Gürültü Giderme Gücü, giriş ve çıkış görüntülerinin benzerliğini azaltırken muhtemelen çeşitliliği artıracaktır. Bu nedenle, daha yüksek değerler önemli değişiklikler için faydalıdır.

Gürültü Giderme Gücü

Bölüm 6. Clip Skip Stabil Difüzyon Nedir ve Nasıl Kullanılır?

CLIP, metinleri analiz etmek için kullanılan bir gömme katmanı olarak bilinir. Yapısı, her bireye göre bir öncekine göre daha spesifik olan katmanlardan oluşur. Örneğin, Katman 1 "Kişi" olabilir ve Katman 2 "kadın" veya "erkek" olabilir. Daha sonra bir sonraki katman “ebeveyn, baba, erkek, oğlan vb.” olacaktır.

Amacı, uzun katman listesini durduran, sonunda daha fazla veriyi karıştıran ve size ihtiyacınız olandan fazlasını veren kesin metin modelini elde etmektir. Bunun en güzel örneği 12 sıra derinliğine sahip 1.5 modelidir. Her katmanın metin yerleştirmesi vardır ve boyut, renk vb. gibi diğer ayrıntılarla karıştırılabilir. CLIP, metin alanı boyutunu atlar ve tam çıktıya ulaşır. İşte nasıl kullanılacağı:

Aşama 1.Kararlı Difüzyon Kontrol Noktasından ayarlara gidin ve “Kararlı Difüzyon”u seçin.

Adım 2.Aşağı kaydırın ve “Klibi Atla” seçeneğine gidin. Lütfen istediğiniz değere ayarlayın ve ardından yukarı kaydırarak “Ayarları Uygula” düğmesine tıklayın.

Klip Atla

Bölüm 7. Kararlı Difüzyon Üretim Hızı Nedir ve Nasıl Hızlandırılır?

Bir yapay zeka üretecinin hızına baktığınızda sonuçların ortaya çıkmasının biraz zaman alacağını beklersiniz. Ancak Kararlı Yayılmanın üretim hızı 10 saniyedir. Bu yalnızca çevrimiçi aracın genel kullanımı içindir, ancak birincil veya standart plana abone olduğunuzda süre yine de dört saniyeye kadar kısalabilir. Bu, modelin hızını artırmanın bir yoludur ancak sonucun doğruluğu girdiden uzaklaşır Kararlı Difüzyon istemleri. Üstelik araç, ücretli planlardaki yalnızca birkaç özellik sınırlaması dışında ücretsizdir. Peki ödeme yapmadan üretim hızını nasıl artıracaksınız?

Hızlandırma için tek gereksinim 4000, 3000, 2000 ve hatta 1000 serisinde olabilen bir Nvidia kartıdır. Lovelace, Ampere, Pascal Turing vb. kullanabilirsiniz. Alternatif olarak, float16 gibi daha düşük bir hassasiyet kullanın ve daha az çıkarım adımı çalıştırın.

Bonus İpuçları: Kararlı Difüzyon Sonuçları Boyutunu Değiştirin

Yapay zeka modelini öğrendikten sonra bilmeniz gereken bir şey daha var: dosya boyutu görüntüler için çok büyük bir faktördür ve daha büyük dosya boyutları nedeniyle depolama alanınızı tüketebilirler. Fakat AnyRec Ücretsiz Görüntü Sıkıştırıcı Çevrimiçi, fotoğrafları sıkıştırmak uygun olacaktır. Çevrimiçi araç, dosya boyutunu küçültürken yüklemeleri optimize etmeye yardımcı olan en yeni AI teknolojisine sahiptir. Daha küçük dosyalar oluşturduğundan, kullanıcı yerel klasörden daha fazla görüntüyü içe aktarabilir ve sıkıştırıcı bunları anında yükleyecektir.

Bölüm 8. Kararlı Difüzyon hakkında SSS

Çözüm

Bu yazı açıklıyor Kararlı Difüzyon Nedir? ve Clip Skip, VAE, DreamBooth, CFG Scale ve Gürültü Giderme Gücü ile nasıl çalıştığı. Öte yandan, oluşturulan resimlerin dosya boyutlarını azaltmak için AnyRec Free Image Compressor Online'ı kullanabilirsiniz. Kullanımı tamamen ücretsiz ve sınırsızdır!

İlgili Makaleler: