Thang đo CFG khuếch tán ổn định là gì – Phần bổ sung của Công cụ AI

Liam Miller
Th8 03, 2023 / Cập nhật bởi Liam Miller đến Công cụ trí tuệ nhân tạo

Stable Diffusion là một trình tạo ảnh AI hoàn toàn miễn phí và là nguồn mở. Chứng kiến sự phát triển nhanh chóng của nó, có rất nhiều cài đặt trong công cụ này. Ví dụ, Thang đo CFG trong Khuếch tán ổn định. Nhưng nhiều người vẫn chưa biết cài đặt này là gì và cách sử dụng nó khi tạo hình ảnh. Chà, hãy tìm hiểu thêm về thang đo CFG trong Khuếch tán ổn định bằng cách đọc bài đăng này.

Phần 1: Thang CFG trong khuếch tán ổn định là gì

Thang đo hướng dẫn miễn phí CFG hoặc Classifier là cài đặt đóng góp vào kết quả gần nhất của lời nhắc đầu vào. Để có lời giải thích chi tiết hơn, việc đặt giá trị thang đo CFG lớn hơn sẽ dẫn đến kết quả gần giống với lời nhắc hơn nhưng chất lượng sẽ bị sai lệch. Trong khi đó, điều này có thể được thực hiện theo cách khác, đổi lại chất lượng cao hơn.

Giá trị thang đo CFG mặc định được đặt ở mức 7 để cân bằng giữa tự do sáng tạo và định hướng. Mặt khác, giá trị 1 có thể sẽ cho phép Khuếch tán ổn định có quyền tự do, trong khi giá trị từ 15 trở lên sẽ có những hạn chế. Mặc dù trình tạo hình ảnh AI giới hạn CFG tối đa từ 1 đến 30, nhưng bạn có thể đặt tỷ lệ ở mức 999 trong Khuếch tán ổn định, cả âm và dương, thông qua Terminal.

Nghe có vẻ như là một cài đặt đơn giản, nhưng trình tạo hình ảnh AI sẽ khiến việc kiểm soát trở nên khó khăn hơn với sự đánh đổi từ các giá trị CFG khác nhau. Nhưng để sử dụng cân hiệu quả nhất, bạn có thể làm theo phần trình bày bên dưới về cách sử dụng cân trên Khuếch tán ổn định.

Phần 2. Cách sử dụng thang đo CFG trong khuếch tán ổn định

Trong phần trình diễn này, bạn có thể bắt đầu thử nghiệm CFG trên DreamStudio hoặc Playground. Tuy nhiên, có nhiều tùy chọn hơn dành cho bạn, chẳng hạn như Bản trình diễn trực tuyến về Khuếch tán ổn định, Giao diện người dùng web khuếch tán ổn định đầy đủ hoặc thiết lập tối thiểu trên RunPod.io.

Bước 1.Hãy truy cập DreamStudio, Lexica hoặc Playground AI và đăng ký. Lexica không yêu cầu người dùng đăng ký nhưng hai nền tảng còn lại yêu cầu tài khoản Gmail hoặc Discord. Khi bạn đã vào, hãy nhập văn bản vào hộp nhắc.

Bước 2.Nhấp vào nút "Tạo" khi bạn đã giải quyết xong các lời nhắc. Tùy thuộc vào nền tảng bạn sử dụng, DreamStudio sẽ có Thang đo CFG, trong khi Lexica có Thang đo hướng dẫn. Mặt khác, bạn có thể tìm thấy Hướng dẫn nhanh chóng về Playground AI ở phần bên phải của giao diện.

Cách cân CFG

Bước 3.Điều chỉnh thông số theo ý thích của bạn. Hãy nhớ rằng từ 7 đến 11 giá trị thường có đầu ra tối ưu hơn. Nhưng nó vẫn phụ thuộc vào yêu cầu của bạn, vì vậy hãy dành thời gian thử nghiệm cho đến khi bạn có kết quả tốt nhất.

Cách hướng dẫn nhanh chóng CFG

Phần 3. So sánh các hình ảnh tỷ lệ CFG khác nhau

Bạn thấy sự khác biệt như thế nào đối với mỗi lần điều chỉnh trên thang CFG? Những thay đổi này hiển thị ở đầu ra, đặc biệt nếu bạn đang chuyển từ một giá trị nhỏ sang một giá trị lớn hơn. Ngay cả khi bạn chỉ sử dụng một nền tảng, sự khác biệt sẽ cho thấy độ méo và chất lượng chỉ bằng một vài chỉnh sửa. Để chứng minh, đây là một số hình ảnh từ thang đo Khuếch tán ổn định và CFG:

Sự khác biệt về quy mô CFG

Lời nhắc được sử dụng trong bức ảnh này là Chân dung Tom Cruise trong Lời nhắc khuếch tán ổn định bộ đồ màu đỏ, chất lượng cao, 4K. Nó được tạo ra trong Khuếch tán ổn định với các giá trị CFG cụ thể. Kết quả là, sự giống nhau của hình ảnh với lời nhắc đầu vào hiển thị rõ hơn.

Ngoài ra còn có một số điều bạn có thể thấy đối với các giá trị khác nhau. Độ bão hòa màu và độ tương phản được tăng lên khi giá trị thang đo CFG được thêm vào. Nhưng ở một điểm khác, ngay trên giá trị mặc định sẽ khiến hình ảnh đầu ra có chất lượng mờ hơn, dẫn đến mất chi tiết.

Nếu bạn muốn tránh kết quả chất lượng thấp, có hai điều bạn có thể làm. Đầu tiên, tăng các bước lấy mẫu. Nhưng vì CFG cũng giống như vậy nên các bước lấy mẫu có thể tạo ra thời gian xử lý lâu hơn. Nếu phương pháp đầu tiên không phù hợp với bạn, bạn có thể thay đổi bộ lấy mẫu để tạo ra chi tiết hình ảnh tốt hơn, thậm chí ở giá trị lớn hơn 7. Dưới đây là nhiều mẫu hơn hình ảnh được nâng cấp lên 4K đối với các giá trị thang đo CFG nhất định.

Hình ảnh CFG

Lời khuyên bổ sung: Cách phóng to hình ảnh CFG khuếch tán ổn định

Nếu bạn không muốn tinh chỉnh thêm về Stable Diffusion thì một cách khác để có những bức ảnh AI chất lượng cao là sử dụng AnyRec AI Image Upscaler. Đây là một công cụ trực tuyến với sức mạnh của công nghệ AI, hỗ trợ các định dạng hình ảnh phổ biến như PNG, BMP, JPEG, GIF, v.v. Với giao diện trực quan, bạn có thể tăng mức Phóng đại của ảnh ở các giá trị tối đa 2x, 4x, 6x và 8x. Nó sẽ tự động khôi phục những chi tiết bị mất khi tải xuống, bao gồm pixel, màu sắc, họa tiết, v.v. Đây là giải pháp phóng to hình ảnh, phù hợp cho việc in ấn, thiết kế đồ họa và chia sẻ trên mạng xã hội.

Bước 1.Nhấp vào nút "Tải ảnh lên" và chọn ảnh từ thiết bị của bạn.

Ảnh tải lên AnyRec

Bước 2.Chọn mức độ phóng đại; kiểm tra chi tiết bằng chức năng Zoom.

Độ phóng đại AnyRec

Bước 3.Nhấp vào nút "Lưu" khi hài lòng để tải xuống kết quả cuối cùng.

AnyRec Lưu hình ảnh mới

Phần 4: Câu hỏi thường gặp về Cân CFG trong Khuếch tán Ổn định

Phần kết luận

Thang đo CFG trong Khuếch tán ổn định được sử dụng để kiểm soát mức độ gần gũi của kết quả hình ảnh với dấu nhắc đầu vào. Mặc dù các nền tảng như DreamStudio, Lexica và Playground AI hiệu quả hơn trong việc thử nghiệm cài đặt, nhưng bạn cũng có thể đặt giá trị cao hơn của thang đo CFG khuếch tán ổn định và sử dụng AnyRec AI Image Upscaler để phóng to kích thước và khôi phục chi tiết chỉ bằng một cú nhấp chuột.

Những bài viết liên quan: