Tin mới Thị trường

Stable Diffusion là gì? Liệu rằng công việc vẽ tranh có trở nên 'nhàn rỗi' hơn?

Nguyễn Phan Hoàng Nguyên
13/03/24

Stable Diffusion là gì? Liệu rằng có thay thế được họa sĩ truyền thống? (Ảnh: The Verge)

Vận mệnh của ngành họa sĩ sắp tới liệu có thể thay thế được bởi AI không thì câu trả lời hiện tại vẫn chưa có. Nhưng câu trả lời hiện tại vẫn chưa thể biết được nhưng câu hỏi được đặt ra nhiều nhất hiện tại là Stable Diffusion là gì? Liệu rằng AI tạo sinh có thể thay thế con người được không? 

Stable Diffusion là gì?

Stable Diffusion là mô hình ngôn ngữ AI tạo sinh được ra mắt vào năm 2022. Mô hình này cho phép người dùng sáng tạo ra hình ảnh bằng cách gõ văn bản. Mô hình này sử dụng công nghệ kết hợp các các mạng lưới thần kinh khác  nhau. Quá trình tạo văn bản thành hình ảnh của Stable Diffusion được chia thành 4 phần khác nhau, bao gồm: 

Stable Diffusion cho phép người dùng biến hóa mọi thứ từ văn bản thành hình ảnh (Ảnh: Artnet News)

Chức năng chính của Stable Diffusion là tạo ra hình ảnh chi tiết dựa trên mô tả văn bản, nhưng cũng có thể được sử dụng cho các tác vụ khác như inpainting, outpainting và tạo các bản dịch từ hình ảnh này sang hình ảnh khác được hướng dẫn bởi văn bản. Khối lượng, thẻ mẫu và mã hóa của công cụ này được cung cấp công khai.

Stable Diffusion là một công cụ mạnh mẽ và có thể so sánh với Dall-E 3 của OpenAI nhưng lại có thể cho phép người dùng sử dụng công cụ này đơn giản hơn so với Dall-E và Midjourney. 

Tầm quan trọng của Stable Diffusion

Stable Diffusion rất quan trọng vì có thể truy cập và dễ sử dụng, chưa hết công cụ có thể chạy trên card đồ họa phổ thông. Lần đầu tiên, bất kỳ ai cũng có thể tải xuống mô hình và tạo hình ảnh dành cho riêng mình. Bạn cũng có quyền kiểm soát các siêu tham số, chẳng hạn như số bước khử nhiễu và mức độ nhiễu được áp dụng.

Stable Diffusion thân thiện với người dùng và bạn không cần thêm thông tin để tạo hình ảnh. Công cụ cũng có riêng cho mình một cộng đồng năng động, vì vậy Stable Diffusion có rất nhiều tài liệu và hướng dẫn cách thực hiện. Bản phát hành phần mềm theo giấy phép Creative ML OpenRAIL-M, cho phép bạn sử dụng thay đổi và phân phối lại phần mềm đã sửa đổi.

Công cụ Stable Diffusion có thể sử dụng được trên card đồ họa phổ thông (Ảnh: The Verge)

Phương pháp vận hành của Stable Diffusion

Stable Diffusion khác biệt so với phần còn lại của các công cụ tạo hình ảnh từ văn bản khác. Về nguyên tắc, các mô hình khuếch tán sử dụng thuật toán Gauss để mã hóa hình ảnh. Sau đó, họ sử dụng bộ dự đoán nhiễu cùng với quy trình khuếch tán ngược để tái tạo hình ảnh.

Ngoài những khác biệt về mặt kỹ thuật của mô hình khuếch tán, Stable Diffusion còn độc đáo ở chỗ công cụ này không sử dụng không gian pixel của hình ảnh. Thay vào đó, Stable Diffusion sử dụng không gian tiềm ẩn có độ phân giải thấp.

Stable Diffusion là công cụ có nhiều điểm khác biệt so với các công cụ khác (Ảnh: Engadget)

Lý giải cho điều này là một hình ảnh màu có độ phân giải 512 x 512 có 786.432 giá trị có thể có. Để so sánh, Stable Diffusion sử dụng hình ảnh nén nhỏ hơn 48 lần với 16.384 giá trị. Điều này làm giảm đáng kể yêu cầu xử lý, và đó là lý do tại sao bạn có thể sử dụng Stable Diffusion trên PC có GPU NVIDIA với RAM 8 GB.

Không gian tiềm ẩn nhỏ hơn có tác dụng vì hình ảnh tự nhiên không ngẫu nhiên. Stable Diffusion sử dụng các tệp bộ mã hóa tự động biến thiên (VAE) trong bộ giải mã để vẽ các chi tiết đẹp như mắt.

Stable Diffusion V1 được đào tạo bằng cách sử dụng ba bộ dữ liệu được LAION thu thập thông qua Common Crawl. Điều này bao gồm tập dữ liệu hình ảnh LAION-Aesthetics v2.6 có xếp hạng thẩm mỹ từ 6 trở lên.

Stable Diffusion có thể làm được gì?

Stable Diffusion thể hiện sự cải tiến trong việc tạo mô hình chuyển văn bản thành hình ảnh. Công cụ cũng có sẵn ở khắp mọi nơi và cần ít sức mạnh xử lý hơn đáng kể so với nhiều mô hình chuyển văn bản thành hình ảnh khác.

Các khả năng của Stable Diffusion bao gồm chuyển văn bản thành hình ảnh, hình ảnh thành hình ảnh, tác phẩm nghệ thuật đồ họa, chỉnh sửa hình ảnh và tạo video.

Stable Diffusion là sản phẩm của Stability.ai (Ảnh: Artnet News)

Với những người làm công việc liên quan đến sáng tạo thì Stable Diffusion hoàn toàn có thể là một công trợ thủ đắc lực. Nhưng việc lạm dụng vào các công cụ AI cũng hoàn toàn để lại nhiều rủi ro mà không thể lường trước được. 

Bạn có suy nghĩ gì về Stable Diffusion?

Bạn đọc đừng quên tham khảo thêm nhiều mẫu điện thoại hỗ trợ 5G chính hãng với giá ưu đãi tại Thế Giới Di Động để luôn cập nhật tin tức mới về công nghệ, bảo mật, smartphone,... Click vào nút cam bên dưới để xem chi tiết!

SẮM NGAY SMARTPHONE HỖ TRỢ 5G GIÁ TỐT

Theo dõi 24h Công Nghệ trên Google News để cập nhật các thông tin công nghệ mới và hữu ích nhất. Mời các bạn bấm vào nút cam bên dưới.

THEO DÕI TGDĐ TRÊN GOOGLE NEWS

Xem thêm:

Biên tập bởi Nguyễn Tất Thành