Google giới thiệu Lumiere: Tạo video từ văn bản, 'ăn đứt' các đối thủ khác

Kể từ khi DALL-E 2 ra mắt vào cuối năm 2022, các trình tạo văn bản thành hình ảnh đã trở nên vô cùng thịnh hành. Giờ đây, sau hơn một năm, chúng ta sắp được chứng kiến một bước tiến vĩ đại hơn: Tạo văn bản thành video bằng Google Lumiere.
Mới đây, Google Research đã công bố một bài báo nghiên cứu về Lumiere, một mô hình khuếch tán văn bản thành video, hay nói cách khác, có thể tạo video chân thực từ văn bản và các hình ảnh khác.
Theo bài báo, mô hình này được thiết kế để giải quyết một thách thức lớn, đó là tạo ra "chuyển động chân thực, đa dạng và mạch lạc". Bạn có thể nhận thấy các mô hình tạo video thường hiển thị video bị giật, nhưng phương pháp của Google mang lại trải nghiệm xem liền mạch hơn, như bạn có thể thấy trong video bên dưới.
Bạn có thể nhận ra điều này khi xem các mô hình tạo văn bản thành video trước đây, các chuyển động không mượt mà, hình ảnh bị thay đổi liên tục, không đồng nhất. Tuy nhiên, Lumiere của Google mang đến sự mượt mà, mạch lạc. Công ty cho biết Lumiere có thể đạt được điều này thông qua kiến trúc Space-Time U-Net, tạo ra nhiều video cùng một lúc thông qua một lần duyệt.
Phương pháp tạo video này khác với các mô hình hiện có, vốn tổng hợp các khung hình chính ở xa. Theo bài báo, cách tiếp cận đó về bản chất khiến tính nhất quán của video khó đạt được.
Lumiere có thể tạo video từ nhiều đầu vào khác nhau, bao gồm văn bản thành video, hình ảnh thành video. Người dùng có thể kết hợp thêm các câu lệnh để "nắn" video đầu ra theo ý muốn. Ngoài ra, người dùng cũng có thể chỉnh sửa một video sẵn có, cũng cho phép kết hợp thêm câu lệnh, chỉnh sửa này bao gồm khả năng sửa một khu vực trong video theo ý muốn.

Google đã đo lường hiệu suất của Lumiere so với các mô hình khuếch tán văn bản thành video nổi bật khác, bao gồm ImagenVideo, Pika, ZeroScope và Gen2, bằng cách yêu cầu một nhóm người kiểm tra chọn video mà họ cho là tốt hơn về chất lượng hình ảnh và chuyển động, mà không biết mô hình nào tạo ra từng video.
Mô hình của Google đã vượt trội hơn các mô hình khác trong tất cả các hạng mục, bao gồm chất lượng văn bản thành video, sự liên kết văn bản với video và chất lượng hình ảnh thành video. Tuy nhiên, mô hình này vẫn chưa sẵn sàng được công bố rộng rãi.
Các bạn có mong chờ được sử dụng Google Lumiere không?
Nếu bạn đang làm công việc văn phòng cần đến máy tính cá nhân, mời bạn tham khảo qua laptop văn phòng tại Thế Giới Di Động để có trải nghiệm làm việc mượt mà nhất nhé!
SẮM NGAY LAPTOP VĂN PHÒNG GIÁ TỐT
Theo dõi 24h Công Nghệ trên Google News để cập nhật các thông tin công nghệ mới và hữu ích nhất. Mời các bạn bấm vào nút cam bên dưới.
THEO DÕI TGDĐ TRÊN GOOGLE NEWS
Nguồn: ZDNET
Xem thêm:
- Google Pixel 9 cũng đã có ảnh rò rỉ, ngoại hình mới rất đẹp
- Đây là ảnh render Google Pixel 9 Pro rõ nét, có nhiều cải tiến hữu ích
ĐĂNG NHẬP
Hãy đăng nhập để comment, theo dõi các hồ sơ cá nhân và sử dụng dịch vụ nâng cao khác trên trang Tin Công Nghệ của
Thế Giới Di Động
Tất cả thông tin người dùng được bảo mật theo quy định của pháp luật Việt Nam. Khi bạn đăng nhập, bạn đồng ý với Các điều khoản sử dụng và Thoả thuận về cung cấp và sử dụng Mạng Xã Hội.