Giỏ hàng
Đã thêm vào giỏ hàng Xem giỏ hàng
Chọn vị trí để xem giá, thời gian giao:
X
Chọn địa chỉ nhận hàng

Địa chỉ đang chọn: Thay đổi

Hoặc chọn
Vui lòng cho Thế Giới Di Động biết số nhà, tên đường để thuận tiện giao hàng cho quý khách.
Xác nhận địa chỉ
Không hiển thị lại, tôi sẽ cung cấp địa chỉ sau
Thông tin giao hàng Thêm thông tin địa chỉ giao hàng mới Xác nhận
Xóa địa chỉ Bạn có chắc chắn muốn xóa địa chỉ này không? Hủy Xóa

Hãy chọn địa chỉ cụ thể để chúng tôi cung cấp chính xác giá và khuyến mãi

Bạn vui lòng chờ trong giây lát...

Google giới thiệu Lumiere: Tạo video từ văn bản, 'ăn đứt' các đối thủ khác

Đóng góp bởi Trần Quang Huy
01/01/23
Google giới thiệu Lumiere: Tạo video từ văn bản,
Google giới thiệu Lumiere: Tạo video từ văn bản, 'ăn đứt' các đối thủ khác - Ảnh: Google

Kể từ khi DALL-E 2 ra mắt vào cuối năm 2022, các trình tạo văn bản thành hình ảnh đã trở nên vô cùng thịnh hành. Giờ đây, sau hơn một năm, chúng ta sắp được chứng kiến một bước tiến vĩ đại hơn: Tạo văn bản thành video bằng Google Lumiere.

Mới đây, Google Research đã công bố một bài báo nghiên cứu về Lumiere, một mô hình khuếch tán văn bản thành video, hay nói cách khác, có thể tạo video chân thực từ văn bản và các hình ảnh khác.

Theo bài báo, mô hình này được thiết kế để giải quyết một thách thức lớn, đó là tạo ra "chuyển động chân thực, đa dạng và mạch lạc". Bạn có thể nhận thấy các mô hình tạo video thường hiển thị video bị giật, nhưng phương pháp của Google mang lại trải nghiệm xem liền mạch hơn, như bạn có thể thấy trong video bên dưới.

Google trình diễn một vài đoạn video được làm từ Lumiere

Bạn có thể nhận ra điều này khi xem các mô hình tạo văn bản thành video trước đây, các chuyển động không mượt mà, hình ảnh bị thay đổi liên tục, không đồng nhất. Tuy nhiên, Lumiere của Google mang đến sự mượt mà, mạch lạc. Công ty cho biết Lumiere có thể đạt được điều này thông qua kiến trúc Space-Time U-Net, tạo ra nhiều video cùng một lúc thông qua một lần duyệt.

Phương pháp tạo video này khác với các mô hình hiện có, vốn tổng hợp các khung hình chính ở xa. Theo bài báo, cách tiếp cận đó về bản chất khiến tính nhất quán của video khó đạt được.

Lumiere có thể tạo video từ nhiều đầu vào khác nhau, bao gồm văn bản thành video, hình ảnh thành video. Người dùng có thể kết hợp thêm các câu lệnh để "nắn" video đầu ra theo ý muốn. Ngoài ra, người dùng cũng có thể chỉnh sửa một video sẵn có, cũng cho phép kết hợp thêm câu lệnh, chỉnh sửa này bao gồm khả năng sửa một khu vực trong video theo ý muốn.

Google đã đo lường hiệu suất của Lumiere so với các mô hình tương tự, Lumiere đều tỏ ra vượt trội
Google đã đo lường hiệu suất của Lumiere so với các mô hình tương tự, Lumiere đều tỏ ra vượt trội - Ảnh: Google Research

Google đã đo lường hiệu suất của Lumiere so với các mô hình khuếch tán văn bản thành video nổi bật khác, bao gồm ImagenVideo, Pika, ZeroScope và Gen2, bằng cách yêu cầu một nhóm người kiểm tra chọn video mà họ cho là tốt hơn về chất lượng hình ảnh và chuyển động, mà không biết mô hình nào tạo ra từng video.

Mô hình của Google đã vượt trội hơn các mô hình khác trong tất cả các hạng mục, bao gồm chất lượng văn bản thành video, sự liên kết văn bản với video và chất lượng hình ảnh thành video. Tuy nhiên, mô hình này vẫn chưa sẵn sàng được công bố rộng rãi.

Các bạn có mong chờ được sử dụng Google Lumiere không?

Nếu bạn đang làm công việc văn phòng cần đến máy tính cá nhân, mời bạn tham khảo qua laptop văn phòng tại Thế Giới Di Động để có trải nghiệm làm việc mượt mà nhất nhé!

SẮM NGAY LAPTOP VĂN PHÒNG GIÁ TỐT

Theo dõi 24h Công Nghệ trên Google News để cập nhật các thông tin công nghệ mới và hữu ích nhất. Mời các bạn bấm vào nút cam bên dưới.

THEO DÕI TGDĐ TRÊN GOOGLE NEWS

Nguồn: ZDNET

Xem thêm: 

BÀI VIẾT LIÊN QUAN CỦA NGƯỜI DÙNG

Bạn vui lòng chờ trong giây lát...