Google ra mắt AI tạo video

15/5/2024 Gốc

Đây là lần đầu tiên Google ra mắt AI có khả năng tạo video độ phân giải 1080p từ câu lệnh chỉ trong thời gian hơn 1 phút và được đánh giá là đối thủ xứng tầm với Sora của OpenAI.

Công cụ AI mới của Google có tên là “Veo”, được giới thiệu tại sự kiện Google I/O rạng sáng 15/5 (giờ Hà Nội), có thể tạo video 1080p với nhiều phong cách hình ảnh và điện ảnh khác nhau.

Veo được Demis Hassabis - CEO Google DeepMind giới thiệu tại sự kiện Google I/O

Theo Demis Hassabis - CEO Google DeepMind, AI này có khả năng hiểu ngôn ngữ tự nhiên và có thể "nắm bắt chính xác âm điệu của lời nhắc", từ đó tạo các video thể hiện chặt chẽ tầm nhìn sáng tạo của người dùng.

Ngoài ra, mô hình này cũng hiểu các thuật ngữ điện ảnh như video timelapse hoặc ảnh phong cảnh từ trên không, đồng thời có thể tạo ra cảnh quay nhất quán và mạch lạc, với các chủ thể con người, động vật và đồ vật chuyển động chân thực trong suốt cảnh quay.

Các video minh họa về khả năng của Veo có thời lượng khoảng 8 giây. Tuy nhiên, người dùng có thể đưa ra yêu cầu về việc kéo dài thời lượng lên 1 phút 10 giây, cũng như tinh chỉnh bằng lời nhắc bổ sung để thay đổi kết quả. Con số này cao hơn thời lượng tối đa một phút mà OpenAI Sora công bố trước đó.

Theo Google, Veo được xây dựng dựa trên năm mô hình tạo video gồm Generative Query Network (GQN), DVD-GAN , Imagen-Video, Phenaki, WALT, VideoPoet và Lumiere, kết hợp với nhiều kỹ thuật khác để cải thiện chất lượng và độ phân giải đầu ra.

Họ đã cải tiến kỹ thuật về cách mô hình học cách hiểu nội dung trong video, hiển thị hình ảnh có độ phân giải cao, mô phỏng tính chất vật lý của thế giới chúng ta và hơn thế nữa.

Tại sự kiện, gã khổng lồ công nghệ Mỹ cũng giới thiệu một AI tạo hình ảnh là Imagen 3. Sản phẩm được quảng cáo là tạo ra những bức hình với "mức độ chi tiết đáng kinh ngạc", hình ảnh chân thực, sống động như thật và ít chi tiết gây mất tập trung trong ảnh hơn so với các mô hình trước đây.

Imagen 3 cũng hiểu rõ hơn ngôn ngữ tự nhiên và dự đoán được mục đích của người dùng đằng sau lời nhắc, đồng thời có thể tạo ra ảnh với nhiều phong cách khác nhau.

Tương tự nhiều AI tạo video và ảnh khác, cả Veo và Imagen 3 đều chưa được phát hành rộng rãi. Google cho biết sản phẩm mới có sẵn cho một số nhà sáng tạo nội dung dùng thử. Người dùng quan tâm cần đăng ký vào danh sách chờ. Hãng cũng dự kiến đưa một số tính năng của Veo vào YouTube Shorts và các sản phẩm khác.

Hà Thanh

Nguồn KTĐT: https://kinhtedothi.vn/google-ra-mat-ai-tao-video.html