Google có một mô hình video AI mới dành cho nhà phát triển, và nó rẻ hơn—rẻ đáng kể—so với những gì trước đó. Veo 3.1 Lite ra mắt trong tuần này thông qua Gemini API với mức chi phí dưới một nửa so với Veo 3.1 Fast, tùy chọn tầm trung trong danh mục tạo video của Google. Mô hình hỗ trợ Text-to-Video và Image-to-Video ở cả định dạng ngang (16:9) và dọc (9:16), với độ phân giải 720p và 1080p. Thời lượng video có thể điều chỉnh ở 4, 6 hoặc 8 giây, và chi phí sẽ tăng giảm tương ứng. Để dễ hình dung: trước đây Veo 3.1 tốn khoảng $0.40 mỗi giây video do AI tạo ra kèm âm thanh thông qua API, trong khi Veo 3.1 Fast là $0.15 mỗi giây. Lite hạ mức sàn xuống $0.05 mỗi giây cho 720p—cuối cùng biến các ứng dụng video quy mô lớn trở nên khả thi về mặt tài chính đối với các nhà sáng tạo nhỏ hơn
Chúng tôi đã thử mô hình và các bản tạo ra cho ra kết quả rất nhanh, không cho thấy sự suy giảm chất lượng đáng kể. Một video 8 giây (dài nhất hiện có) mất chưa đến 1 phút để tạo. Việc bám theo prompt khá ổn, chỉ cho thấy một lỗi nhỏ trong phần chữ. Ngoài ra, sự khác biệt giữa Veo 3.1 Lite và Veo 3.1 Fast không rõ ràng bằng sự khác biệt giữa Veo 3.1 Fast và phiên bản đầy đủ gốc của Veo 3.1
Google không chỉ dừng lại ở việc định giá mô hình mới một cách cạnh tranh. Vào ngày 7 tháng 4, giá cho Veo 3.1 Fast cũng đang giảm. Công ty cho biết họ “hoàn thiện hệ gia đình mô hình Veo 3.1, mang lại sự linh hoạt cho nhà phát triển tùy theo nhu cầu.” Thông điệp gửi tới những người xây dựng rất rõ ràng: Chọn tầng của bạn, không phải trần của bạn. Điều này quan trọng vì chi phí từ lâu đã là bí mật bẩn của việc tạo video bằng AI. Sản phẩm trông rất ấn tượng trong các bản demo, nhưng đó thường là những bản sinh ra được chọn lọc, và video AI vẫn quá ngẫu nhiên để dùng một cách nhất quán.
OpenAI đã phải trả giá theo cách khó khăn. Theo báo cáo, Sora đang đốt $15 triệu mỗi ngày, và tuần trước công ty thông báo rằng họ sẽ tắt hoàn toàn sản phẩm. Hiện tại OpenAI đang “chuyển hướng sang nghiên cứu mô phỏng thế giới để thúc đẩy robot” — một cách nói rất mang tính doanh nghiệp để nói rằng mọi việc đã không thành công. Một thỏa thuận trị giá $1 tỷ với Disney đã bị cuốn vào đống đổ nát. Veo 3 ra mắt vào tháng 5 năm 2025 như màn trình diễn AI ồn ào nhất của Google, được định vị là một bộ tạo “tất cả trong một” không chỉ tạo video mà còn tạo cả soundtrack đầy đủ—tiếng ồn xung quanh, hiệu ứng, thậm chí cả hội thoại. Sau đó là Veo 3.1 vào tháng 10, đối đầu trực diện với Sora 2. Chất lượng rất ấn tượng, nhưng thẻ giá thì không hẳn là điều mời gọi cho bất kỳ ai đang cố gắng triển khai thứ gì đó ở quy mô lớn. Các đối thủ Trung Quốc đã sớm nhận ra khoảng trống đó. Kling AI của Kuaishou đang cung cấp việc tạo video tương đương với giá rẻ hơn nhiều so với gói Ultra $250 của Google và thậm chí cả phương án pro thay thế $20. Hunyuan Video của Tencent còn đi xa hơn, phát hành một mô hình mã nguồn mở miễn phí, được hẹn để rơi vào đúng chu kỳ “hype” khi OpenAI ra mắt Sora vào năm 2024. Thị trường Trung Quốc không chỉ cạnh tranh về chất lượng. Nó cạnh tranh về kinh tế, và trong một thời gian dài, họ đã thắng trong cuộc tranh luận đó. Ở phía chuyên nghiệp, các công cụ như PAI của Utopai đang tạo ra một ngách hoàn toàn khác: kể chuyện điện ảnh dài hơi với các nhân vật nhất quán, các storyboard chi tiết, và biên tập do AI điều khiển ở cấp độ từng cảnh. PAI không hề rẻ—$100 cho 10,000 credits tiêu hao nhanh—nhưng nó cho thấy hướng đi mà những người sáng tạo nghiêm túc đang nhắm tới. Họ muốn quyền kiểm soát, không chỉ là việc tạo sinh. Veo 3.1 Lite không cố gắng trở thành pipeline điện ảnh của PAI, và cũng không cố gắng vượt Kling về giá. Nó nhắm đến phân khúc trung gian: những nhà phát triển cần triển khai các tính năng video ở quy mô lớn mà không bị rò rỉ credits API cho mỗi lần lặp. Mô hình này là nước đi về hạ tầng của Google cho thế hệ ứng dụng tiếp theo, xem video như một thành phần tiêu chuẩn chứ không phải một mẹo cao cấp. Nếu đợt giảm giá ngày 7 tháng 4 cho Veo 3.1 Fast diễn ra đúng như đã hứa, thì chi phí để xây dựng bằng video AI sẽ giảm trên toàn bộ danh mục của Google chỉ trong một tuần.