Quét để tải ứng dụng Gate
qrCode
Thêm tùy chọn tải xuống
Không cần nhắc lại hôm nay

Google DeepMind ra mắt Nano Banana Pro với khả năng hiển thị văn bản nâng cao và chỉnh sửa hình ảnh chất lượng phòng thu

Tóm tắt

Google DeepMind đã ra mắt mô hình tạo và chỉnh sửa hình ảnh Nano Banana Pro, cung cấp khả năng suy luận nâng cao, cải thiện hiển thị văn bản, kết hợp nhiều thành phần và nhiều tính năng khác.

Google DeepMind ra mắt Nano Banana Pro với khả năng hiển thị văn bản nâng cao và chỉnh sửa hình ảnh chất lượng phòng thu

Google DeepMind, bộ phận AI của công ty công nghệ Google, đã công bố phát hành Nano Banana Pro, hay còn gọi là Gemini 3 Pro Image, một mô hình thế hệ mới dành cho việc tạo và chỉnh sửa hình ảnh. Được phát triển dựa trên Gemini 3 Pro, Nano Banana Pro tận dụng khả năng suy luận nâng cao và kiến thức thực tiễn của mô hình để tạo ra các biểu diễn hình ảnh chính xác hơn.

Mô hình này được thiết kế để hỗ trợ nhiều tác vụ hình ảnh khác nhau, bao gồm thiết kế ý tưởng, tạo nguyên mẫu, phát triển infographic và chuyển đổi nội dung viết tay thành sơ đồ có cấu trúc. Nano Banana Pro tạo ra các hình ảnh có ngữ cảnh dựa trên khả năng suy luận nâng cao, thông tin bên ngoài và dữ liệu thời gian thực. Bằng cách tích hợp khả năng phân tích của Gemini 3, mô hình này có thể tạo ra đồ họa giáo dục giàu thông tin, các giải thích chi tiết và minh họa chính xác dựa trên tài liệu do người dùng cung cấp hoặc thông tin đã được xác minh từ thế giới thực. Nó cũng có thể sử dụng Google Search để trực quan hóa các mục như công thức nấu ăn, cập nhật thời tiết trực tiếp hoặc thông tin thể thao.

Nano Banana Pro còn cải thiện khả năng hiển thị văn bản trong hình ảnh, cung cấp độ chính xác, rõ ràng và dễ đọc cao hơn trên nhiều ngôn ngữ. Hệ thống hỗ trợ tạo ra các hình ảnh chứa văn bản từ nhãn ngắn đến đoạn dài, đồng thời hiểu rõ hơn về sắc thái phong cách, chiều sâu và bố cục. Điều này cho phép tích hợp văn bản chính xác hơn vào các bản mô phỏng, áp phích và tài liệu sáng tạo khác, đồng thời giúp nội dung có thể được bản địa hóa hoặc dịch sang nhiều ngôn ngữ để sử dụng rộng rãi hơn.

Mô hình này cũng nâng cao độ trung thực của hình ảnh và tính linh hoạt sáng tạo. Thiết kế của nó cho phép kết hợp nhiều thành phần, chèn tối đa mười bốn hình ảnh và duy trì sự nhất quán cho tối đa năm cá nhân trong một bố cục. Các tác vụ như chuyển đổi bản phác thảo thành ý tưởng sản phẩm hoặc biến bản thiết kế thành bản dựng 3D chi tiết sẽ được hưởng lợi từ khả năng kết nối tốt hơn. Nano Banana Pro giới thiệu các công cụ kiểm soát sáng tạo mở rộng, cho phép người dùng điều chỉnh góc máy ảnh, thay đổi tiêu cự, tinh chỉnh các vùng cụ thể của hình ảnh, áp dụng phân loại màu phức tạp và thay đổi điều kiện ánh sáng. Kết quả đầu ra có thể được tạo ở nhiều tỷ lệ khung hình khác nhau, hỗ trợ độ phân giải 2K và 4K để đáp ứng cả yêu cầu kỹ thuật số và in ấn.

Nano Banana Pro hiện đã có trên các công cụ dành cho người tiêu dùng, doanh nghiệp và sáng tạo

Người dùng trên các sản phẩm và dịch vụ của Google hiện có thể lựa chọn giữa mô hình Nano Banana nguyên bản, thiết kế cho chỉnh sửa nhanh và đơn giản, và Nano Banana Pro, hướng đến các tác phẩm phức tạp hơn đòi hỏi chất lượng cao và hình ảnh tinh xảo. Mô hình nâng cao này đang dần được triển khai tới người tiêu dùng và sinh viên thông qua ứng dụng Gemini bằng cách chọn “Tạo hình ảnh” với mô hình “Suy nghĩ”. Người dùng miễn phí sẽ được truy cập giới hạn trước khi quay lại phiên bản gốc, trong khi người đăng ký Google AI Plus, Pro và Ultra nhận được hạn ngạch mở rộng. Tại Hoa Kỳ, Nano Banana Pro có sẵn ở Chế độ AI cho Search dành cho người dùng đăng ký Google AI Pro và Ultra, đồng thời cũng được cung cấp cho người đăng ký NotebookLM trên toàn thế giới.

Đối với người dùng chuyên nghiệp, Google Ads đang tích hợp Nano Banana Pro để hỗ trợ khả năng sáng tạo và chỉnh sửa nâng cao hơn cho các nhà quảng cáo toàn cầu. Mô hình này cũng đang được triển khai tới các ứng dụng Google Workspace, bao gồm Google Slides và Vids. Các nhà phát triển và khách hàng doanh nghiệp sẽ có Nano Banana Pro thông qua Gemini API, Google AI Studio và Google Antigravity để hỗ trợ tạo bố cục và mô hình mẫu phong phú hơn. Doanh nghiệp có thể bắt đầu sử dụng mô hình trong Vertex AI để tạo nội dung quy mô lớn, với kế hoạch mở rộng thêm trên Gemini Enterprise. Các chuyên gia sáng tạo sẽ được truy cập thông qua đăng ký Google AI Ultra trong Flow, công cụ làm phim AI của công ty, cho phép kiểm soát và chính xác hơn khi dựng cảnh và khung hình.

Google tiếp tục nhấn mạnh tính minh bạch đối với các phương tiện do AI tạo ra. Tất cả hình ảnh tạo ra qua các công cụ của hãng đều được gắn watermark kỹ thuật số SynthID không thể nhận biết bằng mắt thường. Người dùng hiện có thể tải lên một hình ảnh vào ứng dụng Gemini và kiểm tra trực tiếp xem nó có được tạo bởi Google AI hay không thông qua xác minh SynthID, với việc hỗ trợ cho âm thanh và video dự kiến trong tương lai. Song song với SynthID, một watermark Gemini hiển thị sẽ xuất hiện trên hình ảnh do người dùng miễn phí và Google AI Pro tạo để giúp nhận diện rõ ràng hơn. Đối với các quy trình chuyên nghiệp yêu cầu hình ảnh không bị che watermark, watermark hiển thị sẽ được loại bỏ trên hình ảnh do người đăng ký Google AI Ultra và các hình ảnh tạo ra trong môi trường phát triển Google AI Studio.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Gate Fun hotXem thêm
  • Vốn hóa:$3.36KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$3.42KNgười nắm giữ:3
    0.33%
  • Vốn hóa:$4.44KNgười nắm giữ:514
    1.45%
  • Vốn hóa:$3.41KNgười nắm giữ:2
    0.20%
  • Vốn hóa:$3.44KNgười nắm giữ:2
    0.35%
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)