Anthropic Chuẩn bị Opus 4.7 và Studio AI Toàn Diện—Trong khi Đang Ngồi Trên Một Điều Gây Sợ Hãi Hơn Nhiều

Tóm tắt ngắn gọn

  • Anthropic đang chuẩn bị ra mắt Claude Opus 4.7 và một công cụ thiết kế AI cho website và trình bày
  • Claude Mythos vẫn là mô hình tiên phong thực sự của Anthropic, và công ty sẽ không công khai phát hành nó.
  • Ngành công nghiệp vẫn chưa thể đo lường chính xác sự tiến bộ của AI, khiến các tuyên bố về lợi ích của Opus 4.7 khó được xác minh.

Anthropic đang chuẩn bị phát hành Claude Opus 4.7 cùng với một công cụ thiết kế dựa trên AI mới cho phép người dùng xây dựng website, trình bày và trang đích bằng các lệnh tiếng Anh đơn giản—tin này khiến cổ phiếu của Adobe, Wix và Figma giảm vào thứ Hai, theo The Information. Các sản phẩm có thể ra mắt ngay trong tuần này, một người am hiểu kế hoạch cho biết với The Information. Công cụ thiết kế hướng tới cả nhà phát triển lẫn người dùng không kỹ thuật, đặt nó vào cuộc đối đầu với các startup như Gamma và Stitch của Google. Anthropic đã không phản hồi yêu cầu bình luận của Decrypt.

Opus 4.7 thậm chí chưa phải là mô hình mạnh nhất của Anthropic. Danh hiệu đó thuộc về Claude Mythos—một “quái vật” tập trung vào an ninh mạng mà công ty đang âm thầm chuyển giao cho các công ty an ninh được chọn lọc, trong khi giữ nó khỏi công chúng.  Viện An ninh AI của Vương quốc Anh gần đây đã đánh giá trước Mythos và phát hiện nó có thể tự động thực hiện các cuộc tấn công mạng tinh vi với tốc độ mà các mô hình khác chưa từng đạt được. Nó trở thành AI đầu tiên hoàn thành “The Last Ones,” một mô phỏng tấn công mạng doanh nghiệp gồm 32 bước mà các đội đỏ của con người thường mất 20 giờ để hoàn thành. Mythos thực hiện thành công trong 3 trên 10 lần thử, trung bình 22 trong 32 bước—so với Opus 4.6 là 16. Điều này quan trọng không chỉ trong an ninh doanh nghiệp. Việc đo lường khả năng thực sự của AI đã trở thành một nỗi đau đầu toàn ngành. OpenAI gần đây gọi benchmark lập trình hàng đầu là “ô nhiễm,” nhưng các mô hình vẫn tiếp tục so sánh dựa trên các bài kiểm tra đó. Một đánh giá riêng của ARC-AGI-3 cho thấy Gemini đạt 0,37% và GPT-5.4 đạt 0,26%—trong khi con người đạt 100%. Kết quả là một bối cảnh nơi các chuẩn mực bị tranh cãi và vẫn được sử dụng làm bằng chứng, khiến việc đưa ra các tuyên bố về lợi ích của Opus 4.7 trở nên khó khăn cho đến khi Anthropic phát hành một bản mô hình chi tiết.

Mối quan hệ giữa Opus và Mythos gần gũi hơn nhiều so với nhiều người nghĩ. Anthropic xây dựng các mô hình tiên phong của mình bằng cách tinh chỉnh dựa trên dòng Opus—cùng nền tảng cung cấp các sản phẩm Claude công khai, sau đó được thử nghiệm và củng cố thành Mythos. Opus 4.7 là nền tảng mà cuối cùng sẽ được “đánh bóng” để trở thành một chiến binh an ninh mạng. Ngoài ra, các nỗ lực của Anthropic ngày càng hướng tới phát triển và sử dụng trong doanh nghiệp. Việc rò rỉ mã nguồn Claude, phát hành hệ thống kỹ năng và giao thức MCP, tập trung vào AI có khả năng hành động và chú trọng các benchmark lập trình càng làm rõ điều này hơn. Mặc dù Anthropic chưa chính thức công bố, các rò rỉ này củng cố xu hướng chuyển đổi từ nhà cung cấp LLM sang một mô hình “studio AI” toàn diện, nơi Claude không chỉ tạo ra văn bản mà còn xây dựng và triển khai các sản phẩm hoàn chỉnh.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim