Tin Gate News, ngày 11 tháng 4, công ty cơ sở hạ tầng AI Ramp Labs công bố kết quả nghiên cứu “Latent Briefing”, đạt được chia sẻ bộ nhớ hiệu quả giữa các hệ đa tác tử thông qua việc nén trực tiếp bộ nhớ đệm KV của mô hình lớn, đồng thời giảm mạnh mức tiêu thụ Token mà không làm mất chính xác. Trong các kiến trúc đa tác tử phổ biến, bộ điều phối (Orchestrator) tách nhỏ nhiệm vụ và liên tục gọi đi gọi lại mô hình làm việc (Worker); khi chuỗi suy luận ngày càng kéo dài, lượng Token tăng theo cấp số nhân. Ý tưởng cốt lõi của Latent Briefing là sử dụng cơ chế chú ý để nhận diện phần thực sự quan trọng trong ngữ cảnh, rồi loại bỏ thông tin dư thừa ngay ở lớp biểu diễn, thay vì dựa vào bản tóm tắt của LLM vốn chậm hoặc truy xuất RAG kém ổn định. Trong bài kiểm thử chuẩn LongBench v2, phương pháp này thể hiện ấn tượng: lượng Token tiêu thụ của mô hình Worker giảm 65%, mức tiết kiệm Token cho các tài liệu độ dài trung bình (32k đến 100k) đạt trung vị 49%, độ chính xác tổng thể tăng khoảng 3 điểm phần trăm so với đường cơ sở, trong khi thời gian phát sinh cho mỗi lần nén chỉ khoảng 1,7 giây, nhanh hơn thuật toán gốc khoảng 20 lần. Thí nghiệm sử dụng Claude Sonnet 4 làm bộ điều phối và Qwen3-14B làm mô hình làm việc, bao phủ nhiều kịch bản tài liệu như bài báo học thuật, văn bản pháp lý, tiểu thuyết và báo cáo của chính phủ. Nghiên cứu cũng phát hiện rằng ngưỡng nén tối ưu thay đổi theo độ khó của nhiệm vụ và độ dài tài liệu—các bài toán khó phù hợp với nén mạnh để lọc nhiễu suy luận mang tính đầu cơ, còn tài liệu dài thì phù hợp hơn với nén nhẹ để lưu giữ các thông tin then chốt được phân tán.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
AethirClaw ra mắt CARA, đại lý AI crypto được cấu hình sẵn có thể triển khai trong 5 phút, vào ngày 30 tháng 4
Theo thông báo chính thức của AethirClaw vào ngày 30 tháng 4, công ty đã ra mắt CARA, một tác nhân AI crypto được cấu hình sẵn chạy trên hạ tầng GPU phi tập trung của Aethir. Nền tảng này có hơn 50 kỹ năng tích hợp sẵn, bao gồm giám sát thị trường theo thời gian thực, theo dõi ví cá voi, phân tích trên chuỗi
GateNews30phút trước
Tác nhân Hermes của Nous Research bổ sung tính năng Curator để tự động loại bỏ các kỹ năng không sử dụng sau 30 ngày
Theo Nous Research, khung Hermes Agent đã thêm tính năng Curator vào ngày 29 tháng 4 để tự động quản lý vòng đời kỹ năng. Tính năng này giải quyết hạn chế trước đó, khi các tác nhân AI có thể tích lũy kỹ năng vô thời hạn, làm phình các prompt hệ thống mà không loại bỏ những kỹ năng không còn được dùng.
Curator
GateNews1giờ trước
Grok ra mắt Chế độ Beta Imagine Agent với Canvas vô hạn cho các quy trình sáng tạo đa bước
Theo các báo cáo được Beating theo dõi, phiên bản web của Grok đang được triển khai tính năng Imagine Agent Mode (beta), một công cụ mới dựa trên tác nhân (agent) được xây dựng trên năng lực tạo hình ảnh và video hiện có của xAI. Giao diện thay thế cửa sổ chat truyền thống bằng một canvas vô hạn và bao gồm bốn bộ cài sẵn
GateNews3giờ trước
Billions Network Trở thành Hệ sinh thái Agent lớn thứ ba với hơn 18.000 agent đã triển khai
Theo BlockBeats, vào ngày 30 tháng 4, Billions Network đã trở thành hệ sinh thái Agent lớn thứ ba theo số lần triển khai, vượt qua Ethereum với hơn 18.000 agent đã được triển khai. Mạng đứng sau chỉ BNB Chain và Base. Billions cũng đã đồng bộ tính năng nhận dạng Agent đã được xác minh trên w
GateNews5giờ trước
Ant International Kết nối 150 triệu thương nhân thông qua thanh toán được hỗ trợ bởi AI
Ant International cho biết mạng lưới thanh toán của hãng liên kết hơn 150 triệu nhà bán với hơn 2 tỷ tài khoản người tiêu dùng trên toàn thế giới, hỗ trợ hơn 300 phương thức thanh toán tại 220 thị trường.
Công ty xử lý trung bình hơn 20 triệu giao dịch mỗi ngày và đang mở rộng tại châu Á,
CryptoFrontier8giờ trước
OKX ra mắt giao thức thanh toán cho tác nhân (Agent Payments) cho thương mại bot AI
Sàn giao dịch crypto OKX đã giới thiệu Giao thức Thanh toán Tác nhân (APP) vào hôm thứ Tư, một tiêu chuẩn mở được thiết kế để cho phép các tác nhân AI thực hiện trọn vẹn các chu kỳ kinh doanh bao gồm thanh toán, đàm phán và giải quyết tranh chấp. Giao thức này đi theo các đề xuất tương tự từ đối thủ cạnh tranh, bao gồm x402, được ươm tạo bởi
CryptoFrontier9giờ trước