Ramp Labs mengajukan solusi baru untuk berbagi memori antar-multiagen, konsumsi Token tertinggi turun 65%

GateNews

Berita Gerbang, 11 April, perusahaan infrastruktur AI Ramp Labs merilis hasil riset “Latent Briefing”, yang memungkinkan berbagi memori yang efisien antar sistem multi-agen dengan mengompresi langsung cache KV dari model besar. Dengan tidak mengorbankan akurasi, konsumsi Token diturunkan secara signifikan. Dalam arsitektur multi-agen arus utama, orkestrator (Orchestrator) memecah tugas dan berulang kali memanggil model pekerja (Worker); seiring rantai penalaran terus diperpanjang, jumlah Token meningkat secara eksponensial. Gagasan inti dari Latent Briefing adalah menggunakan mekanisme atensi untuk mengidentifikasi bagian konteks yang benar-benar penting, lalu membuang informasi redundan langsung pada level representasi, bukan mengandalkan ringkasan LLM yang lambat atau penelusuran RAG yang kurang stabil. Pada pengujian benchmark LongBench v2, metode ini menunjukkan performa yang menonjol: konsumsi Token model Worker turun 65%, penghematan Token untuk dokumen berukuran menengah (32k hingga 100k) mencapai median 49%, akurasi keseluruhan meningkat sekitar 3 poin persentase dibanding baseline, sementara waktu tambahan untuk setiap kompresi hanya sekitar 1,7 detik—lebih cepat kira-kira 20 kali dibanding algoritma asli. Eksperimen menggunakan Claude Sonnet 4 sebagai orkestrator dan Qwen3-14B sebagai model pekerja, mencakup skenario dokumen beragam seperti makalah akademik, dokumen hukum, novel, serta laporan pemerintah. Penelitian juga menemukan bahwa ambang kompresi optimal berbeda tergantung tingkat kesulitan tugas dan panjang dokumen—masalah yang sulit cocok untuk kompresi yang agresif guna menyaring kebisingan penalaran yang bersifat spekulatif, sementara dokumen panjang lebih cocok untuk kompresi ringan guna mempertahankan informasi kunci yang tersebar.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Grok Meluncurkan Mode Beta Imagine Agent dengan Infinite Canvas untuk Alur Kerja Kreatif Multi-Langkah

Menurut laporan yang dipantau oleh Beating, versi web Grok sedang melakukan peluncuran Imagine Agent Mode (beta), sebuah alat berbasis agen baru yang dibangun di atas kemampuan pembuatan gambar dan video yang sudah ada dari xAI. Antarmukanya menggantikan jendela chat tradisional dengan kanvas tak terbatas dan mencakup empat preset

GateNews40menit yang lalu

Billions Network Menjadi Ekosistem Agen Terbesar Ketiga dengan 18.000+ Agen Diterapkan

Menurut BlockBeats, pada 30 April, Billions Network telah menjadi ekosistem Agent terbesar ketiga berdasarkan jumlah deployment, melampaui Ethereum dengan lebih dari 18.000 agent yang dideploy. Jaringan ini hanya berada di belakang BNB Chain dan Base. Billions juga telah menyinkronkan fitur identitas Agent terverifikasinya di seluruh w

GateNews2jam yang lalu

Ant International Menghubungkan 150 Juta Pedagang Melalui Pembayaran Berbasis AI

Ant International mengatakan jaringan pembayarannya menghubungkan lebih dari 150 juta pedagang dengan lebih dari 2 miliar akun konsumen di seluruh dunia, mendukung lebih dari 300 metode pembayaran di 220 pasar. Perusahaan ini menangani lebih dari 20 juta transaksi per hari rata-rata dan sedang melakukan ekspansi di Asia,

CryptoFrontier6jam yang lalu

OKX Meluncurkan Protokol Pembayaran Agen untuk Perdagangan Bot AI

Bursa kripto OKX memperkenalkan Agent Payments Protocol (APP) pada Rabu, sebuah standar terbuka yang dirancang agar agen AI dapat menjalankan siklus bisnis penuh termasuk pembayaran, negosiasi, dan penyelesaian sengketa. Protokol ini mengikuti penawaran serupa dari para kompetitor termasuk x402, yang diinkubasi oleh

CryptoFrontier7jam yang lalu

Kite meluncurkan mainnet, menghadirkan lapisan kontrol pembayaran untuk lisensi AI Agent

Berdasarkan pengumuman resmi Kite, infrastruktur pembayaran untuk ekonomi AI Agent, Kite, resmi meluncurkan mainnet pada 30 April. Selama masa peluncuran mainnet, Kite Treasury membayar biaya jaringan sehingga pengguna tidak perlu merasakan gas. Kite juga membuka kepada publik Kite Agent Passport, sebagai lapisan otorisasi dan kontrol pembayaran untuk Agent.

MarketWhisper7jam yang lalu

Sesi Stripe 2026: Bermitra dengan Google untuk menghadirkan belanja berbasis AI, dompet Link mendukung pembayaran mandiri untuk agent

Stripe mengumumkan 288 fitur baru dalam Sessions 2026, membangun fondasi infrastruktur bisnis native AI secara menyeluruh: mendorong integrasi belanja berbasis AI bersama Google, pembayaran mandiri oleh AI Agent, Link Wallet untuk melindungi informasi pembayaran dengan kartu virtual sekali pakai, serta mengharuskan pengguna menyetujui setiap transaksi satu per satu; Stripe Treasury ditingkatkan sepenuhnya, mendukung multi-mata uang, transfer global, transfer gratis pada hari yang sama, insentif stablecoin, dan cashback 2% tunai, yang bertujuan menjadi lapisan pembayaran inti di era ekonomi AI.

ChainNewsAbmedia7jam yang lalu
Komentar
0/400
Tidak ada komentar