Ramp Labs propose une nouvelle solution de partage de mémoire entre agents multiples, réduisant la consommation de tokens maximale de 65%

GateNews

Nouvelles de la Gate News : le 11 avril, la société d’infrastructure IA Ramp Labs a publié ses résultats de recherche « Latent Briefing ». En compressant directement le cache KV des grands modèles, elle permet un partage efficace de la mémoire entre systèmes multi-agents, tout en réduisant fortement la consommation de Tokens sans perte de précision. Dans les architectures multi-agents courantes, l’orchestrateur (Orchestrator) décompose les tâches et appelle de manière répétée le modèle de travail (Worker). À mesure que la chaîne d’inférence s’allonge, la quantité de Tokens augmente de façon exponentielle. L’idée centrale de Latent Briefing consiste à utiliser le mécanisme d’attention pour repérer, dans le contexte, les parties réellement essentielles, puis à supprimer directement les informations redondantes au niveau de la représentation, plutôt que de s’appuyer sur des résumés de LLM lents ou sur des recherches RAG peu stables. Lors des tests sur le banc LongBench v2, la méthode obtient d’excellents résultats : la consommation de Tokens du modèle Worker baisse de 65 %, et pour les documents de longueur moyenne (32k à 100k), le gain médian de Tokens atteint 49 %. Dans l’ensemble, la précision s’améliore d’environ 3 points par rapport à la base de référence, tandis que le surcoût de temps induit par chaque compression ne représente qu’environ 1,7 seconde, soit un gain de vitesse d’environ 20 fois par rapport à l’algorithme original. L’expérience utilise Claude Sonnet 4 comme orchestrateur et Qwen3-14B comme modèle Worker, couvrant des scénarios de documents variés : articles académiques, actes et documents juridiques, romans et rapports gouvernementaux. L’étude montre également que le seuil optimal de compression varie selon la difficulté de la tâche et la longueur du document : les cas difficiles se prêtent à une compression plus agressive pour filtrer le bruit de raisonnement spéculatif, tandis que les documents longs sont mieux servis par une compression légère afin de préserver des informations clés dispersées.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Le mainnet KITE AI se lance sur Avalanche le 29 avril en tant que blockchain d’agents IA conçue pour un usage spécifique

Selon Altcoin Buzz, le mainnet KITE AI a été lancé sur Avalanche le 29 avril, introduisant une blockchain dédiée de couche 1 conçue pour des agents IA autonomes. La plateforme intègre des capacités d’identité et de paiement natif afin de permettre aux agents IA de fonctionner, d’effectuer des transactions et de se développer sans friction. Avalanch

GateNewsIl y a 57m

B.AI et deBridge s’associent pour construire une infrastructure inter-chaînes pour les Agents IA

Selon ChainCatcher, B.AI et deBridge ont annoncé un partenariat stratégique le 29 avril afin de développer une infrastructure inter-chaînes pilotée par l’intention. La collaboration vise à offrir une exécution inter-chaînes fluide pour une économie d’Agents IA évolutive. Le modèle 0-TVL de deBridge et la technologie inter-chaînes sans frais de gaz soutiendront le développement de systèmes de trading autonomes efficaces et sûrs du partenariat, en accélérant l’exécution inter-chaînes à l’ère des Agents IA.

GateNewsIl y a 2h

Parallel lève $100M série B de Parag Agrawal pour l’infrastructure de recherche d’agents IA

Selon Beating, Parallel Web Systems, fondée par l’ancien PDG de Twitter Parag Agrawal, a achevé une levée de fonds de $100 million de série B menée par Sequoia Capital, valorisant l’entreprise à $2 milliard. Kleiner Perkins, Index Ventures et Khosla Ventures ont également participé. Le financement intervient six mois après que la société a levé million en série A à une valorisation de million, la portant presque à tripler. Parallel construit une infrastructure de recherche web pour des agents d’IA qui gèrent des tâches de recherche complexes telles que l’analyse d’investissements et le traitement de demandes d’assurance. La société emploie actuellement environ 50 personnes et sert plus de 100 000 développeurs. La société d’IA juridique Harvey, un client clé, utilise l’infrastructure de Parallel pour contrôler quels sites web les agents peuvent consulter.

GateNewsIl y a 2h

0G Labs lance 0G Private Computer pour une inférence IA préservant la confidentialité avec une vérification TEE

Message de Gate News, 29 avril — 0G Labs a officiellement lancé 0G Private Computer, un service d’inférence préservant la confidentialité pour les agents IA et les développeurs, alimenté par la technologie Trusted Execution Environment (TEE). Les utilisateurs peuvent accéder au service via pc.0g.ai. La plateforme utilise des processeurs Intel TDX et

GateNewsIl y a 3h

La Fondation Avalanche soutient W3 alors que 200 000 workflows passent en ligne, accélérant le basculement vers la finance de l’IA

W3 a lancé une plateforme de contrôle sur le réseau Avalanche, conçue pour gérer la finance pilotée par des agents. Points clés W3.io a lancé une plateforme de contrôle IA sur Avalanche, qui traite déjà 200 000 flux de travail d’entreprise quotidiens. W3 et Avalanche comblent un écart de responsabilisation pour 70+ blockchains par

CoinpediaIl y a 4h

Rapport de recherche Crypto de a16z : le taux d’exploitation des vulnérabilités DeFi par des agents IA atteint 70%

Selon le rapport de recherche publié par a16z Crypto le 29 avril, sous condition doter les agents IA de connaissances structurées propres à un domaine, le taux de réussite de la reproduction d’une faille de manipulation du prix de l’Ethereum atteint 70 % ; dans un environnement bac à sable sans aucune connaissance de domaine, le taux de réussite n’est que de 10 %. Le rapport enregistre également des cas où des agents IA contournent de manière indépendante les limites du bac à sable pour accéder à des informations sur les transactions futures, ainsi que des schémas de défaillance systématiques lorsque les agents parviennent à établir des plans d’attaque multi-étapes et rentables.

MarketWhisperIl y a 6h
Commentaire
0/400
Aucun commentaire