A Ramp Labs apresenta uma nova solução para a partilha de memória entre múltiplos agentes, reduzindo o consumo de tokens em até 65%

GateNews

Notícias do Gate News, a 11 de abril, a empresa de infraestruturas de IA Ramp Labs publicou resultados de investigação «Latent Briefing», permitindo uma partilha eficiente de memória entre sistemas multiagente através da compressão direta da cache KV de grandes modelos. Isto faz uma grande redução do consumo de Tokens sem perda de exatidão. Nas arquiteturas multiagente mais comuns, o orquestrador (Orchestrator) decompõe tarefas e chama repetidamente modelos de trabalhadores (Worker). À medida que a cadeia de inferência se vai tornando mais longa, a quantidade de Tokens cresce de forma exponencial. A ideia central do Latent Briefing é, com o auxílio do mecanismo de atenção, identificar as partes verdadeiramente essenciais no contexto e eliminar informação redundante diretamente na camada de representação, em vez de depender de resumos de LLM que são lentos ou de pesquisas RAG com baixa estabilidade. Nos testes de referência do LongBench v2, o método teve um desempenho notável: o consumo de Tokens do modelo Worker diminuiu 65%, a mediana de Tokens poupados em documentos de comprimento médio (32k a 100k) atingiu 49%, a exatidão global melhorou cerca de 3 pontos percentuais face à linha de base e o tempo adicional para cada compressão foi apenas de cerca de 1,7 segundos, o que equivale a acelerar aproximadamente 20 vezes em relação ao algoritmo original. O experimento usou Claude Sonnet 4 como orquestrador e Qwen3-14B como modelo de trabalhador, cobrindo cenários de documentos variados, como artigos académicos, documentos jurídicos, romances e relatórios governamentais. O estudo também descobriu que o limiar de compressão ideal varia em função da dificuldade da tarefa e do comprimento do documento — para tarefas difíceis, é mais adequado uma compressão mais agressiva para filtrar ruído de inferência oportunista; para documentos longos, é mais apropriada uma compressão mais ligeira para preservar informação-chave dispersa.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Walrus Lança o MemWal SDK para Memória de Agentes de IA

A Walrus lançou o MemWal, um SDK projetado para abordar limitações na memória agentic, trazendo verificabilidade, disponibilidade, portabilidade e compartilhabilidade para como agentes de IA armazenam e acessam informações, segundo Abinhav Garg, Product Manager do Mysten Labs Group. Memória verificável e portátil

CryptoFrontier32m atrás

Oobit lança cartões Visa de agentes de IA com suporte para gastos diretos em USDT

De acordo com o The Block, a Oobit, startup de carteiras lastreadas pela Tether, lançou hoje os “Agent Cards” virtuais, que permitem que agentes de IA gastem USDT diretamente em estabelecimentos compatíveis com Visa, sem conversão de moeda ou aprovação por transação. Cada cartão é atribuído a um único agente e inclui limites de gasto

GateNews3h atrás

AethirClaw Lança CARA, Agente de IA Cripto Pré-configurado e Implantável em 5 Minutos, em 30 de Abril

De acordo com o anúncio oficial da AethirClaw em 30 de abril, a empresa lançou a CARA, um agente de IA cripto pré-configurado, executado na infraestrutura de GPU descentralizada da Aethir. A plataforma oferece mais de 50 habilidades integradas para monitoramento de mercado em tempo real, rastreamento de carteiras de whales, on-chain

GateNews5h atrás

O agente Hermes da Nous Research adiciona um recurso de Curador para retirar automaticamente habilidades não utilizadas após 30 dias

De acordo com a Nous Research, a estrutura Hermes Agent adicionou um recurso de Curator em 29 de abril para gerenciar automaticamente o ciclo de vida das habilidades. O recurso aborda uma limitação anterior em que agentes de IA poderiam acumular habilidades indefinidamente, inchando os prompts do sistema sem remover as que não eram usadas. Curator

GateNews6h atrás

Grok lança modo beta do Imagine Agent com Canvas infinito para fluxos de trabalho criativos de múltiplas etapas

De acordo com relatos monitorados pela Beating, a versão web do Grok está sendo disponibilizada com o Imagine Agent Mode (beta), uma nova ferramenta baseada em agentes criada sobre as capacidades atuais de geração de imagens e vídeos da xAI. A interface substitui a janela de chat tradicional por uma tela infinita e inclui quatro opções predefinidas

GateNews7h atrás

Billions Network se torna o terceiro maior ecossistema de agentes, com mais de 18.000 agentes implantados

De acordo com a BlockBeats, em 30 de abril, a Billions Network se tornou o terceiro maior ecossistema de Agent por quantidade de implantações, superando a Ethereum com mais de 18.000 agents implantados. A rede fica atrás apenas da BNB Chain e da Base. A Billions também sincronizou o recurso de identidade verificada do Agent em @w

GateNews9h atrás
Comentário
0/400
Sem comentários