Prime Intellect disponibiliza em open source um ambiente de agente autoevolutivo, gera mais de 8.000 ferramentas e aumenta a precisão no uso de ferramentas para 52,3%

GateNews

De acordo com Beating, o Prime Intellect disponibilizou em código aberto um agente geral, um ambiente de treinamento de agentes autoevolutivo que usa a geração de tarefas com mecânicas de dois jogadores. O sistema gerou automaticamente 4.504 tarefas e mais de 8.000 ferramentas únicas alternando entre um sintetizador de tarefas e um solucionador, categorizando os desafios em cinco níveis de dificuldade por meio de nove estratégias, incluindo condições de restrição, instruções com ruído e acoplamento entre entidades.

Nos testes, ao fazer o ajuste fino de um modelo com 30B de parâmetros em 4.400+ trajetórias do ambiente, a precisão de chamada de ferramentas melhorou de 18,9% para 52,3% no benchmark BFCL, demonstrando a capacidade da estrutura de gerar dados de treinamento semanticamente verificados sem depender de conjuntos de dados estáticos anotados manualmente.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários