O co-matemático de IA do Google DeepMind atinge 47,9% no FrontierMath Tier 4, supera o GPT-5.5 Pro e resolve 3 problemas previamente insolúveis

A Google DeepMind lançou o co-matemático de IA, um assistente de investigação matemática multi-agente, alcançando 47,9% de precisão no benchmark FrontierMath Tier 4, superando o recorde anterior do GPT-5.5 Pro de 39,6% a 9 de maio. O sistema resolveu 23 de 48 problemas, incluindo 3 que todos os modelos anteriores falharam em resolver. Construído sobre o Gemini 3.1 Pro, a arquitetura usa um design hierárquico com um agente coordenador de projeto que distribui tarefas por sub-agentes encarregues de pesquisa de literatura, codificação e raciocínio, com vários agentes avaliadores a validar as provas antes da submissão.

A Epoch AI realizou testes cegos, impedindo a equipa da DeepMind de ver os problemas, com cada questão permitida até 48 horas de computação. Numa aplicação no mundo real, o matemático Marc Lackenby usou o sistema para resolver uma conjectura em aberto do Kourovka Notebook, demonstrando o seu valor prático para investigação. O sistema está atualmente disponível para um número limitado de matemáticos em testes beta.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A Exaforce levanta $125M Series B com $725M avaliação para expandir a plataforma de cibersegurança com IA

De acordo com a TechCrunch, a Exaforce angariou 125 milhões de dólares numa ronda de financiamento Série B, com uma avaliação de 725 milhões de dólares, à medida que as empresas aumentam os gastos em ferramentas para detetar e responder a ciberataques. A ronda foi liderada pela HarbourVest, Peak XV, Mayfield, Khosla Ventures e Seligman Ventures, elevando o financiamento total da startup de cibersegurança com IA para 200 milhões de dólares após a sua Série A de 75 milhões, concluída há cerca de u

GateNews18m atrás

O CEO da Nvidia, Jensen Huang, vai acompanhar Trump na visita à China a 13 de maio

De acordo com a confirmação da Casa Branca, o CEO da Nvidia, Jensen Huang, irá acompanhar o Presidente Trump à China a 13 de maio. Huang já embarcou no Air Force One para viajar para a China.

GateNews24m atrás

A Meta testa o assistente @meta.ai no Threads em cinco países

A Meta está a testar uma nova funcionalidade do Threads que permite que utilizadores com contas públicas mencionem @meta.ai em publicações e respostas para receberem respostas e contexto, segundo a TechCrunch. O lançamento em beta está atualmente ativo na Malásia, Arábia Saudita, México, Argentina e Singapura. Funcionalidade da funcionalidade A ferramenta @meta.ai foi concebida para fornecer informação em tempo real sobre tendências e notícias de última hora. Quando é mencionada, a conta publica

CryptoFrontier57m atrás

A Anthropic lança 12 plugins legais para o Claude a 12 de maio

De acordo com a Bloomberg, a Anthropic lançou 12 plugins legais para o Claude em 12 de maio, com análise de contratos, preparação para o exame de licenciamento profissional e integrações com DocuSign, Thomson Reuters e Harvey. Os plugins estarão disponíveis para clientes pagantes através do Claude Cowork, o produto de IA para escritório da Anthropic, e através de serviços de terceiros construídos sobre o Claude.

GateNews1h atrás

A Google Lança o Googlebook, Nova Categoria de Cadernos com IA que Encerra uma Era de 15 Anos de Chromebooks

Segundo Beating, a Google lançou oficialmente o Googlebook, uma nova categoria de cadernos que marca o fim da era de 15 anos do Chromebook centrada na cloud. O dispositivo combina as plataformas ChromeOS e Android, com suporte nativo por Gemini, e com os primeiros equipamentos a chegar este outono. O Googlebook será fabricado pela Acer, Asus, Dell, HP e Lenovo, e cada modelo terá a distinta faixa de luz Glowbar da Google como identificador visual da nova categoria. A medida representa a resposta

GateNews1h atrás
Comentar
0/400
Nenhum comentário