A IA de Código aberto na China está em ascensão, e o Kimi K2 Thinking supera o GPT-5 em várias métricas.
Kimi K2 Thinking é um modelo de especialistas mistos (MoE) baseado em trilhões de parâmetros, ativando 32 bilhões de parâmetros a cada inferência. Combina raciocínio de longo alcance com o uso de ferramentas estruturadas, sendo capaz de executar de 200 a 300 chamadas de ferramentas consecutivas sem intervenção humana.
De acordo com os resultados dos testes divulgados pela Face Oculta da Lua, a K2 Thinking obteve:
44,9% - Último Exame da Humanidade (HLE), alcançando o nível mais avançado da indústria
60,2% - BrowseComp(inteligência de rede para pesquisa e teste de raciocínio)
71.3% -SWE-Bench Verified e 83.1% - LiveCodeBench v6 (avaliação de programação crítica)
56.3% -Seal-0(real world information retrieval benchmark)
Esta sensação é uma reviravolta das massas, quebrando diretamente o monopólio das grandes famílias; a forte abertura e inovação são fatores-chave para a vitória.
Código aberto AI, sem dúvida se tornará o único caminho para resistir ao monopólio
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
A IA de Código aberto na China está em ascensão, e o Kimi K2 Thinking supera o GPT-5 em várias métricas.
Kimi K2 Thinking é um modelo de especialistas mistos (MoE) baseado em trilhões de parâmetros, ativando 32 bilhões de parâmetros a cada inferência. Combina raciocínio de longo alcance com o uso de ferramentas estruturadas, sendo capaz de executar de 200 a 300 chamadas de ferramentas consecutivas sem intervenção humana.
De acordo com os resultados dos testes divulgados pela Face Oculta da Lua, a K2 Thinking obteve:
44,9% - Último Exame da Humanidade (HLE), alcançando o nível mais avançado da indústria
60,2% - BrowseComp(inteligência de rede para pesquisa e teste de raciocínio)
71.3% -SWE-Bench Verified e 83.1% - LiveCodeBench v6 (avaliação de programação crítica)
56.3% -Seal-0(real world information retrieval benchmark)
Esta sensação é uma reviravolta das massas, quebrando diretamente o monopólio das grandes famílias; a forte abertura e inovação são fatores-chave para a vitória.
Código aberto AI, sem dúvida se tornará o único caminho para resistir ao monopólio