L'IA Open Source en Chine est en plein essor, Kimi K2 Thinking surpasse GPT-5 dans plusieurs performances.
Kimi K2 Thinking est un modèle d'experts mixtes (MoE) basé sur un trillion de paramètres, activant 32 milliards de paramètres à chaque inférence. Il combine le raisonnement à long terme avec l'utilisation d'outils structurés, capable d'effectuer 200 à 300 appels d'outils consécutifs sans intervention humaine.
Selon les résultats des tests publiés par la Face Cachée de la Lune, K2 Thinking a obtenu :
44.9% - Humanity’s Last Exam (HLE), atteint le niveau le plus avancé de l'industrie
60.2% - BrowseComp (test de recherche et de raisonnement du réseau d'agents)
71,3 % -SWE-Bench Verified et 83,1 % - LiveCodeBench v6 (évaluation clé de programmation)
56.3% -Seal-0 (Référence d'extraction d'informations du monde réel)
C'est comme une revanche des racines, brisant directement le monopole des grandes familles. La puissance de l'ouverture et de l'innovation est le facteur clé de la victoire.
Open Source AI, sera sans aucun doute le seul moyen de résister au monopole.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
L'IA Open Source en Chine est en plein essor, Kimi K2 Thinking surpasse GPT-5 dans plusieurs performances.
Kimi K2 Thinking est un modèle d'experts mixtes (MoE) basé sur un trillion de paramètres, activant 32 milliards de paramètres à chaque inférence. Il combine le raisonnement à long terme avec l'utilisation d'outils structurés, capable d'effectuer 200 à 300 appels d'outils consécutifs sans intervention humaine.
Selon les résultats des tests publiés par la Face Cachée de la Lune, K2 Thinking a obtenu :
44.9% - Humanity’s Last Exam (HLE), atteint le niveau le plus avancé de l'industrie
60.2% - BrowseComp (test de recherche et de raisonnement du réseau d'agents)
71,3 % -SWE-Bench Verified et 83,1 % - LiveCodeBench v6 (évaluation clé de programmation)
56.3% -Seal-0 (Référence d'extraction d'informations du monde réel)
C'est comme une revanche des racines, brisant directement le monopole des grandes familles. La puissance de l'ouverture et de l'innovation est le facteur clé de la victoire.
Open Source AI, sera sans aucun doute le seul moyen de résister au monopole.