La IA de Código abierto en China está en auge, Kimi K2 Thinking ha superado a GPT-5 en varias métricas.
Kimi K2 Thinking se basa en un modelo de expertos mixtos (MoE) con billones de parámetros, activando 32 mil millones de parámetros en cada inferencia. Combina el razonamiento a largo plazo con el uso de herramientas estructuradas, siendo capaz de realizar de 200 a 300 llamadas a herramientas consecutivas sin intervención humana.
Según los resultados de las pruebas publicados por la Cara Oculta de la Luna, K2 Thinking ha obtenido:
44.9% - Último Examen de la Humanidad (HLE), alcanzando el nivel más avanzado de la industria
60.2% - BrowseComp (pruebas de búsqueda e inferencia de redes de agentes inteligentes)
71.3% -SWE-Bench Verified y 83.1% - LiveCodeBench v6 (evaluación de programación clave)
56.3% -Seal-0 (Referencia de evaluación de recuperación de información del mundo real)
Esta sensación es un ataque de los de abajo, que rompe directamente el monopolio de las grandes familias; la poderosa apertura e innovación son factores clave para el éxito.
Código abierto AI, sin duda se convertirá en la única forma de resistir el monopolio
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
La IA de Código abierto en China está en auge, Kimi K2 Thinking ha superado a GPT-5 en varias métricas.
Kimi K2 Thinking se basa en un modelo de expertos mixtos (MoE) con billones de parámetros, activando 32 mil millones de parámetros en cada inferencia. Combina el razonamiento a largo plazo con el uso de herramientas estructuradas, siendo capaz de realizar de 200 a 300 llamadas a herramientas consecutivas sin intervención humana.
Según los resultados de las pruebas publicados por la Cara Oculta de la Luna, K2 Thinking ha obtenido:
44.9% - Último Examen de la Humanidad (HLE), alcanzando el nivel más avanzado de la industria
60.2% - BrowseComp (pruebas de búsqueda e inferencia de redes de agentes inteligentes)
71.3% -SWE-Bench Verified y 83.1% - LiveCodeBench v6 (evaluación de programación clave)
56.3% -Seal-0 (Referencia de evaluación de recuperación de información del mundo real)
Esta sensación es un ataque de los de abajo, que rompe directamente el monopolio de las grandes familias; la poderosa apertura e innovación son factores clave para el éxito.
Código abierto AI, sin duda se convertirá en la única forma de resistir el monopolio