Sina Weibo publica con código abierto VibeThinker-3B, un modelo con 3B parámetros que coincide con el rendimiento de razonamiento de la frontera

Según Beating intelligence, el equipo de Sina Weibo recientemente publicó de forma open-source VibeThinker-3B, un modelo de razonamiento de 3 mil millones de parámetros que logra un rendimiento de nivel pionero en tareas de matemáticas y codificación, con algunas métricas acercándose o superando a DeepSeek V3.2, GLM-5 y Gemini 3 Pro.

Construido sobre Qwen2.5-Coder-3B, el modelo utiliza un pipeline de entrenamiento de Spectrum-to-Signal con un espacio de razonamiento de 64K. Mediante auto-destilación y verificación a nivel de pasos durante la inferencia, VibeThinker-3B mejoró las puntuaciones de las pruebas de matemáticas AIME26 de 94,3 a 97,1.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios