新浪微博开源 VibeThinker-3B,3B 参数模型匹配前沿推理表现

据称 Beating intelligence,新浪微博团队最近开源了 VibeThinker-3B,这是一个具有 30 亿参数的推理模型,在数学和代码任务上实现了前沿级表现,其部分指标接近或超过 DeepSeek V3.2、GLM-5 和 Gemini 3 Pro。

该模型基于 Qwen2.5-Coder-3B,采用谱到信号的训练流水线,并使用 64K 推理空间。在推理过程中通过自蒸馏以及逐步级别的验证,VibeThinker-3B 将 AIME26 数学测试分数从 94.3 提升至 97.1。

免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论