智譜的 GLM-5.2 在 AA 基準測試中以 51 分登頂開源模型,並在 GDPval 測試中與 GPT-5.5 相匹配
根據 Beating AI 監測,智譜(Zhipu)的最新 GLM-5.2 模型在 Artificial Analysis 的智慧基準 v4.1 中以 51 分排名首位,超越 MiniMax-M3(44 分)與 DeepSeek V4 Pro(44 分)。在 GDPval-AA v2 測試(模擬真實世界的知識工作)中,GLM-5.2 取得 1,524 分(人類基準:1,000),在 xhigh 推理模式下與閉源前沿模型 GPT-5.5 相匹配,並且超越 MiniMax-M3(1,418 分)與 DeepSeek V4 Pro(1,328 分)。 該模型具備 744B 總參數、40B 啟用參數,並將上下文視窗從 200K 擴展至 1M tokens。GLM-5.2 採用 MIT 授權,部署於多個平台,包括智譜官方 API、SiliconFlow 與 DeepInfra,平均每項任務成本約為每任務 0.46 美元。