Gate News 消息,3 月 17 日,Mistral AI 今日发布 Leanstral,这是首个专为形式化验证工具 Lean 4 设计的开源代码 Agent。该模型的核心创新在于,AI 生成代码的同时可输出可被 Lean 4 自动校验的形式化证明,从而绕开传统 AI 代码生成中人工审查的瓶颈环节。
Leanstral 采用稀疏 MoE 架构,拥有 120B 总参数和 6B 激活参数,以 Apache 2.0 协议开源,并针对 lean-lsp-mcp 进行了专项训练优化。用户可在 Mistral Vibe 中通过命令 /leanstall 零配置启动,或通过免费 API 端点 labs-leanstral-2603 调用,同时支持下载权重进行自部署。
Mistral 同步发布了新评估基准 FLTEval,以 Lean 4 社区的费马大定理形式化项目为测试场景。性能对比数据显示:Leanstral pass@2 以 36 美元成本得分 26.3,超过成本 549 美元的 Claude Sonnet 4.6(23.7 分);pass@16 以 290 美元成本得分 31.9,领先 Sonnet 8 分,而 Claude Opus 4.6 需 1,650 美元才能达到 39.6 分。在开源模型中,Qwen3.5-397B-A17B 需运行 4 次才能达到 25.4 分,仍低于 Leanstral pass@2 的表现。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
Chainlink 从德勤获得 SOC 2 2 型认证,加强安全标准
德勤完成了对 Chainlink CCIP 的 SOC 2 2 型审计;Chainlink 成为唯一达到该安全标准的数据与互操作性预言机平台,并且持有 SOC 2 1 型以及 ISO/IEC 27001:2022 认证。
本文报道,德勤 & Touche LLP 已完成对 Chainlink 的跨链互操作协议 (CCIP) 以及数据馈送的 SOC 2 2 型审计,使 Chainlink 成为唯一满足该标准的数据与互操作性预言机平台。文章还指出,Chainlink 持有 SOC 2 1 型和 ISO/IEC 27001:2022 认证,强调其达到企业级安全与合规水平。
GateNews44 分钟前
Sunny Side Labs推出Privacy Boost,为Optimism主网提供企业级隐私解决方案
Sunny Side Labs在Optimism主网推出Privacy Boost,这是一款基于SDK的隐私工具,使用ZK和TEEs,并针对监管方提供选择性披露;面向企业;无需密码学专长。
摘要:Sunny Side Labs发布了Privacy Boost,这是一款面向企业的Optimism主网隐私SDK。它将零知识证明和可信执行环境结合,并通过选择性披露来保护交易隐私,同时让监管方仅能访问所需数据。该方案面向企业和机构,开箱即用的SDK降低了对密码学知识的要求。该举措是在2025年年底以来与Optimism持续合作的基础上推出的,表明主网上将有更广泛的隐私集成。
GateNews2小时前
VOOI Light 将于 5月18日停止服务:因基础设施提供商决定终止链抽象解决方案
Gate News 消息,4月22日——VOOI,一家由 YZi Labs 支持的去中心化交易所,宣布由于 OneBalance(其链抽象 (CA) 基础设施提供商)停止其链抽象解决方案,VOOI Light 将于 5月18日停止运营。
用户需要在 5月18日之前关闭所有未完成订单,并从指定页面提取资金。如果未能执行,可能导致资金损失。
GateNews2小时前
Sandoll 推出 Sandoll Square:AI-Web3 平台,助力实现去中心化数字资产管理
Sandoll 发布 Sandoll Square,成立新的 AI 和 Web3 部门,以构建去中心化平台生态系统;将由 AI 驱动的内容处理与区块链融合,实现无缝的数据管理和互操作性;目前正在招募 CEO 和 CTO 等职位。
GateNews2小时前
River 完成 S4 赛季,发放 2 亿枚代币奖励,并推出 S5
River 的 S4 赛季吸引了 25 万+ 用户,并分发了 2 亿个 River 代币;质押在 RIVER 中约达到 $30 百万美元,S4 的领取将随后进行,而 S5 现已上线。
GateNews2小时前
0G 整合阿里雲千文 LLM,鏈上 AI 代理首獲商業大模型存取能力
0G 基金会于 4 月 21 日宣布与阿里云正式合作,将千文(Qwen)大型语言模型引入去中心化基础设施,使 AI 代理能够直接从链上环境调用商业级 LLM。开发者将通过代币门控存取机制使用千文推理功能,有效地将 LLM 调用转换为链上可计量的操作,使千文成为首批嵌入去中心化代理框架的主要商业 LLM 之一。
Market Whisper3小时前