Karpathy:AI 能力认知出现严重断层,免费版与前沿 Agent 是“完全不同的产品”

鏈新聞abmedia

前 Tesla AI 总监、OpenAI 创始成员 Andrej Karpathy 于 4 月 9 日在 X 上发表长文,指出公众对 AI 能力的认知正出现严重分裂。他认为,使用免费版 ChatGPT 的人和每天使用 Codex、Claude Code 等前沿 agent 工具的技术人员,实际上是在讨论“完全不同的产品”,但双方都认为自己看到的就是 AI 的全貌。

两个世界,两种 AI 认知

Karpathy 将目前的 AI 使用者分为两个群体。

第一类人在去年某个时间点试用了 ChatGPT 免费版,便以此形成对 AI 的整体印象。他们看到的是模型的各种失误——幻觉、搜索结果离谱、语音模式连“该开车还是走路去洗车”这种简单问题都搞砸。Karpathy 承认这些问题确实存在,但强调免费版与过时模型并不能代表 2026 年前沿 agent 模型的真实能力。

第二类人同时满足两个条件:付费使用最新的前沿 agent 模型(如 OpenAI Codex 或 Claude Code),并且在程序开发、数学、研究等技术领域专业使用。Karpathy 称这群人正经历高度的“AI 精神冲击”(AI Psychosis),因为这些模型在技术领域的近期进步“只能用惊人来形容”——你可以眼睁睁看着它们在一小时内解决原本需要数天甚至数周的程序架构问题。

为何进步集中在技术领域

Karpathy 解释了 AI 能力提升为何在程序开发等技术领域特别显著,而在搜索、写作、建议等一般用途上进步不那么明显。

原因有二:第一,技术领域提供了可验证的奖励函数(例如单元测试是否通过),这让强化学习训练得以有效运作;相比之下,写作品质的优劣难以明确判定。第二,技术领域在 B2B 场景中更具商业价值,因此 AI 公司将最大比例的团队资源投入在这些方向上。

两个群体互相听不懂对方在说什么

Karpathy 总结道,这两个群体正在“各说各话”。OpenAI 免费版语音模式搞砸日常问题,与 OpenAI 最高阶付费版 Codex 花一小时重构整个程序代码库或发现系统漏洞——这两件事同时为真。

他在后续回复中补充,有人向他提出一个观点:OpenClaw 事件之所以引发如此大的社会关注,正是因为它让大量非技术人员首次接触到了最新的 agent 模型,而这些人此前只知道 AI 等于 ChatGPT 网页版。

这篇文章 Karpathy:AI 能力认知出现严重断层,免费版与前沿 Agent 是“完全不同的产品” 最早出现在 链新聞 ABMedia。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
暂无评论