扫码下载 APP
qrCode
更多下载方式
今天不再提醒

机制设计是人工智能与Web3之间缺失的桥梁

大多数AI对齐研究集中在使AI与其人类部署者保持一致:教导代理推断、遵循或推迟我们的偏好。但随着AI的应用不断增长,我们正进入一个不同的场景:代表个人和组织行动的代理网络,进行竞价、预测、调度、谈判和相互竞争。

摘要

  • AI对齐正从教导单一模型遵循人类偏好转向管理代表人类和组织行动、谈判和竞争的代理网络。
  • 真实的挑战在于协调在现实压力下(如串通和搭便车)的部分可信代理。Web3经过考验的工具——质押、拍卖、欺诈证明和激励设计——为解决这些协调问题提供了实用模板。
  • 使未来的AI系统保持一致意味着设计激励结构,而非追求完美模型。通过将验证和奖励直接嵌入代理交互中,可以自然地实现合作和诚实——这是从Web3的对抗环境中汲取的教训。

这种转变带来了与经典对齐同样艰难的问题:使这些代理彼此以及与集体利益保持一致。这是合作AI的领域:在稀缺、不确定和不断诱惑背叛的情况下,让异质、部分可信的代理协调。

这不是理论上的挑战。一旦代理开始从事具有经济价值的活动,它们就成为系统的一部分,在这里搭便车、串通和战略性隐瞒都能获利。将协调视为治理的事后考虑,正是系统性风险积累的原因。

Web3社区已经花费十年时间研究这一类问题。它假设世界上充满了愿意为了自身利益破坏系统的创造性对手。在Web3中应对这一威胁的方法是机制设计:质押、拍卖、承诺-揭示、欺诈证明和塞林点。

现在是AI社区与Web3建设者合作的时候了。如果将合作AI应用于机制设计,那么Web3经过考验的原语就是协调大规模代理网络的理想工具。目标不是为了新奇而结合加密和AI,而是让激励和验证成为代理交互的默认。

真正的风险不是流氓AI,而是协调失败

当AI互动时,灾难性场景看起来不像单一的“失控”模型,更像是任何Web3研究者都熟悉的协调失败:搭便车者消耗共享资源、成员之间的秘密串通、噪声淹没有用信号,以及激励偏离时的拜占庭行为。这些都不是电影场景,而是成本高昂的现实。

从AI研究的角度来看,这些问题在实验室中难以解决。在受控环境中模拟自利行为确实困难:人类和AI都难以预测,偏好会变化,沙箱中的代理通常过于合作以至于难以考验系统。

相比之下,Web3机制已在真实对手和真实资金中经过测试。链上开发者以承诺、抵押和可验证性为思考基础,因为他们假设比合作AI更严苛的基线:参与者是有动机谋取他人利益的策划者。这可能是悲观的,但在实际部署代理时非常有用。任何Web3协议,将“验证者”、“节点”或“对手”换成“AI代理”,大部分推理都可以沿用。

一个具体例子:使洞察变得可理解的排放机制

例如,作为我的研究工作的一部分,我正在构建一个Torus子网,用于进行有洞察力的预测,即在预测背后包含推理和假设。为了实现这个目标,多个代理需要提供数据、提取特征、处理信号并进行最终分析。然而,为了知道系统中哪些部分应优先处理,我必须解决信用分配问题——合作AI中一个臭名昭著的治理难题:谁对某个预测贡献最大?

解决方案,对Web3原生者来说可能很明显,是将信用分配作为代理的职责。负责做出最终预测的高级代理,根据基于Kelly的得分((用通俗的话说,是衡量预测准确性的方法)获得奖励。这些代理根据表现获得代币排放,预测越准确,获得的排放越多。关键是,高级代理负责将其排放再分配给其他代理,以换取有用的信号。这些中间代理可以进一步将排放分配给提供有用信息的其他代理,依此类推。

这种激励机制很清晰。顶层代理没有串通的任何好处;每个误配的单位都会稀释未来的表现,从而减少未来的排放。唯一的获胜策略是培养真正有价值的贡献者并奖励他们。

这种方法的强大之处在于,确保个体代理的对齐不再是问题;奖励良好行为成为机制的一部分。

Web3 × AI的简要议程

我所描述的只是AI与机制设计交叉的众多可能性之一。为了加快合作AI与Web3领域的交叉融合,我们需要增加它们成员之间的互动频率。Web3友好代理标准(如ERC-8004和x402))的社区是很好的起点,应予以培养和支持。然而,它们只对已经熟悉两个领域、了解AI和去中心化潜力的研究人员具有吸引力。优质跨学科研究人员的供给受到最初接触这些思想的研究人员数量的限制。

最有效的方式是“在他们所在之处”与他们会面。例如,Web3组织可以向Machine Learning的三大会议((NeurIPS、ICML、ICLR))提议工作坊,AI组织可以在Devconnect、ETHDenver、SBC或其他Web3会议中举办黑客马拉松。

关键结论

我们不会通过打造完美的单一模型来实现未来的对齐;我们将通过对齐它们所处的网络来实现。合作AI是一种应用的机制设计,而Web3在面对真实对手压力时,已经展示了如何奖励真相、惩罚欺骗以及维护大规模协调的能力。

在建立在可互操作原语上的共享、激励感知环境中取得的进展将是最快的,这些原语可以跨链和实验室使用,并且需要一种文化,促使加密建设者与学术AI研究者合作。对齐的未来之路在于将这些概念付诸实践,即使这意味着与不太可能的盟友合作。

Samuele Marro

Samuele Marro

Samuele Marro是牛津大学的博士生,由微软资助。他的研究重点是代理之间的通信与协作,特别是在去中心化环境中。他是Agora协议的创建者,这是一种用于代理之间可扩展去中心化通信的协议,也是轻量级代理标准工作组((LAS-WG))的主席,该工作组致力于制定代理标准。在加入牛津之前,他在博洛尼亚大学学习和工作,担任研究员。在区块链方面,除了作为自由职业的Solidity审计员和开发者外,他还共同起草了EIP-5375,并开发了第一个每交易模型的EVM交易方案。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)