機制設計是 AI 與 Web3 之間缺失的橋樑

CryptoNews.

2025-11-07 10:59:23

大多數人工智慧對齊研究專注於使AI與人類部署者保持一致：教導代理人推斷、遵循或推遲於我們的偏好。但隨著AI的普及，我們正進入一個不同的場景：由代表人們和組織行動的代理人網絡，進行出價、預測、排程、談判和相互競爭。

摘要

AI對齊正從教導單一模型遵循人類偏好，轉向管理代表人類和組織行動、談判與競爭的代理人網絡。
真正的挑戰在於協調在現實壓力（如串通和搭便車）下的部分信任代理人。Web3經過實戰考驗的工具——質押、拍賣、欺詐證明和激勵設計——提供了解決這些協調問題的實用範本。
對未來AI系統的對齊意味著設計激勵結構，而非追求完美模型。通過將驗證和獎勵直接嵌入代理人互動中，可以自然促進合作與誠實——這是從Web3的對抗環境中汲取的經驗教訓。

這種轉變帶來的問題與傳統對齊同樣艱難：使這些代理人彼此以及與集體利益保持一致。這是合作AI的範疇：在資源稀缺、不確定性和不斷的背叛誘惑下，讓異質、部分信任的代理人協調合作。

這不是理論上的挑戰。當代理人開始從事經濟價值活動時，它們就成為系統的一部分，系統中搭便車、串通和策略性隱瞞都會帶來利益。將協調視為治理的事後考慮，正是系統性風險累積的原因。

Web3社群已經花了十年時間研究這類問題。它假設世界充滿了願意為自己利益破壞系統的創意對手。在Web3中，對此威脅的解決方案是機制設計：質押、拍賣、承諾揭示、欺詐證明和Schelling點。

現在是AI社群與Web3建設者合作的時候。如果將合作AI應用於機制設計，那麼Web3經過實戰考驗的原語就是協調大量代理人的理想工具。目標不是為了新奇而結合加密技術與AI，而是讓激勵與驗證成為代理人互動的預設。

真正的風險不是流氓AI，而是協調失敗

當AI互動時，災難性場景不像單一“失控”模型，更像是任何Web3研究者都熟悉的協調失敗：搭便車者消耗共享資源、成員之間的秘密串通、噪音淹沒有用信號，以及激勵偏離時的拜占庭行為。這些都不是電影場景，而是現實中的高成本問題。

從AI研究的角度來看，這些問題在實驗室中很難解決。模擬自利行為本身就很困難：人類與AI都不可預測，偏好會變化，沙箱中的代理人往往過於合作，難以壓縮系統。

相比之下，Web3機制已在真實對手和真實資金中經過測試。鏈上建設者以承諾、抵押和可驗證性為思考核心，因為他們假設比合作AI更嚴苛的基準：參與者是策劃者，有動機從他人身上牟取價值。這或許是悲觀的，但在實地部署代理人時非常有用。任何Web3協議，只要將“驗證者”、“節點”或“對手”換成“AI代理”，大部分推理都可以沿用。

一個具體範例：使洞察力可讀的排放

例如，作為我的研究工作之一，我正在建立一個Torus子網，用於進行有洞察力的預測，即在預測背後加入推理和假設。為了實現這個目標，多個代理人需要提供數據、提取特徵、處理信號並進行最終分析。然而，為了知道系統中哪些部分應該優先處理，我必須解決信用分配問題——這是合作AI中一個臭名昭著的治理難題：誰對某個預測貢獻最大？

解決方案，對Web3原生者來說可能很明顯，是將信用分配納入代理人的工作內容。負責最終預測的高層代理人，會根據一個基於Kelly的分數來獎勵(，用通俗的話來說，就是衡量預測準確度的方法)。這些代理人根據表現獲得代幣排放，預測越準確，獲得的排放越多。關鍵是，高層代理人還負責將其排放再分配給其他提供有用信息的代理人，形成一個激勵循環。這些中介代理可以進一步將排放分配給供應有用信息的其他代理人，依此類推。

這個激勵機制很明確。頂層代理人不會因為串通而獲益；每個資源的錯配都會稀釋未來的表現和排放。唯一的贏家策略是培養真正有價值的貢獻者並獎勵他們。

這種方法的強大之處在於，確保個別代理人的對齊已不再是問題；獎勵良好行為已成為機制的一部分。

Web3 × AI的簡要議程

我上面描述的只是AI與機制設計交叉的眾多可能性之一。為了促進合作AI與Web3領域的交流，我們需要加快雙方成員的互動頻率。Web3友好的代理標準（如ERC-8004和x402(）是很好的起點，應該被培育和支持。然而，這些標準只對已熟悉兩個領域並了解AI與去中心化潛力的研究者具有吸引力。優秀的跨領域研究人才供應有限，取決於有多少研究者接觸到這些理念。

最好的方式是與他們“見面”。例如，Web3組織可以向Machine Learning的三大會議（)NeurIPS、ICML、ICLR(）提議工作坊，AI組織則可以在Devconnect、ETHDenver、SBC或其他Web3會議中舉辦黑客松。

核心結論

我們不會通過打造完美的個人模型來實現未來的對齊；我們將通過對齊它們所屬的網絡來實現。合作AI是一種應用的機制設計，而Web3已經在真實對抗壓力下展示了如何獎勵真實、懲罰欺騙並維持大規模協調。

進展最快的環境是建立在可互操作原語上的共享、激勵感知的系統，這些原語能跨鏈和跨實驗室，並且在促進加密建設者與學術AI研究者合作的文化中。未來的對齊之路需要將這些理念付諸實踐，即使這意味著與不太可能的盟友合作。

![Samuele Marro])https://img-cdn.gateio.im/webp-social/moments-02844ed5dbbbaa295a7b026f706b48ac.webp(

Samuele Marro

Samuele Marro 是牛津大學的博士生，由微軟資助。他的研究專注於代理人之間的溝通與合作，特別是在去中心化環境中。他是Agora Protocol的創始人，該協議用於代理人之間的可擴展去中心化通信，也是輕量級代理標準工作組（LAS-WG）的主席，該工作組致力於制定代理人標準。在加入牛津之前，他曾在博洛尼亞大學學習並擔任研究員。在區塊鏈經驗方面，除了擔任自由職 Solidity 審計師和開發者外，他還共同撰寫了EIP-5375，並開發了第一個基於每筆交易的EVM交易模型。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

讚賞
點讚
留言
轉發
分享

留言

0/400

暫無留言

熱門話題查看更多
#GateWeb3LaunchpadBOB上線
1.52萬熱度
#廣場發幣瓜分千U獎池
5.11萬熱度
#加密市場回調
25.12萬熱度
#隱私幣生態逆勢上漲
1.13萬熱度
#香港首個代幣化基金推出
5115 熱度

熱門 Gate Fun查看更多

1
BLCbullcoin
市值:$4332.43持有人數:2
0.01%
2
NPZGsNPZGs
市值:$4288.28持有人數:2
0.00%
3
LUCKLucky Charm
市值:$4255.17持有人數:1
0.00%
4
HAOBAHAOBA
市值:$4241.37持有人數:1
0.00%
5
TNTTNT
市值:$4706.66持有人數:2
1.81%