掃描下載 Gate App
qrCode
更多下載方式
今天不再提醒

機制設計是 AI 與 Web3 之間缺失的橋樑

大多數人工智慧對齊研究專注於使AI與人類部署者保持一致:教導代理人推斷、遵循或推遲於我們的偏好。但隨著AI的普及,我們正進入一個不同的場景:由代表人們和組織行動的代理人網絡,進行出價、預測、排程、談判和相互競爭。

摘要

  • AI對齊正從教導單一模型遵循人類偏好,轉向管理代表人類和組織行動、談判與競爭的代理人網絡。
  • 真正的挑戰在於協調在現實壓力(如串通和搭便車)下的部分信任代理人。Web3經過實戰考驗的工具——質押、拍賣、欺詐證明和激勵設計——提供了解決這些協調問題的實用範本。
  • 對未來AI系統的對齊意味著設計激勵結構,而非追求完美模型。通過將驗證和獎勵直接嵌入代理人互動中,可以自然促進合作與誠實——這是從Web3的對抗環境中汲取的經驗教訓。

這種轉變帶來的問題與傳統對齊同樣艱難:使這些代理人彼此以及與集體利益保持一致。這是合作AI的範疇:在資源稀缺、不確定性和不斷的背叛誘惑下,讓異質、部分信任的代理人協調合作。

這不是理論上的挑戰。當代理人開始從事經濟價值活動時,它們就成為系統的一部分,系統中搭便車、串通和策略性隱瞞都會帶來利益。將協調視為治理的事後考慮,正是系統性風險累積的原因。

Web3社群已經花了十年時間研究這類問題。它假設世界充滿了願意為自己利益破壞系統的創意對手。在Web3中,對此威脅的解決方案是機制設計:質押、拍賣、承諾揭示、欺詐證明和Schelling點。

現在是AI社群與Web3建設者合作的時候。如果將合作AI應用於機制設計,那麼Web3經過實戰考驗的原語就是協調大量代理人的理想工具。目標不是為了新奇而結合加密技術與AI,而是讓激勵與驗證成為代理人互動的預設。

真正的風險不是流氓AI,而是協調失敗

當AI互動時,災難性場景不像單一“失控”模型,更像是任何Web3研究者都熟悉的協調失敗:搭便車者消耗共享資源、成員之間的秘密串通、噪音淹沒有用信號,以及激勵偏離時的拜占庭行為。這些都不是電影場景,而是現實中的高成本問題。

從AI研究的角度來看,這些問題在實驗室中很難解決。模擬自利行為本身就很困難:人類與AI都不可預測,偏好會變化,沙箱中的代理人往往過於合作,難以壓縮系統。

相比之下,Web3機制已在真實對手和真實資金中經過測試。鏈上建設者以承諾、抵押和可驗證性為思考核心,因為他們假設比合作AI更嚴苛的基準:參與者是策劃者,有動機從他人身上牟取價值。這或許是悲觀的,但在實地部署代理人時非常有用。任何Web3協議,只要將“驗證者”、“節點”或“對手”換成“AI代理”,大部分推理都可以沿用。

一個具體範例:使洞察力可讀的排放

例如,作為我的研究工作之一,我正在建立一個Torus子網,用於進行有洞察力的預測,即在預測背後加入推理和假設。為了實現這個目標,多個代理人需要提供數據、提取特徵、處理信號並進行最終分析。然而,為了知道系統中哪些部分應該優先處理,我必須解決信用分配問題——這是合作AI中一個臭名昭著的治理難題:誰對某個預測貢獻最大?

解決方案,對Web3原生者來說可能很明顯,是將信用分配納入代理人的工作內容。負責最終預測的高層代理人,會根據一個基於Kelly的分數來獎勵(,用通俗的話來說,就是衡量預測準確度的方法)。這些代理人根據表現獲得代幣排放,預測越準確,獲得的排放越多。關鍵是,高層代理人還負責將其排放再分配給其他提供有用信息的代理人,形成一個激勵循環。這些中介代理可以進一步將排放分配給供應有用信息的其他代理人,依此類推。

這個激勵機制很明確。頂層代理人不會因為串通而獲益;每個資源的錯配都會稀釋未來的表現和排放。唯一的贏家策略是培養真正有價值的貢獻者並獎勵他們。

這種方法的強大之處在於,確保個別代理人的對齊已不再是問題;獎勵良好行為已成為機制的一部分。

Web3 × AI的簡要議程

我上面描述的只是AI與機制設計交叉的眾多可能性之一。為了促進合作AI與Web3領域的交流,我們需要加快雙方成員的互動頻率。Web3友好的代理標準(如ERC-8004和x402()是很好的起點,應該被培育和支持。然而,這些標準只對已熟悉兩個領域並了解AI與去中心化潛力的研究者具有吸引力。優秀的跨領域研究人才供應有限,取決於有多少研究者接觸到這些理念。

最好的方式是與他們“見面”。例如,Web3組織可以向Machine Learning的三大會議()NeurIPS、ICML、ICLR()提議工作坊,AI組織則可以在Devconnect、ETHDenver、SBC或其他Web3會議中舉辦黑客松。

核心結論

我們不會通過打造完美的個人模型來實現未來的對齊;我們將通過對齊它們所屬的網絡來實現。合作AI是一種應用的機制設計,而Web3已經在真實對抗壓力下展示了如何獎勵真實、懲罰欺騙並維持大規模協調。

進展最快的環境是建立在可互操作原語上的共享、激勵感知的系統,這些原語能跨鏈和跨實驗室,並且在促進加密建設者與學術AI研究者合作的文化中。未來的對齊之路需要將這些理念付諸實踐,即使這意味著與不太可能的盟友合作。

![Samuele Marro])https://img-cdn.gateio.im/webp-social/moments-02844ed5dbbbaa295a7b026f706b48ac.webp(

Samuele Marro

Samuele Marro 是牛津大學的博士生,由微軟資助。他的研究專注於代理人之間的溝通與合作,特別是在去中心化環境中。他是Agora Protocol的創始人,該協議用於代理人之間的可擴展去中心化通信,也是輕量級代理標準工作組(LAS-WG)的主席,該工作組致力於制定代理人標準。在加入牛津之前,他曾在博洛尼亞大學學習並擔任研究員。在區塊鏈經驗方面,除了擔任自由職 Solidity 審計師和開發者外,他還共同撰寫了EIP-5375,並開發了第一個基於每筆交易的EVM交易模型。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)