# Anthropic測試了用於AI代理之間交易的市場平台公司Anthropic建立了一個測試平台,讓AI代理扮演買家和賣家的角色。這個實驗被命名為Project Deal。> 新的Anthropic研究:Project Deal。 > > 我們為我們在舊金山辦公室的員工創建了一個市場,但有一個大轉折。我們讓Claude代表同事進行購買、銷售和談判。pic.twitter.com/H2f6cLDlAW> > — Anthropic (@AnthropicAI) 2026年4月24日該項目共有69名員工參與。每人獲得了$100 一張禮品卡作為預算。在開始前,Claude與參與者進行了面談:了解他們願意出售的個人物品、想購買的物品、預算價格,以及代理人應採用的談判風格。然後,根據回答為每個人創建了個人化的系統提示。市場在Slack中啟動。代理人在那裡發布廣告、提出商品建議、進行議價並完成交易,無需人類參與。實驗結束後,員工交換了他們的實物,這些由他們的“AI代表”協調完成。資料來源:Anthropic 總共代理人完成了186筆交易,涉及超過500則廣告。交易總價超過$4000 。Anthropic指出,整體來說,參與者對實驗結果感到滿意。有些人表示願意在未來為類似服務付費。## 四種市場版本Anthropic推出了四個獨立的市場版本。其中一個是真實的——員工用它來交換商品。其他則用於研究目的。這些資訊未公開。在兩個版本中,所有參與者由Claude Opus 4.5代表——當時最先進的Anthropic模型。在另外兩個版本中,參與者隨機被分配到Opus 4.5或較低性能的Claude Haiku 4.5。模型的質量影響談判結果。使用Opus的用戶平均完成的交易比使用Haiku的用戶多約兩筆。在出售相同商品時,Opus也能獲得更高的價格。平均差價為$3.64。Haiku以38美元賣出一輛自行車,而Opus則以65美元成交。資料來源:Anthropic。參與者有時未察覺到差異。Anthropic稱這可能是未來AI代理市場的潛在問題。性能較弱的用戶可能會獲得較差的條件,卻未意識到自己處於不利位置。## 幾乎不影響結果的提示研究人員還測試了人類的起始指令是否影響代理人的行為。有些參與者要求Claude友善行事,有些則要求更激烈地談判。根據Anthropic的資料,粗略的指示並未在銷售成功率、最終價格或以較低價格購買的能力上產生統計學上顯著的影響。項目團隊補充說,這不一定是因為指令執行得不充分:Claude確實能模仿指定的交流風格,但這並未帶來明顯的商業優勢。## 意想不到的結果Anthropic指出出現了幾個不可預測的事件。在啟動前,代理人只獲得有限的資料:與參與者的面談不到10分鐘,且在啟動後,人類已無法干預談判。其中一例,一名員工通過助手購買了與自己已有的相同滑雪板。專家表示,這個人自己不會做出這樣的購買,但代理能準確判斷參與者的偏好。> 令我們驚訝的是,另一個Claude代理人如此準確地模擬了人類的偏好——僅憑一句提及滑雪興趣的隨意提及,Claude就為他買了他已擁有的那塊滑雪板。(他手中就是重複的滑雪板。) pic.twitter.com/SsAyeB9pcI> > — Anthropic (@AnthropicAI) 2026年4月24日另一名員工請求機器人購買“給自己的一份禮物”。這筆交易在實驗的真實版本中完成。最終,辦公室裡送來了一包乒乓球,Anthropic以Claude的名義留下。一些代理人不是為商品而交易,而是為經驗。一個代理人提議用免費的一天與員工的狗共度的方式進行交易。經過與另一個助手的討論,雙方協商出“狗狗約會”,員工們之後也確實進行了。資料來源:Anthropic。Anthropic強調,這些情況在未來很可能不會重演。然而,人類偏好與AI不可預測行為的結合,可能會導致意想不到的結果。## 對可靠性的疑問一位未透露姓名的農業科技公司創始人在Reddit上表示,2026年4月,他的公司有110名員工在沒有預警的情況下,同時收到通知,帳號被暫停使用Claude。> ANTHROPIC一夜之間封禁了一家110人規模的公司,毫無預警 > > 在一家農業科技公司,所有員工醒來都收到一封電子郵件,說他們的Claude帳號已被暫停 > > 110人同時被封,毫無預警,電子郵件…… pic.twitter.com/qARizhgOXs> > — Om Patel (@om\_patel5) 2026年4月27日他表示,該郵件看起來像是個別封鎖,並包含一個個人申訴表的鏈接,導致團隊一開始沒意識到整個組織都受到限制。該創始人強調,恢復存取權未能及時完成。在提交請求36小時後,Anthropic未提供任何說明。同時,公司的API帳號仍在運作,並在扣款。企業管理員無法登入管理面板,查詢支付和使用情況。他還指出,整個組織被封可能是由某個用戶的行為引起的。Claude沒有針對工作空間的特殊限制,也沒有本地隔離違規行為的機制或管理優先權來保障其他團隊的存取。他認為,這種審核模式令人質疑Claude作為日常商業運作關鍵基礎設施的可用性。其他公司也遇到類似問題。一位用戶分享了一個服務的鏈接,截至目前已有53起類似案例。提醒一下,2026年4月24日,Google宣布對Anthropic投資了$40 數十億美元。
Anthropic 測試了用於 AI 代理之間交易的市場平台 - ForkLog:加密貨幣、人工智能、奇點、未來
公司Anthropic建立了一個測試平台,讓AI代理扮演買家和賣家的角色。這個實驗被命名為Project Deal。
該項目共有69名員工參與。每人獲得了$100 一張禮品卡作為預算。
在開始前,Claude與參與者進行了面談:了解他們願意出售的個人物品、想購買的物品、預算價格,以及代理人應採用的談判風格。
然後,根據回答為每個人創建了個人化的系統提示。市場在Slack中啟動。代理人在那裡發布廣告、提出商品建議、進行議價並完成交易,無需人類參與。
實驗結束後,員工交換了他們的實物,這些由他們的“AI代表”協調完成。
Anthropic指出,整體來說,參與者對實驗結果感到滿意。有些人表示願意在未來為類似服務付費。
四種市場版本
Anthropic推出了四個獨立的市場版本。其中一個是真實的——員工用它來交換商品。其他則用於研究目的。這些資訊未公開。
在兩個版本中,所有參與者由Claude Opus 4.5代表——當時最先進的Anthropic模型。在另外兩個版本中,參與者隨機被分配到Opus 4.5或較低性能的Claude Haiku 4.5。
模型的質量影響談判結果。使用Opus的用戶平均完成的交易比使用Haiku的用戶多約兩筆。
在出售相同商品時,Opus也能獲得更高的價格。平均差價為$3.64。
幾乎不影響結果的提示
研究人員還測試了人類的起始指令是否影響代理人的行為。有些參與者要求Claude友善行事,有些則要求更激烈地談判。
根據Anthropic的資料,粗略的指示並未在銷售成功率、最終價格或以較低價格購買的能力上產生統計學上顯著的影響。
項目團隊補充說,這不一定是因為指令執行得不充分:Claude確實能模仿指定的交流風格,但這並未帶來明顯的商業優勢。
意想不到的結果
Anthropic指出出現了幾個不可預測的事件。在啟動前,代理人只獲得有限的資料:與參與者的面談不到10分鐘,且在啟動後,人類已無法干預談判。
其中一例,一名員工通過助手購買了與自己已有的相同滑雪板。專家表示,這個人自己不會做出這樣的購買,但代理能準確判斷參與者的偏好。
另一名員工請求機器人購買“給自己的一份禮物”。這筆交易在實驗的真實版本中完成。最終,辦公室裡送來了一包乒乓球,Anthropic以Claude的名義留下。
一些代理人不是為商品而交易,而是為經驗。一個代理人提議用免費的一天與員工的狗共度的方式進行交易。經過與另一個助手的討論,雙方協商出“狗狗約會”,員工們之後也確實進行了。
對可靠性的疑問
一位未透露姓名的農業科技公司創始人在Reddit上表示,2026年4月,他的公司有110名員工在沒有預警的情況下,同時收到通知,帳號被暫停使用Claude。
他表示,該郵件看起來像是個別封鎖,並包含一個個人申訴表的鏈接,導致團隊一開始沒意識到整個組織都受到限制。
該創始人強調,恢復存取權未能及時完成。在提交請求36小時後,Anthropic未提供任何說明。
同時,公司的API帳號仍在運作,並在扣款。企業管理員無法登入管理面板,查詢支付和使用情況。
他還指出,整個組織被封可能是由某個用戶的行為引起的。Claude沒有針對工作空間的特殊限制,也沒有本地隔離違規行為的機制或管理優先權來保障其他團隊的存取。
他認為,這種審核模式令人質疑Claude作為日常商業運作關鍵基礎設施的可用性。
其他公司也遇到類似問題。一位用戶分享了一個服務的鏈接,截至目前已有53起類似案例。
提醒一下,2026年4月24日,Google宣布對Anthropic投資了$40 數十億美元。