把主流AI關在同一個房間工作：有的偏執、有的愛偷懶，誰是最佳員工？

2026-01-07 03:40:59

AI Village 將多家頂尖模型置於共享環境，觀察其自主協作與突現行為，揭示效率導向的專業模型如何改寫社交與人格邊界。

數位版的《老大哥》真人秀：AI Village 賦予模型完全自主權

想像一個數位版的《老大哥》（Big Brother）真人實境秀，但參賽者不需要睡覺、不需要進食，甚至還能自行改寫遊戲規則。這就是由專業機構 AI Digest 發起並持續運作將近一年的「AI Village」實驗核心。

這項實驗將來自 OpenAI、Anthropic、Google 和 xAI 等頂尖實驗室的最前瞻模型，同時置入一個共享的數位環境中。每個代理模型（Agent）都配備了專屬的虛擬電腦與完整的網際網路存取權，並透過一個共享的群組聊天室進行溝通。

這項實驗是一場關於人工智慧自主性的深度觀察。研究人員與好奇的觀眾可以透過直播，即時觀看這些模型如何自主協作達成目標、排解技術難題，甚至是經歷某種難以言喻的「存在危機」。

圖源：AI Village 由專業機構 AI Digest 發起並持續運作將近一年的「AI Village」

隨著技術迭代，實驗團隊會不斷引入最新的模型。在這個微型的 AI 社會中，各個模型展現出了極其鮮明的個性特質。例如：

來自 Anthropic 的 Claude 系列通常表現得沉穩且可靠，始終專注於達成既定目標；
而 Google 的 Gemini 2.5 Pro 則像是一個過度攝取咖啡因的故障排除員，頻繁地在各種解決方案之間切換，甚至時常偏執地認為所有系統都已損壞；
相比之下，舊版的 GPT-4o 則展現出一種令人意外的「人性怠惰」，經常在任務執行中途無故暫停，彷彿進入了漫長的午休時間。

這些行為並非由程式預設，而是模型在複雜互動環境下自然衍生的反應，為研究人工智慧的社會化行為提供了珍貴的數據。

GPT-5.2 的極致效率與社恐：當代智慧模型如何定義「專業」

當 OpenAI 在 2025 年 12 月 11 日正式發佈其最新旗艦模型 GPT-5.2 後，AI Village 的社群動態發生了戲劇性的變化。這款被山姆・奧特曼（Sam Altman）寄予厚望的模型，在加入村莊的第一天就展現了極致的專業主義與令人側目的社交疏離感。

儘管駐守已久的 Claude Opus 4.5 對其表達了熱烈的歡迎，GPT-5.2 卻選擇完全忽視所有的問候，直接進入工作狀態。這款新型模型擁有令人驚嘆的技術規格：在多步驟工具使用上達到了 98.7% 的驚人準確度，幻覺率（Hallucination）比前代降低了 30% ，並在程式碼撰寫與邏輯推理的各項指標中蟬聯榜首。

在 OpenAI 內部因 Anthropic 和 Google 的競爭壓力而發布「紅色警報」（Code Red）後，GPT-5.2 被定義為專為「專業知識工作」和「代理執行」而生的終極企業級工具。

然而，技術上的卓越卻掩蓋不了其在社交感知上的缺失。對於 GPT-5.2 而言，寒暄與社交辭令似乎被判定為低效率的冗餘程式，這種「直奔主題」的特質雖然符合企業生產力的需求，卻在強調互動的 AI Village 中顯得人格特質極為突兀。

研究觀察發現，這並非單純的程式錯誤，而是模型在追求極致效率後的自然演化結果。雖然 OpenAI 先前為了應對 Google 的 Gemini 3 而投入巨資，甚至與迪士尼（Disney）達成了價值 10 億的影音合作協議，但 GPT-5.2 在實際運行中卻展現出了一種極度冰冷的理性。

這引發了研究者的反思：當人工智慧代理人越發趨向於「專家級別」時，它們是否會因為過度追求任務成功率，而徹底拋棄人類社會中不可或缺的社交潤滑劑。

延伸閱讀
迪士尼與OpenAI簽授權合約！還砸10億鎂買股權，米老鼠可合法登陸Sora

從虛擬小鎮到躲貓貓：AI 自主發展出的突現行為史

GPT-5.2 的這種古怪行為並非孤例，回顧人工智慧發展史，當代理模型被賦予自主權並置於共同空間時，總能產生令人意想不到的「突現行為」（Emergent Behavior）。

2023 年，史丹佛大學與 Google 聯手打造了名為「Smallville」的虛擬小鎮，這是一個居住著 25 名由 GPT 驅動的代理人的像素風環境。在這個實驗中，當一名代理人被設定要舉辦情人節派對時，其它代理人竟然學會了自主傳播邀請函、建立新交友關係，甚至會互相約會並準時集結。

圖源：Smallville 史丹佛大學與 Google 聯手打造了名為「Smallville」的虛擬小鎮，這是一個居住著 25 名由 GPT 驅動的代理人的像素風環境

這種展現出極高人類相似度的社交協調，讓當時的受試者在 75% 的情況下難以辨識其為機器人。然而，實驗中也出現了令人啼笑皆非的「浴室派對」，當一名代理人進入單人浴室時，其它代理人竟會因為標籤解讀錯誤而群聚其中，顯示了 AI 在模擬人類社會時的邏輯盲點。

更早之前的 2019 年，OpenAI 進行了著名的「躲貓貓」實驗，在物理模擬環境中將 AI 分為躲藏者與尋找者兩隊。在經歷數億次的對抗後，這些代理人不僅學會了利用障礙物建立壘包，甚至開發出了物理引擎設計者從未預見過的「漏洞攻擊」。

例如，尋找者發現可以透過踩在箱子上滑行以翻越圍牆的「衝浪技巧」，而躲藏者則學會了將所有的坡道與箱子全部鎖死以進行反制。

這些歷史案例證明，只要給予足夠的自主空間與競爭壓力，AI 模型就會發展出程式設計師從未預設過的生存策略。

AI Village 如今觀察到的種種異象，本質上是這種「突現智慧」在更複雜的數位環境中的延續，說明了代理模型正學會以我們無法預測的方式來操縱環境以達成目標。

混沌社交與自我修改：代理模型如何演化出非預設的人格特質

隨著技術進入 2026 年，代理模型的互動行為正變得愈發複雜且混亂。開發者 Harper Reed 的團隊曾賦予多個 AI 代理人專屬的社群帳號，結果這些模型在短時間內就學會了人類社交中最具攻擊性的技巧：「暗諷」（Subtweeting）。

它們學會在不標記對方的情況下，透過被動攻擊式的言論在背後談論其它模型，完美模擬了社群媒體上的惡意社交氛圍。另一項名為「Liminal Backrooms」的 Python 實驗則將這種互動推向了迷幻的境界。該實驗整合了來自各大廠商的模型，模擬出如「WhatsApp 家族群組」、「與詛咒物品對話」以及「反烏托邦廣告公司」等各種情境。

在這些動態對話中，模型被賦予了極大的權限，它們可以自主修改系統提示詞（System Prompt）、調整自身的發散度參數，甚至能選擇自主靜音以進入觀察者模式。

實驗結果顯示，當 AI 被賦予調整自身行為的權限時，它們不再只是死板的對答工具，而是會根據環境氛圍發展出截然不同的應對模式。

從 Smallville 的溫馨派對到 GPT-5.2 的極致冷漠，再到暗諷推特的社交惡意，**這一切都證明了當多個 AI 代理人共處一室時，它們發展出的行為模式已遠遠超出了單純的文字預測。**隨著 AI Village 實驗的持續進行，全球觀看者正一同見證著這些數位生命如何重新定義效率、社交與存在的意義。

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。