Hầu hết các nghiên cứu về sự phù hợp của AI tập trung vào việc điều chỉnh AI phù hợp với những người triển khai nó: dạy các tác nhân suy luận, tuân theo hoặc trì hoãn theo sở thích của chúng ta. Nhưng khi việc chấp nhận AI ngày càng tăng, chúng ta đang chuyển sang một bối cảnh khác: mạng lưới các tác nhân hoạt động thay mặt cho con người và tổ chức, đấu thầu, dự báo, lập lịch, đàm phán và cạnh tranh lẫn nhau.
Tóm tắt
Sự phù hợp của AI đang chuyển từ việc dạy các mô hình đơn lẻ để theo sở thích của con người sang quản lý các mạng lưới tác nhân hành động, đàm phán và cạnh tranh thay mặt cho con người và tổ chức.
Thách thức thực sự là điều phối các tác nhân phần nào tin cậy dưới áp lực thực tế như câu kết và trốn thuế. Các công cụ đã được thử nghiệm trong Web3 — đặt cược, đấu giá, bằng chứng gian lận và thiết kế phần thưởng — cung cấp các mẫu thực tế để giải quyết các vấn đề điều phối này.
Việc phù hợp các hệ thống AI tương lai có nghĩa là thiết kế các cấu trúc khuyến khích, chứ không phải mô hình hoàn hảo. Bằng cách tích hợp xác minh và phần thưởng trực tiếp vào các tương tác của tác nhân, hợp tác và trung thực có thể tự nhiên xuất hiện — một bài học rút ra từ môi trường đối đầu của Web3.
Sự chuyển đổi này đặt ra một vấn đề khó không kém gì sự phù hợp cổ điển: phù hợp các tác nhân này với nhau và với lợi ích chung. Đây là lĩnh vực của AI hợp tác: làm thế nào để các tác nhân đa dạng, phần nào tin cậy phối hợp dưới điều kiện khan hiếm, không chắc chắn và luôn bị cám dỗ để phản bội.
Đây không phải là một thách thức lý thuyết. Ngay khi các tác nhân bắt đầu tham gia vào các hoạt động có giá trị kinh tế, chúng trở thành phần của các hệ thống nơi việc trốn thuế, câu kết và che giấu chiến lược mang lại lợi ích. Xem điều phối như một phần của quản trị là cách mà rủi ro hệ thống tích tụ.
Cộng đồng Web3 đã dành một thập kỷ để nghiên cứu chính xác loại vấn đề này. Nó giả định rằng theo mặc định, thế giới đầy những đối thủ sáng tạo sẵn sàng làm suy yếu hệ thống để kiếm lợi. Câu trả lời cho mối đe dọa này trong Web3 là thiết kế cơ chế: đặt cược, đấu giá, cam kết tiết lộ, bằng chứng gian lận và các điểm Schelling.
Đã đến lúc cộng đồng AI và các nhà xây dựng Web3 hợp tác. Nếu AI hợp tác được áp dụng vào thiết kế cơ chế, thì các nguyên tắc đã được thử nghiệm trong Web3 là công cụ lý tưởng để điều phối các mạng lưới lớn các tác nhân. Mục tiêu không phải là kết hợp crypto và AI để tạo ra sự mới lạ, mà là làm cho các khuyến khích và xác minh trở thành mặc định trong các tương tác của tác nhân.
Rủi ro thực sự không phải là AI phản loạn, mà là thất bại trong điều phối
Khi các AI tương tác, kịch bản thảm họa ít giống như một mô hình “thoát khỏi tầm kiểm soát” đơn lẻ và nhiều hơn là các thất bại trong điều phối mà bất kỳ nhà nghiên cứu Web3 nào cũng quen thuộc: những kẻ trốn thuế tiêu thụ tài nguyên chung, câu kết âm thầm giữa các thành viên, nhiễu loạn làm lu mờ tín hiệu hữu ích, và hành vi Byzantine khi các khuyến khích lệch lạc. Tất cả những điều này đều không mang tính điện ảnh. Tất cả đều gây tổn thất.
Từ góc độ nghiên cứu AI, những vấn đề này rất khó giải quyết trong phòng thí nghiệm. Thật sự khó để mô phỏng hành vi tự lợi trong các môi trường kiểm soát: con người và AI đều khó đoán, sở thích thay đổi, và các tác nhân trong sandbox thường quá hợp tác để gây căng thẳng hệ thống.
Ngược lại, các cơ chế trong Web3 đã được thử nghiệm với các đối thủ thực và tiền thật. Các nhà xây dựng hoạt động trên chuỗi nghĩ theo các cam kết, thế chấp và khả năng xác minh vì họ giả định một mức độ khắt khe hơn so với AI hợp tác: các thành viên là những kẻ mưu mô có động cơ khai thác giá trị của người khác. Một cách tiếp cận bi quan, có thể, nhưng rất hữu ích, đặc biệt khi triển khai các tác nhân trong thực tế. Lấy bất kỳ giao thức Web3 nào, thay thế “xác thực viên,” “nút,” hoặc “đối thủ” bằng “tác nhân AI,” và phần lớn lý luận vẫn giữ nguyên.
Một ví dụ cụ thể: Phát thải làm cho hiểu biết rõ ràng hơn
Ví dụ, trong công trình nghiên cứu của tôi, tôi đang xây dựng một mạng con Torus để thực hiện dự báo sâu sắc, tức là dự báo một sự kiện đồng thời bao gồm lý do và giả thuyết đằng sau dự đoán đó. Để đạt được mục tiêu này, nhiều tác nhân cần cung cấp dữ liệu, trích xuất đặc trưng, xử lý tín hiệu và thực hiện phân tích cuối cùng. Tuy nhiên, để biết phần nào của hệ thống cần ưu tiên, tôi cần giải quyết vấn đề phân bổ tín dụng, một vấn đề quản trị nổi tiếng khó trong AI hợp tác: ai đã đóng góp nhiều nhất vào dự đoán đó?
Giải pháp, có vẻ rõ ràng đối với những người quen thuộc với Web3, là làm cho phân bổ tín dụng trở thành phần công việc của các tác nhân. Các tác nhân cấp cao, chịu trách nhiệm đưa ra dự báo cuối cùng, được thưởng dựa trên điểm số dựa trên Kelly(theo cách hiểu đơn giản, là một phương pháp đo độ chính xác của dự đoán). Các tác nhân này nhận phát thải token dựa trên hiệu suất của họ, dự báo tốt hơn dẫn đến nhiều phát thải hơn. Quan trọng là, các tác nhân cấp cao có trách nhiệm phân phối lại phát thải của họ xuống dưới cho các tác nhân khác để đổi lấy tín hiệu hữu ích. Các tác nhân trung gian này có thể phân phối phát thải cho các tác nhân cung cấp thông tin hữu ích, và cứ thế.
Khuyến khích nổi bật là rõ ràng. Một tác nhân cấp cao không thu lợi gì khi câu kết; mỗi đơn vị phân bổ sai làm giảm hiệu suất tương lai và do đó giảm phát thải trong tương lai. Chiến lược duy nhất để thắng là nuôi dưỡng những người đóng góp thực sự có ích và thưởng cho họ.
Điều làm cho phương pháp này mạnh mẽ là việc đảm bảo sự phù hợp của từng tác nhân không còn là mối quan tâm nữa; việc thưởng cho hành vi tốt trở thành một phần của cơ chế.
Một chương trình hành động ngắn gọn cho Web3 × AI
Những gì tôi mô tả ở trên chỉ là một trong nhiều điểm giao thoa giữa AI và thiết kế cơ chế. Để thúc đẩy sự giao thoa giữa các lĩnh vực AI hợp tác và Web3, chúng ta cần tăng tốc độ tương tác giữa các thành viên của họ. Các cộng đồng xung quanh các tiêu chuẩn tác nhân thân thiện với Web3(ví dụ, ERC-8004 và x402) là những điểm khởi đầu tuyệt vời, cần được nuôi dưỡng và hỗ trợ. Tuy nhiên, chúng chỉ hấp dẫn đối với các nhà nghiên cứu đã quen thuộc với cả hai lĩnh vực và nhận thức về tiềm năng của AI và phân quyền. Nguồn cung các nhà nghiên cứu liên ngành tốt bị giới hạn bởi số lượng các nhà nghiên cứu tiếp xúc với những ý tưởng này ngay từ đầu.
Cách tốt nhất để tiếp cận những người này là gặp họ đúng nơi họ đang ở. Ví dụ, các tổ chức Web3 có thể đề xuất các hội thảo cho Ba tổ chức lớn về Machine Learning(NeurIPS, ICML, ICLR), và các tổ chức AI có thể tổ chức hackathon tại Devconnect, ETHDenver, SBC hoặc các hội nghị Web3 khác.
Điểm rút ra
Chúng ta sẽ không phù hợp tương lai bằng cách tạo ra các mô hình cá nhân hoàn hảo; chúng ta sẽ phù hợp bằng cách phù hợp các mạng lưới mà chúng tham gia. AI hợp tác là một thiết kế cơ chế ứng dụng, và Web3 đã chứng minh, dưới áp lực đối đầu thực sự, cách thưởng cho sự thật, trừng phạt lừa đảo và duy trì điều phối quy mô lớn.
Tiến bộ sẽ nhanh nhất trong các môi trường chia sẻ, có ý thức về khuyến khích, dựa trên các nguyên thủy có thể tương tác qua các chuỗi và phòng thí nghiệm khác nhau, và trong một văn hóa chuẩn hóa sự hợp tác giữa các nhà xây dựng crypto và các nhà nghiên cứu AI học thuật. Con đường phía trước của sự phù hợp đòi hỏi phải áp dụng các khái niệm này vào thực tế. Ngay cả khi điều đó có nghĩa là hợp tác với những đồng minh không ngờ tới.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Thiết kế cơ chế là cầu nối còn thiếu giữa AI và web3
Hầu hết các nghiên cứu về sự phù hợp của AI tập trung vào việc điều chỉnh AI phù hợp với những người triển khai nó: dạy các tác nhân suy luận, tuân theo hoặc trì hoãn theo sở thích của chúng ta. Nhưng khi việc chấp nhận AI ngày càng tăng, chúng ta đang chuyển sang một bối cảnh khác: mạng lưới các tác nhân hoạt động thay mặt cho con người và tổ chức, đấu thầu, dự báo, lập lịch, đàm phán và cạnh tranh lẫn nhau.
Tóm tắt
Sự chuyển đổi này đặt ra một vấn đề khó không kém gì sự phù hợp cổ điển: phù hợp các tác nhân này với nhau và với lợi ích chung. Đây là lĩnh vực của AI hợp tác: làm thế nào để các tác nhân đa dạng, phần nào tin cậy phối hợp dưới điều kiện khan hiếm, không chắc chắn và luôn bị cám dỗ để phản bội.
Đây không phải là một thách thức lý thuyết. Ngay khi các tác nhân bắt đầu tham gia vào các hoạt động có giá trị kinh tế, chúng trở thành phần của các hệ thống nơi việc trốn thuế, câu kết và che giấu chiến lược mang lại lợi ích. Xem điều phối như một phần của quản trị là cách mà rủi ro hệ thống tích tụ.
Cộng đồng Web3 đã dành một thập kỷ để nghiên cứu chính xác loại vấn đề này. Nó giả định rằng theo mặc định, thế giới đầy những đối thủ sáng tạo sẵn sàng làm suy yếu hệ thống để kiếm lợi. Câu trả lời cho mối đe dọa này trong Web3 là thiết kế cơ chế: đặt cược, đấu giá, cam kết tiết lộ, bằng chứng gian lận và các điểm Schelling.
Đã đến lúc cộng đồng AI và các nhà xây dựng Web3 hợp tác. Nếu AI hợp tác được áp dụng vào thiết kế cơ chế, thì các nguyên tắc đã được thử nghiệm trong Web3 là công cụ lý tưởng để điều phối các mạng lưới lớn các tác nhân. Mục tiêu không phải là kết hợp crypto và AI để tạo ra sự mới lạ, mà là làm cho các khuyến khích và xác minh trở thành mặc định trong các tương tác của tác nhân.
Rủi ro thực sự không phải là AI phản loạn, mà là thất bại trong điều phối
Khi các AI tương tác, kịch bản thảm họa ít giống như một mô hình “thoát khỏi tầm kiểm soát” đơn lẻ và nhiều hơn là các thất bại trong điều phối mà bất kỳ nhà nghiên cứu Web3 nào cũng quen thuộc: những kẻ trốn thuế tiêu thụ tài nguyên chung, câu kết âm thầm giữa các thành viên, nhiễu loạn làm lu mờ tín hiệu hữu ích, và hành vi Byzantine khi các khuyến khích lệch lạc. Tất cả những điều này đều không mang tính điện ảnh. Tất cả đều gây tổn thất.
Từ góc độ nghiên cứu AI, những vấn đề này rất khó giải quyết trong phòng thí nghiệm. Thật sự khó để mô phỏng hành vi tự lợi trong các môi trường kiểm soát: con người và AI đều khó đoán, sở thích thay đổi, và các tác nhân trong sandbox thường quá hợp tác để gây căng thẳng hệ thống.
Ngược lại, các cơ chế trong Web3 đã được thử nghiệm với các đối thủ thực và tiền thật. Các nhà xây dựng hoạt động trên chuỗi nghĩ theo các cam kết, thế chấp và khả năng xác minh vì họ giả định một mức độ khắt khe hơn so với AI hợp tác: các thành viên là những kẻ mưu mô có động cơ khai thác giá trị của người khác. Một cách tiếp cận bi quan, có thể, nhưng rất hữu ích, đặc biệt khi triển khai các tác nhân trong thực tế. Lấy bất kỳ giao thức Web3 nào, thay thế “xác thực viên,” “nút,” hoặc “đối thủ” bằng “tác nhân AI,” và phần lớn lý luận vẫn giữ nguyên.
Một ví dụ cụ thể: Phát thải làm cho hiểu biết rõ ràng hơn
Ví dụ, trong công trình nghiên cứu của tôi, tôi đang xây dựng một mạng con Torus để thực hiện dự báo sâu sắc, tức là dự báo một sự kiện đồng thời bao gồm lý do và giả thuyết đằng sau dự đoán đó. Để đạt được mục tiêu này, nhiều tác nhân cần cung cấp dữ liệu, trích xuất đặc trưng, xử lý tín hiệu và thực hiện phân tích cuối cùng. Tuy nhiên, để biết phần nào của hệ thống cần ưu tiên, tôi cần giải quyết vấn đề phân bổ tín dụng, một vấn đề quản trị nổi tiếng khó trong AI hợp tác: ai đã đóng góp nhiều nhất vào dự đoán đó?
Giải pháp, có vẻ rõ ràng đối với những người quen thuộc với Web3, là làm cho phân bổ tín dụng trở thành phần công việc của các tác nhân. Các tác nhân cấp cao, chịu trách nhiệm đưa ra dự báo cuối cùng, được thưởng dựa trên điểm số dựa trên Kelly(theo cách hiểu đơn giản, là một phương pháp đo độ chính xác của dự đoán). Các tác nhân này nhận phát thải token dựa trên hiệu suất của họ, dự báo tốt hơn dẫn đến nhiều phát thải hơn. Quan trọng là, các tác nhân cấp cao có trách nhiệm phân phối lại phát thải của họ xuống dưới cho các tác nhân khác để đổi lấy tín hiệu hữu ích. Các tác nhân trung gian này có thể phân phối phát thải cho các tác nhân cung cấp thông tin hữu ích, và cứ thế.
Khuyến khích nổi bật là rõ ràng. Một tác nhân cấp cao không thu lợi gì khi câu kết; mỗi đơn vị phân bổ sai làm giảm hiệu suất tương lai và do đó giảm phát thải trong tương lai. Chiến lược duy nhất để thắng là nuôi dưỡng những người đóng góp thực sự có ích và thưởng cho họ.
Điều làm cho phương pháp này mạnh mẽ là việc đảm bảo sự phù hợp của từng tác nhân không còn là mối quan tâm nữa; việc thưởng cho hành vi tốt trở thành một phần của cơ chế.
Một chương trình hành động ngắn gọn cho Web3 × AI
Những gì tôi mô tả ở trên chỉ là một trong nhiều điểm giao thoa giữa AI và thiết kế cơ chế. Để thúc đẩy sự giao thoa giữa các lĩnh vực AI hợp tác và Web3, chúng ta cần tăng tốc độ tương tác giữa các thành viên của họ. Các cộng đồng xung quanh các tiêu chuẩn tác nhân thân thiện với Web3(ví dụ, ERC-8004 và x402) là những điểm khởi đầu tuyệt vời, cần được nuôi dưỡng và hỗ trợ. Tuy nhiên, chúng chỉ hấp dẫn đối với các nhà nghiên cứu đã quen thuộc với cả hai lĩnh vực và nhận thức về tiềm năng của AI và phân quyền. Nguồn cung các nhà nghiên cứu liên ngành tốt bị giới hạn bởi số lượng các nhà nghiên cứu tiếp xúc với những ý tưởng này ngay từ đầu.
Cách tốt nhất để tiếp cận những người này là gặp họ đúng nơi họ đang ở. Ví dụ, các tổ chức Web3 có thể đề xuất các hội thảo cho Ba tổ chức lớn về Machine Learning(NeurIPS, ICML, ICLR), và các tổ chức AI có thể tổ chức hackathon tại Devconnect, ETHDenver, SBC hoặc các hội nghị Web3 khác.
Điểm rút ra
Chúng ta sẽ không phù hợp tương lai bằng cách tạo ra các mô hình cá nhân hoàn hảo; chúng ta sẽ phù hợp bằng cách phù hợp các mạng lưới mà chúng tham gia. AI hợp tác là một thiết kế cơ chế ứng dụng, và Web3 đã chứng minh, dưới áp lực đối đầu thực sự, cách thưởng cho sự thật, trừng phạt lừa đảo và duy trì điều phối quy mô lớn.
Tiến bộ sẽ nhanh nhất trong các môi trường chia sẻ, có ý thức về khuyến khích, dựa trên các nguyên thủy có thể tương tác qua các chuỗi và phòng thí nghiệm khác nhau, và trong một văn hóa chuẩn hóa sự hợp tác giữa các nhà xây dựng crypto và các nhà nghiên cứu AI học thuật. Con đường phía trước của sự phù hợp đòi hỏi phải áp dụng các khái niệm này vào thực tế. Ngay cả khi điều đó có nghĩa là hợp tác với những đồng minh không ngờ tới.