Ngành công nghiệp đối mặt với một vấn đề âm thầm nhưng tàn phá: khả năng xác minh xem dữ liệu mà chúng ta tin tưởng có thực sự đáng tin cậy hay không. Từ học máy đến quảng cáo kỹ thuật số, các hệ thống quan trọng được xây dựng dựa trên thông tin mà tính xác thực của nó không bao giờ có thể được kiểm chứng. Giải pháp yêu cầu dữ liệu phải có khả năng xác minh từ nguồn gốc của nó.
Trong một thế giới nơi trí tuệ nhân tạo quản lý các quyết định về tín dụng, tuyển dụng và chẩn đoán y tế, rủi ro là cực kỳ lớn. 87% các dự án trí tuệ nhân tạo chưa bao giờ đi vào sản xuất, và nguyên nhân không phải do thuật toán, mà do chất lượng dữ liệu đầu vào của các hệ thống này kém. Đối với một ngành công nghiệp trị giá 200 tỷ đô la, con số này đại diện cho một thất bại lớn.
Tác động vượt ra ngoài AI. Quảng cáo kỹ thuật số, một thị trường trị giá 750 tỷ đô la mỗi năm, mất gần một phần ba khoản đầu tư của mình do gian lận và không chính xác, chủ yếu vì các giao dịch không thể được kiểm toán một cách đáng tin cậy. Ngay cả các ông lớn công nghệ như Amazon cũng đã phải từ bỏ các dự án hoàn chỉnh sau nhiều năm phát triển, phát hiện ra rằng dữ liệu huấn luyện phản ánh các thành kiến phân biệt đối xử. Khi một hệ thống tự động đưa ra quyết định quan trọng, hiếm khi có cách để theo dõi và xác minh tính toàn vẹn của dữ liệu đã tạo ra nó.
Chi phí ẩn của dữ liệu không thể xác minh trong các ngành công nghiệp quan trọng
Dữ liệu lỗi không chỉ phá vỡ các thuật toán; còn làm tăng các lỗi của chúng trên quy mô lớn. Một mô hình được huấn luyện với thông tin thiên vị, bị hỏng hoặc không chính xác không mắc lỗi ngẫu nhiên, mà lặp lại và làm trầm trọng thêm các thành kiến trong quá trình huấn luyện của nó.
Trường hợp của Amazon minh họa rõ thực tế này. Công cụ tuyển dụng của họ không được thiết kế để phân biệt đối xử, mà “học” cách làm điều đó khi được cung cấp các hồ sơ lịch sử chủ yếu là tuyển dụng nam giới. Không có thuật toán nào đủ tinh vi để vượt qua một tập dữ liệu cơ bản bị ô nhiễm.
Thách thức vượt ra ngoài dữ liệu sai lệch. Các bộ dữ liệu huấn luyện được thu thập và xử lý mà không để lại dấu vết xác thực về nguồn gốc, các chỉnh sửa đã thực hiện hoặc các thay đổi về tính toàn vẹn của chúng. Khi những dữ liệu này huấn luyện các hệ thống ra quyết định về cho vay, chẩn đoán hoặc thăng chức, không có cơ chế nào để chứng minh nguồn gốc hoặc liệu chúng có bị thay đổi hay không.
Xác minh mật mã như nền tảng của niềm tin
Xây dựng AI đáng tin cậy đòi hỏi điều gì đó mà bất kỳ trung tâm dữ liệu lớn hơn hoặc bộ xử lý nhanh hơn nào cũng không thể cung cấp: dữ liệu có tính xác thực có thể xác minh từ byte đầu tiên. Walrus thực hiện chính xác điều này, cho phép xác minh dữ liệu từ đầu đến cuối.
Theo mô hình này, mỗi tệp tin đều có một định danh duy nhất và có thể xác minh được. Mọi thay đổi đều được ghi lại trong chuỗi chuỗi bảo quản. Các nhà phát triển có thể chứng minh bằng mật mã nguồn gốc dữ liệu của họ, ai đã chỉnh sửa chúng và liệu chúng còn nguyên vẹn hay không. Khi một cơ quan quản lý chất vấn quyết định của một mô hình phát hiện gian lận, có thể trình bày định danh của blob (một hàm băm duy nhất sinh ra từ chính dữ liệu), hiển thị đối tượng Sui ghi lại lịch sử lưu trữ của nó, và xác minh bằng mật mã rằng dữ liệu huấn luyện chưa từng bị thay đổi.
Walrus tích hợp với hệ sinh thái Sui để điều phối các chương trình trên chuỗi, thiết lập một lớp niềm tin nơi dữ liệu là đáng tin cậy và có thể xác minh theo thiết kế, chứ không chỉ dựa vào niềm tin tốt.
Các trường hợp thành công: Từ Amazon đến Alkimi
Quảng cáo kỹ thuật số là một lĩnh vực khác bị tàn phá bởi thông tin không thể xác minh. Các nhà quảng cáo đầu tư vào một thị trường trị giá 750 tỷ đô la, nhưng phải đối mặt với các báo cáo không chính xác, gian lận hệ thống và các hiển thị do bot tạo ra. Các giao dịch bị phân mảnh giữa nhiều nền tảng, và các hệ thống đo lường hiệu suất chính là những hệ thống hưởng lợi từ việc báo cáo số liệu bị thổi phồng.
Alkimi đang thiết kế lại bức tranh của quảng cáo theo chương trình, làm cho tất cả dữ liệu trở nên có thể xác minh. Mỗi hiển thị, đề nghị và giao dịch đều được lưu trữ trong Walrus với các ghi chú không thể thay đổi. Nền tảng tích hợp mã hóa cho dữ liệu nhạy cảm của khách hàng và xử lý các đối chiếu bằng xác minh mật mã về độ chính xác, biến nó thành giải pháp lý tưởng cho các ngành công nghiệp mà dữ liệu phải là, trên hết, có thể xác minh.
Tương lai của dữ liệu có thể xác minh trong DeFi và AI
Những gì bắt đầu trong AdTech chỉ mới chạm vào bề mặt của các ứng dụng khả thi. Các nhà phát triển trí tuệ nhân tạo có thể loại bỏ thành kiến bằng cách chọn các bộ dữ liệu có nguồn gốc có thể xác minh bằng mật mã. Các giao thức DeFi có thể token hóa dữ liệu đã được xác minh như tài sản thế chấp, tương tự như cách AdFi biến doanh thu quảng cáo đã được chứng minh thành các tài sản có thể lập trình. Các thị trường dữ liệu phi tập trung có thể phát triển mạnh trong khi người dùng kiếm tiền từ thông tin cá nhân của họ, đồng thời duy trì quyền riêng tư được đảm bảo bằng mật mã.
Tất cả điều này đều khả thi vì, lần đầu tiên, dữ liệu không còn yêu cầu niềm tin mù quáng: chúng có thể được chứng minh bằng toán học. WAL (giá $0.09 tại thời điểm viết bài) tạo thành nền tảng kinh tế của hệ sinh thái này, khuyến khích các thành viên duy trì tính toàn vẹn của dữ liệu trong mạng lưới Sui.
Khi dữ liệu trở nên có thể xác minh theo mặc định
Dữ liệu sai lệch đã làm tê liệt toàn bộ các ngành công nghiệp quá lâu. Nếu không có khả năng xác minh độ tin cậy của dữ liệu của chúng ta, chúng ta không thể tiến xa hơn trong các đổi mới mà thế kỷ này hứa hẹn: từ các hệ thống AI được gắn nhãn là đáng tin cậy đến các giao thức DeFi ngăn chặn gian lận và loại bỏ các tác nhân độc hại trong thời gian thực.
Walrus thiết lập hạ tầng làm cho sự thay đổi này trở thành hiện thực. Khi xây dựng trên một nền tảng nơi dữ liệu có thể xác minh từ khi tạo ra, các tổ chức có thể tin tưởng ngay từ ngày đầu tiên rằng các hệ thống của họ được xây dựng trên nền tảng vững chắc và khách quan. Tương lai sẽ không chỉ nhanh hơn hoặc lớn hơn, mà còn đáng tin cậy hơn.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Dữ liệu có thể xác minh: Cách Walrus Giải quyết Khủng hoảng Chất lượng gây thiệt hại hàng tỷ
Ngành công nghiệp đối mặt với một vấn đề âm thầm nhưng tàn phá: khả năng xác minh xem dữ liệu mà chúng ta tin tưởng có thực sự đáng tin cậy hay không. Từ học máy đến quảng cáo kỹ thuật số, các hệ thống quan trọng được xây dựng dựa trên thông tin mà tính xác thực của nó không bao giờ có thể được kiểm chứng. Giải pháp yêu cầu dữ liệu phải có khả năng xác minh từ nguồn gốc của nó.
Trong một thế giới nơi trí tuệ nhân tạo quản lý các quyết định về tín dụng, tuyển dụng và chẩn đoán y tế, rủi ro là cực kỳ lớn. 87% các dự án trí tuệ nhân tạo chưa bao giờ đi vào sản xuất, và nguyên nhân không phải do thuật toán, mà do chất lượng dữ liệu đầu vào của các hệ thống này kém. Đối với một ngành công nghiệp trị giá 200 tỷ đô la, con số này đại diện cho một thất bại lớn.
Tác động vượt ra ngoài AI. Quảng cáo kỹ thuật số, một thị trường trị giá 750 tỷ đô la mỗi năm, mất gần một phần ba khoản đầu tư của mình do gian lận và không chính xác, chủ yếu vì các giao dịch không thể được kiểm toán một cách đáng tin cậy. Ngay cả các ông lớn công nghệ như Amazon cũng đã phải từ bỏ các dự án hoàn chỉnh sau nhiều năm phát triển, phát hiện ra rằng dữ liệu huấn luyện phản ánh các thành kiến phân biệt đối xử. Khi một hệ thống tự động đưa ra quyết định quan trọng, hiếm khi có cách để theo dõi và xác minh tính toàn vẹn của dữ liệu đã tạo ra nó.
Chi phí ẩn của dữ liệu không thể xác minh trong các ngành công nghiệp quan trọng
Dữ liệu lỗi không chỉ phá vỡ các thuật toán; còn làm tăng các lỗi của chúng trên quy mô lớn. Một mô hình được huấn luyện với thông tin thiên vị, bị hỏng hoặc không chính xác không mắc lỗi ngẫu nhiên, mà lặp lại và làm trầm trọng thêm các thành kiến trong quá trình huấn luyện của nó.
Trường hợp của Amazon minh họa rõ thực tế này. Công cụ tuyển dụng của họ không được thiết kế để phân biệt đối xử, mà “học” cách làm điều đó khi được cung cấp các hồ sơ lịch sử chủ yếu là tuyển dụng nam giới. Không có thuật toán nào đủ tinh vi để vượt qua một tập dữ liệu cơ bản bị ô nhiễm.
Thách thức vượt ra ngoài dữ liệu sai lệch. Các bộ dữ liệu huấn luyện được thu thập và xử lý mà không để lại dấu vết xác thực về nguồn gốc, các chỉnh sửa đã thực hiện hoặc các thay đổi về tính toàn vẹn của chúng. Khi những dữ liệu này huấn luyện các hệ thống ra quyết định về cho vay, chẩn đoán hoặc thăng chức, không có cơ chế nào để chứng minh nguồn gốc hoặc liệu chúng có bị thay đổi hay không.
Xác minh mật mã như nền tảng của niềm tin
Xây dựng AI đáng tin cậy đòi hỏi điều gì đó mà bất kỳ trung tâm dữ liệu lớn hơn hoặc bộ xử lý nhanh hơn nào cũng không thể cung cấp: dữ liệu có tính xác thực có thể xác minh từ byte đầu tiên. Walrus thực hiện chính xác điều này, cho phép xác minh dữ liệu từ đầu đến cuối.
Theo mô hình này, mỗi tệp tin đều có một định danh duy nhất và có thể xác minh được. Mọi thay đổi đều được ghi lại trong chuỗi chuỗi bảo quản. Các nhà phát triển có thể chứng minh bằng mật mã nguồn gốc dữ liệu của họ, ai đã chỉnh sửa chúng và liệu chúng còn nguyên vẹn hay không. Khi một cơ quan quản lý chất vấn quyết định của một mô hình phát hiện gian lận, có thể trình bày định danh của blob (một hàm băm duy nhất sinh ra từ chính dữ liệu), hiển thị đối tượng Sui ghi lại lịch sử lưu trữ của nó, và xác minh bằng mật mã rằng dữ liệu huấn luyện chưa từng bị thay đổi.
Walrus tích hợp với hệ sinh thái Sui để điều phối các chương trình trên chuỗi, thiết lập một lớp niềm tin nơi dữ liệu là đáng tin cậy và có thể xác minh theo thiết kế, chứ không chỉ dựa vào niềm tin tốt.
Các trường hợp thành công: Từ Amazon đến Alkimi
Quảng cáo kỹ thuật số là một lĩnh vực khác bị tàn phá bởi thông tin không thể xác minh. Các nhà quảng cáo đầu tư vào một thị trường trị giá 750 tỷ đô la, nhưng phải đối mặt với các báo cáo không chính xác, gian lận hệ thống và các hiển thị do bot tạo ra. Các giao dịch bị phân mảnh giữa nhiều nền tảng, và các hệ thống đo lường hiệu suất chính là những hệ thống hưởng lợi từ việc báo cáo số liệu bị thổi phồng.
Alkimi đang thiết kế lại bức tranh của quảng cáo theo chương trình, làm cho tất cả dữ liệu trở nên có thể xác minh. Mỗi hiển thị, đề nghị và giao dịch đều được lưu trữ trong Walrus với các ghi chú không thể thay đổi. Nền tảng tích hợp mã hóa cho dữ liệu nhạy cảm của khách hàng và xử lý các đối chiếu bằng xác minh mật mã về độ chính xác, biến nó thành giải pháp lý tưởng cho các ngành công nghiệp mà dữ liệu phải là, trên hết, có thể xác minh.
Tương lai của dữ liệu có thể xác minh trong DeFi và AI
Những gì bắt đầu trong AdTech chỉ mới chạm vào bề mặt của các ứng dụng khả thi. Các nhà phát triển trí tuệ nhân tạo có thể loại bỏ thành kiến bằng cách chọn các bộ dữ liệu có nguồn gốc có thể xác minh bằng mật mã. Các giao thức DeFi có thể token hóa dữ liệu đã được xác minh như tài sản thế chấp, tương tự như cách AdFi biến doanh thu quảng cáo đã được chứng minh thành các tài sản có thể lập trình. Các thị trường dữ liệu phi tập trung có thể phát triển mạnh trong khi người dùng kiếm tiền từ thông tin cá nhân của họ, đồng thời duy trì quyền riêng tư được đảm bảo bằng mật mã.
Tất cả điều này đều khả thi vì, lần đầu tiên, dữ liệu không còn yêu cầu niềm tin mù quáng: chúng có thể được chứng minh bằng toán học. WAL (giá $0.09 tại thời điểm viết bài) tạo thành nền tảng kinh tế của hệ sinh thái này, khuyến khích các thành viên duy trì tính toàn vẹn của dữ liệu trong mạng lưới Sui.
Khi dữ liệu trở nên có thể xác minh theo mặc định
Dữ liệu sai lệch đã làm tê liệt toàn bộ các ngành công nghiệp quá lâu. Nếu không có khả năng xác minh độ tin cậy của dữ liệu của chúng ta, chúng ta không thể tiến xa hơn trong các đổi mới mà thế kỷ này hứa hẹn: từ các hệ thống AI được gắn nhãn là đáng tin cậy đến các giao thức DeFi ngăn chặn gian lận và loại bỏ các tác nhân độc hại trong thời gian thực.
Walrus thiết lập hạ tầng làm cho sự thay đổi này trở thành hiện thực. Khi xây dựng trên một nền tảng nơi dữ liệu có thể xác minh từ khi tạo ra, các tổ chức có thể tin tưởng ngay từ ngày đầu tiên rằng các hệ thống của họ được xây dựng trên nền tảng vững chắc và khách quan. Tương lai sẽ không chỉ nhanh hơn hoặc lớn hơn, mà còn đáng tin cậy hơn.