QVAC Genesis II:AI訓練新標準,擁有1480億代幣

robot
摘要生成中

Tether Data 取得了邁向開放科學的重要一步,推出了 QVAC Genesis II — 一個包含 1480 億個代幣的教育數據集,涵蓋 19 個學術領域。先前版本 Genesis I 包含 410 億個代幣,增長超過 150%,使其成為全球最大公開可用的合成訓練數據集。

為何 1480 億代幣是遊戲規則的改變?

大多數現代 AI 訓練數據集仍然封閉在專有系統中,限制了獨立研究者和學術機構的存取。Genesis II 改變了這一動態,將大量數據以 Creative Commons Attribution–NonCommercial 4.0 開放授權提供。這個 1480 億代幣的規模,使模型能夠更深入理解事物 — 不僅預測文本,還能解釋其選擇和推理。

Tether Data 提出了一種名為 Option-Level Reasoning 的新工作方法。它不再將多選測驗中的正確答案視為唯一學習途徑,而是分析每個選項 — 無論正確或常見錯誤觀念。這樣,模型學會辨識為何某個答案失敗,而不僅僅是記住哪個是正確的。

結構與可用性

該數據集涵蓋 19 個學術領域,專注於深層次的教育理解。每個元素都經過設計,具有教育價值 — 將失敗分析與 Option-Level Reasoning 結合成雙階段驗證流程。Genesis II 可在 Hugging Face 平台獲取,附有完整的文件和工具。

獨立測試顯示,基於 Genesis II 訓練的模型在推理準確度上更高,並能提供更一致的解釋。這種從表面流暢性向結構化理解的轉變,是一個關鍵的差異。

去中心化 AI 的願景

Tether 總經理 Paolo Ardoino 強調了該項目的理念:「如今大多數 AI 訓練專注於流暢性,而非理解。透過這次發布,我們走得更遠 — 強調結構、推理與清晰度。」開放提供 1480 億代幣,使研究者能在不依賴集中式雲平台的情況下建立 AI 系統。

此舉支持去中心化的 AI 發展,並消除較小研究團隊面臨的結構性障礙。隨著 AI 在教育、科學和金融服務中的擴展,開放、可解釋且可靠的訓練數據集的重要性將日益增加 — Genesis II 為此類數據集樹立了新標準。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
  • 熱門 Gate Fun

    查看更多
  • 市值:$3355.17持有人數:1
    0.00%
  • 市值:$3355.17持有人數:1
    0.00%
  • 市值:$3358.62持有人數:1
    0.00%
  • 市值:$3358.62持有人數:1
    0.00%
  • 市值:$3355.17持有人數:1
    0.00%
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)