Meta 本週發布 Brain2Qwerty v2,一套透過頭盔式 MEG(腦磁圖)掃描器記錄神經活動、以端到端深度學習模型直接解碼目標文字的非侵入式腦機介面系統,平均單字準確率達 61%。Meta 同步開源程式碼與資料集作為其 Digital Brain Project 的一部分,並設立 500 萬美元基金。
Brain2Qwerty v2 的技術架構:訓練規模與端到端解碼方法
此系統採用端到端(end-to-end)深度學習模型,直接從原始 MEG 腦訊號解碼至輸出文字,不依賴手工設計的中間處理步驟;大型語言模型在後段根據語意脈絡修正雜訊引起的錯誤。
訓練資料規模:約 22,000 個句子,9 位志願者,每人約 10 小時錄製資料。Meta 表示準確率將隨訓練資料量增加持續提升。作為技術對照,v1 版本在 MEG 條件下的字元錯誤率(CER)約為 32%;同任務換用 EEG(腦電圖)則攀升至約 67%。
MEG 的技術優勢與現有設備限制
MEG 利用超導感測器偵測神經元活動時產生的極微磁場,磁場穿透性優於 EEG,訊號相對清晰;但 MEG 頭盔造價數百萬美元,且需要隔絕外部磁場的特殊環境,長期限於神經科學實驗室,尚未進入臨床或消費者應用。
Brain2Qwerty v2 在此設備限制下達到 61% 準確率,逼近過去僅植入式介面(如 Neuralink)才能達到的水準。Meta 選擇非侵入式路線的出發點是:植入式介面的手術門檻使多數潛在受益者難以接受。
Meta 的開源計劃:Digital Brain Project 與 500 萬美元基金
Meta 在發布 Brain2Qwerty v2 時同步公開系統程式碼與訓練資料集,作為 Digital Brain Project 的組成部分。Meta 另設立 500 萬美元基金,專用於支援開放神經科學資料集建設。
Meta 指出,非侵入式 BCI 研究的瓶頸之一是缺乏公開的大規模神經資料集,目前各研究機構重複收集基礎資料效率極低;此基金旨在推動社群共同建構基準資料。
常見問題
非侵入式與植入式腦機介面的核心技術差距是什麼?
植入式介面(如 Neuralink)直接在腦皮層埋入電極,訊號乾淨、延遲低、精度高,但需外科手術。非侵入式方法的主要挑戰是訊噪比:頭骨與頭皮嚴重衰減訊號,EEG 尤甚;MEG 穿透性相對較好,但設備成本和環境要求限制了普及。
Brain2Qwerty v2 的「端到端」模型有何技術意義?
端到端模型直接從原始 MEG 訊號解碼至輸出文字,不需研究人員手工設計中間步驟(如先識別特定腦電事件再逐步推導字母)。Meta 並在研發過程中以 AI agents 系統性探索解碼流程的最佳化空間,工程師從中選定最終訓練配置。
此系統何時可能進入臨床或商業市場?
Brain2Qwerty v2 目前在實驗室 MEG 設備條件下測試,屬研究階段系統,尚未進入臨床試驗或商業化程序。Meta 表示準確率仍有提升空間,但臨床或商業化時程截至報道時尚未公布。