OpenAI 公布 MRC 超級電腦網路協議!攜手輝達、AMD、微軟打造 Stargate 基礎設施

鏈新聞abmedia

OpenAI 宣布推出全新 AI 超級電腦網路協議 MRC(Multipath Reliable Connection),並已透過 Open Compute Project(OCP)開源釋出。這項技術由 OpenAI 與 AMD、Microsoft、NVIDIA、Intel、Broadcom 等業者共同開發,目標是解決超大型 AI 訓練叢集在 GPU 之間的資料傳輸瓶頸。

AI 訓練真正瓶頸是 GPU 之間如何溝通

OpenAI 表示,隨著 ChatGPT 每週使用人數已超過 9 億,AI 系統正逐漸成為基礎設施等級的服務。為了支撐下一代模型訓練與推論需求,OpenAI 認為不只模型本身需要進化,連網路架構都必須重新設計。

OpenAI 在技術文章中指出,大型 AI 模型訓練時,一次訓練步驟可能涉及數百萬次 GPU 間資料交換。只要其中一個傳輸延遲,就可能讓整個訓練同步停滯,導致大量 GPU 閒置。

而當 AI 超級電腦規模越來越大,網路壅塞、交換器故障、延遲抖動(jitter)等問題會急遽放大。OpenAI 認為,這也是 Stargate 超級電腦計畫中最核心的技術挑戰之一。

過去資料中心的網路架構,多數採用單一路徑傳輸(single-path)。但 MRC 最大的改變,是讓同一份資料能同時分散到數百條路徑傳輸。

MRC 是什麼?OpenAI:讓 AI 網路變自動閃避障礙物

根據 OpenAI 與 AMD 的說法,MRC 的核心概念是:

將資料拆散,同時走多條路徑

在微秒級別自動繞過故障

減少網路壅塞造成的延遲

讓 GPU 保持同步運作

AMD 形容,傳統 AI 網路像是高速公路只走單一路線,一旦塞車或事故就會影響整體進度;MRC 則像是具備即時改道能力的智慧交通系統。AMD 甚至直言:「AI 規模化真正的瓶頸已經不是 GPU 與 CPU,而是網路。」

為什麼 OpenAI 要自己設計網路協議?

這次 OpenAI 釋出的訊號非常明確:AI 競爭已經不只是模型競爭,而是整套「超級電腦基礎設施」競爭。OpenAI 在文章中提到,在 Stargate 出現之前,他們與合作夥伴已共同維護三代 AI 超級電腦。這些經驗讓 OpenAI 得出一個結論:若想在 Stargate 規模下有效使用算力,整個 stack 都必須大幅降低複雜度。其中就包含網路層。

也就是說,未來 Frontier Model 的競爭,不再只是誰有更強模型,而是誰能更有效率地讓數十萬、甚至數百萬 GPU 同步運作。

MRC 背後是 Stargate:OpenAI 的曼哈頓計畫

MRC 的背景,其實是 Stargate LLC。Stargate 是 OpenAI、SoftBank Group、Oracle Corporation 與 MGX 推動的大型 AI 基礎設施計畫,最初目標是在美國投資高達 5,000 億美元 AI 基礎設施。OpenAI 表示,目前已超過原本 10GW 的階段性目標,且最近 90 天新增超過 3GW AI 基礎設施容量。

其中位於德州 Abilene 的 Stargate 超級電腦,正是 MRC 主要部署場域之一。OpenAI 指出,MRC 已整合進最新 800Gb/s 網路介面,並在實際大型訓練叢集中運行。

這篇文章 OpenAI 公布 MRC 超級電腦網路協議!攜手輝達、AMD、微軟打造 Stargate 基礎設施 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

B.AI API 推出四款新模型,包括在 OpenAI 發布後 48 小時內推出的 GPT-5.5 Instant

B.AI API 已推出四款新模型:GPT-5.5 Instant、DeepSeek-v3.2、MiniMax-M2.7 和 GLM-5.1。GPT-5.5 Instant 在 OpenAI 發布後 48 小時內完成底層適配與介面整合,實現零延遲存取以

GateNews1分鐘前

Tether 的 17 億醫療 AI 模型今天表現優於 16 倍規模的競爭對手

根據 Tether 的 AI 研究團隊,該公司今天推出 QVAC MedPsy 系列醫療語言模型,旨在不依賴雲端的情況下,支援在智慧型手機與穿戴式裝置上進行本地部署。該 17 億參數版本在七項醫療基準上得分 62.62,超越 Google MedGemma-4B

GateNews12分鐘前

Anthropic 預上市估值達到 1.2 萬億美元,較 OpenAI 高出 20%

根據 Odaily,Anthropic 在基於區塊鏈的上市前(pre-IPO)市場中的隱含估值達到 1.2 萬億美元,較 OpenAI 約高出 20%。若公司以此估值上市,其市值將在全球範圍內成為第 11 大最大公開上市公司,位居 Apple 之後,

GateNews16分鐘前

南韓股市反彈在 AI 熱潮推動下,跑贏全球市場

南韓股市正經歷前所未有的漲勢,受人工智慧相關的半導體個股推動。根據 Financial Modeling Prep 的資料、並由 Axios 分析引用,今年 KOSPI 指數上漲 78%,在全球所有其他主要市場之上。 AI

Crypto Frontier24分鐘前

DeepL 將裁減 25% 員工(約 250 名員工)以重組 AI 事業

根據《彭博》,翻譯工具公司 DeepL 今日(5 月 7 日)宣布,將裁撤約 25% 的員工,約 250 名員工,以因應由人工智慧驅動的結構性變化。執行長 Jarek Kutylowski 在 LinkedIn 上表示,公司將減少管理人員……

GateNews55分鐘前

NVIDIA 發表 Nemotron 3 Nano Omni 開源多模態

NVIDIA 公布 Nemotron 3 Nano Omni 開源多模態模型,將視覺、語音與語言整合於單一模型,作為 AI 代理的感知層。核心為 30B-A3B MoE、256K context、9x 吞吐,支援文字、影像、音訊、影片等輸入,輸出為文字。與 Nemotron 3 Super/Ultra 協同,適用電腦操作、文件智慧與音畫理解等場景,並公開權重與訓練資料,部署覆蓋本地、NIM 與第三方平台。

鏈新聞abmedia1小時前
留言
0/400
暫無留言