OpenAI 公布 MRC 超級電腦網路協議！攜手輝達、AMD、微軟打造 Stargate 基礎設施

2026-05-06 16:05:20

OpenAI 宣布推出全新 AI 超級電腦網路協議 MRC（Multipath Reliable Connection），並已透過 Open Compute Project（OCP）開源釋出。這項技術由 OpenAI 與 AMD、Microsoft、NVIDIA、Intel、Broadcom 等業者共同開發，目標是解決超大型 AI 訓練叢集在 GPU 之間的資料傳輸瓶頸。

AI 訓練真正瓶頸是 GPU 之間如何溝通

OpenAI 表示，隨著 ChatGPT 每週使用人數已超過 9 億，AI 系統正逐漸成為基礎設施等級的服務。為了支撐下一代模型訓練與推論需求，OpenAI 認為不只模型本身需要進化，連網路架構都必須重新設計。

OpenAI 在技術文章中指出，大型 AI 模型訓練時，一次訓練步驟可能涉及數百萬次 GPU 間資料交換。只要其中一個傳輸延遲，就可能讓整個訓練同步停滯，導致大量 GPU 閒置。

而當 AI 超級電腦規模越來越大，網路壅塞、交換器故障、延遲抖動（jitter）等問題會急遽放大。OpenAI 認為，這也是 Stargate 超級電腦計畫中最核心的技術挑戰之一。

過去資料中心的網路架構，多數採用單一路徑傳輸（single-path）。但 MRC 最大的改變，是讓同一份資料能同時分散到數百條路徑傳輸。

MRC 是什麼？OpenAI：讓 AI 網路變自動閃避障礙物

根據 OpenAI 與 AMD 的說法，MRC 的核心概念是：

將資料拆散，同時走多條路徑

在微秒級別自動繞過故障

減少網路壅塞造成的延遲

讓 GPU 保持同步運作

AMD 形容，傳統 AI 網路像是高速公路只走單一路線，一旦塞車或事故就會影響整體進度；MRC 則像是具備即時改道能力的智慧交通系統。AMD 甚至直言：「AI 規模化真正的瓶頸已經不是 GPU 與 CPU，而是網路。」

為什麼 OpenAI 要自己設計網路協議？

這次 OpenAI 釋出的訊號非常明確：AI 競爭已經不只是模型競爭，而是整套「超級電腦基礎設施」競爭。OpenAI 在文章中提到，在 Stargate 出現之前，他們與合作夥伴已共同維護三代 AI 超級電腦。這些經驗讓 OpenAI 得出一個結論：若想在 Stargate 規模下有效使用算力，整個 stack 都必須大幅降低複雜度。其中就包含網路層。

也就是說，未來 Frontier Model 的競爭，不再只是誰有更強模型，而是誰能更有效率地讓數十萬、甚至數百萬 GPU 同步運作。

MRC 背後是 Stargate：OpenAI 的曼哈頓計畫

MRC 的背景，其實是 Stargate LLC。Stargate 是 OpenAI、SoftBank Group、Oracle Corporation 與 MGX 推動的大型 AI 基礎設施計畫，最初目標是在美國投資高達 5,000 億美元 AI 基礎設施。OpenAI 表示，目前已超過原本 10GW 的階段性目標，且最近 90 天新增超過 3GW AI 基礎設施容量。

其中位於德州 Abilene 的 Stargate 超級電腦，正是 MRC 主要部署場域之一。OpenAI 指出，MRC 已整合進最新 800Gb/s 網路介面，並在實際大型訓練叢集中運行。

這篇文章 OpenAI 公布 MRC 超級電腦網路協議！攜手輝達、AMD、微軟打造 Stargate 基礎設施最早出現於鏈新聞 ABMedia。

免責聲明：本頁面資訊可能來自第三方來源，僅供參考，不代表 Gate 的立場或觀點，亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險，請勿僅依賴本頁資訊作出決策。詳情請參閱免責聲明。