HBM vs DRAM:AI 大型模型為何離不開它?儲存晶片從「平面時代」邁向「3D 革命」

市場洞察
更新於: 2026-06-30 04:10

2026年6月30日,比特幣在60,000美元附近窄幅震盪,以太坊維持在1,600美元區間。加密市場經歷6月以來的持續回調後,短期空頭主導格局未改。然而,當加密資產進入「垃圾時間」之際,另一條賽道正經歷前所未有的爆發式成長——半導體儲存。

世界半導體貿易統計組織(WSTS)2026年春季報告大幅上調產業成長預期:2026年全球半導體市場規模有望突破1.51兆美元,年增90%,其中儲存晶片年增高達250%,規模突破8,000億美元。儲存產值將首次超越晶圓代工,成為半導體產業的第一成長極。

而這場儲存革命的絕對主角,正是HBM(High Bandwidth Memory,高頻寬記憶體)。2026年HBM市場規模預計成長58%至546億美元,佔DRAM市場近四成。HBM與DRAM究竟有何不同?AI大型模型為何對HBM如此依賴?

HBM與DRAM:同源不同命

HBM與DRAM共享同一種基礎儲存媒介——動態隨機存取記憶體。然而,兩者的技術路線、架構設計與應用場景,卻走向完全不同的方向。

傳統DRAM走的是「平面擴張」路線。 以DDR4、DDR5為代表的傳統DRAM採用平面架構,透過製程升級(如從20nm推進至2nm)與架構優化(如DDR5預取位數提升)來增強效能。其核心邏輯為:在二維平面上不斷縮小電晶體尺寸、提升頻率。但這條路正逼近物理極限——2nm以下製程面臨量子隧穿效應等難題,僅靠製程微縮已無法滿足AI運算對儲存頻寬的指數級需求。

HBM則選擇了「垂直堆疊」的突破之路。 HBM採用3D結構,利用矽通孔(TSV)技術將多個DRAM裸晶片垂直堆疊,形成立方體結構——在DRAM晶片上開設數千個微孔,透過垂直連通的電極連接上下晶片;底層則設有DRAM邏輯控制單元,負責整體時序與控制。這種「疊羅漢」式設計,使HBM能在極小的物理空間內實現極高的頻寬密度。

兩者在關鍵性能指標上的差距堪稱世代差異:

頻寬方面,傳統DRAM(如DDR5)頻寬約為50-100GB/s,而HBM3E單堆疊頻寬可達1.2TB/s,下一代HBM4預計將提升至2.0TB/s以上。HBM的頻寬是傳統DRAM的10倍以上。

功耗效率方面,HBM可低至5pJ/bit以下,傳統DRAM則為10-15pJ/bit。在動輒數千張GPU同時運作的資料中心,這一差距意味著每年數千萬美元的電費差異。

延遲方面,傳統DRAM憑藉平面架構優勢可維持在10ns級,而HBM因堆疊層數增加,延遲在100ns級。但AI訓練推理場景對「吞吐量」的敏感度遠高於「單次延遲」——大量參數的高速吞吐遠比單次存取的快慢更重要。

成本方面,HBM的生產成本遠高於傳統DRAM。HBM4單Gb成本雖較HBM3下降30%,但仍是同容量DDR5的3-5倍。HBM消耗的晶圓用量約為DDR5的4至5倍,TSV工藝使HBM晶片的位元密度顯著低於同規格DDR——SK海力士D1z DDR4的位元密度為0.296Gb/mm²,比其HBM3(0.16Gb/mm²)高出85%。TSV所需的額外面積與複雜堆疊封裝工藝,是HBM成本居高不下的核心原因。

簡言之:傳統DRAM追求「便宜夠用」,HBM追求「極致頻寬」——這是一場「成本優先」與「頻寬優先」的技術路線之爭

記憶體牆危機:為什麼AI大模型非HBM不可?

AI大模型對HBM的依賴,根源在於業界稱為「記憶體牆」(Memory Wall)的根本性瓶頸。

過去20年間,GPU運算能力提升了6萬倍,而DRAM頻寬僅提升100倍。運算能力提升速度遠高於資料供給速度——就像一輛馬力暴增的賽車,燃油管路卻還是20年前的規格。GPU是引擎,HBM是燃油噴射系統;如果燃油供給速度跟不上,引擎馬力再大也只能空轉。

大型語言模型的運作機制放大了這一矛盾。AI模型生成回答並非簡單檢索靜態資訊,而是持續維護一個包含上下文視窗、鍵值快取(KV Cache)、中間激活與路由決策的「工作狀態」。這些資料需以超低延遲即時存取且隨時可用。在完整Token序列處理過程中,模型需持續存取並更新上下文——即便記憶體延遲微幅上升,也可能導致吞吐量下降、回應延遲,甚至迫使營運商增配硬體。

訓練階段,萬億參數的大模型需在大量資料上反覆迭代,每一次前向傳播與反向傳播都涉及巨量參數的讀取與更新。HBM提供的TB/s級頻寬,是縮短訓練時間的決定性因素。

推理階段,隨著多模態大模型與AI Agent加速發展,Token調用量快速上升。推理應用的瓶頸往往不在於「算得有多快」,而在於「資料餵得有多快」。頻寬的盡頭就是HBM。

在系統層面,AI運作於分層記憶體架構之上:HBM為加速器提供資料,DRAM儲存即時狀態與對話記憶,基於NAND的SSD則為資料集、嵌入、檢索索引、日誌與檢查點提供持久化儲存。HBM處於最接近運算核心的位置,承擔最高頻、最緊急的資料供給任務——這是任何其他儲存媒介無法取代的。

正因如此,所有用於生成式AI訓練與推理的領先AI加速器皆採用HBM。HBM不是AI的「可選配件」,而是決定AI能走多快的「氧氣瓶」。

供需失衡:一場持續數年的結構性短缺

HBM的需求屬於剛性,供給卻是「鎖死」的。

需求端,2026年全球AI基礎設施支出將達4,500億美元,其中推理運算占比首次超過70%,由此帶動GPU、HBM及高速網路晶片的強勁需求。2026年HBM需求成長主要由AI ASIC產能升級推動,每顆AI晶片的HBM容量將從96GB/192GB大幅提升至216GB/288GB。NVIDIA Rubin平台雖單顆GPU的HBM容量與前代持平,但更高的出貨量持續推高整體需求。全球九大雲端服務商2026年合計資本支出預計達約8,300億美元,年增79%。

供給端,儘管三星、SK海力士、美光三大原廠已將70%的新增/可調配產能傾斜至HBM,但HBM產能缺口仍高達50%至60%。截至2026年第一季,三大原廠的HBM產能已全數售罄。根據SemiAnalysis數據,2026年DRAM供應低於需求約7%,HBM缺口6%,2027年擴大至9%。

更關鍵的是供給剛性。即便三大原廠現在決定擴產,受限於TSV工藝、先進封裝良率、設備交付週期等物理限制,新增產能釋放最快也要到2028-2029年。國際投行普遍認為HBM供不應求的結構性短缺至少將持續到2028年。NVIDIA執行長黃仁勳更明確表示:全球HBM供應短缺「根本不是短期市場波動,而會是持續數年的結構性產業困局」。

價格端,三星電子與SK海力士已將2026年HBM3E供應價格上調近20%。HBM4 12層初期合約價預計較2025年HBM3E 12層溢價10%以上。

市場格局:誰在主導這場儲存革命?

HBM市場呈現極高集中度。法人預測,SK海力士2026年出貨市占率約52%,三星電子約39%,美光約8%,中國大陸業者維持極低比重。以銷售額計算,SK海力士2026年HBM營收有望達59.5億美元,穩居全球第一。

2026年第一季全球HBM市場中,SK海力士市占率約51.4%。集邦科技預計其2026年全年HBM市占率可維持約50%;Counterpoint更預測其在HBM4市場的份額將達54%。

三大原廠的毛利率已突破70%甚至80%。HBM的利潤分配呈「金字塔」結構——越接近技術核心與瓶頸環節,分配比例越高。

同時,一個有趣的現象正在發生:通用型DRAM的獲利能力正結構性反超HBM。截至2026年第一季,通用型DRAM與HBM的營業利潤率差距已擴大至逾15個百分點。市場估算顯示,2026年將產能分配給通用DRAM,每片晶圓產生的營收已是HBM的兩倍以上,毛利接近三倍。這正是SK海力士考慮將部分資源重新向通用DRAM傾斜的原因——但這也印證了整個儲存市場正處於全面性的景氣高峰。

投資視角:HBM超級週期中的機會

HBM的結構性短缺與價格上行趨勢,為投資者提供清晰的產業邏輯支撐。

儲存原廠是直接受益者。SK海力士(韓股)、三星電子(韓股)與美光(美股)憑藉技術壟斷與產能稀缺,賺取產業鏈中的絕大部分超額利潤。摩根士丹利基於DRAM均價至2026年上漲62%的預測,將儲存原廠獲利預估上調56%至63%。

產業鏈上游同樣受益。儲存龍頭的大規模擴產直接帶動蝕刻、薄膜沉積、測試等半導體設備需求,產業景氣正從上游向中游傳導。HBM的先進封裝需求也推動了CoWoS等2.5D封裝技術的產業化。

AI晶片廠商是HBM的最終需求方。NVIDIA(美股)、Broadcom(美股)等AI晶片龍頭對HBM的採購需求持續擴大。NVIDIA Rubin Ultra單顆GPU的HBM容量將提升至1TB。

Gate股票交易:一站式參與全球儲存與AI投資

對於希望參與這一波儲存超級週期的投資者,Gate股票提供便捷的入市管道。

目前,Gate股票已形成涵蓋美股、港股與韓股三大核心市場的7×24小時交易服務體系,支援超過10,000檔美股及ETF、1,500餘檔港股及1,000餘檔韓股,合計覆蓋全球超過12,500檔股票及ETF資產。標的涵蓋蘋果、NVIDIA、微軟、騰訊控股、小米集團、三星電子、SK海力士等全球代表性上市公司。

用戶可透過Gate統一帳戶使用USDT一站式參與全球股票投資,支援最低0.01股起投的零股交易,享有股息派發等權益。平台同時支援拆股、合股等公司行動服務,並已實現App與Web雙端全面覆蓋。

Gate股票在原有盤前、盤中及盤後交易基礎上,進一步支援隔夜及週末交易,突破傳統證券市場交易時間限制。券商間轉倉服務也即將上線,將進一步提升用戶股票資產管理的靈活性與便利性。

交易方式:用戶在Gate平台完成統一帳戶儲值後,即可在股票交易模組選擇目標股票,以USDT計價進行買賣。平台提供即時行情、技術分析工具與訂單類型選擇(市價單、限價單等),操作流程與加密資產交易體驗一致。

結語

HBM與DRAM的差異,本質上是「頻寬優先」與「成本優先」兩種技術路線的分野。在AI運算能力持續擴張的背景下,HBM憑藉3D堆疊與TSV技術突破「記憶體牆」,成為大型模型訓練與推理不可替代的核心元件。

2026年,全球半導體市場規模突破1.51兆美元,儲存晶片成長250%,HBM市場成長58%至546億美元。產能缺口高達50%至60%,三大原廠產能全數售罄。這不是一輪普通的週期波動,而是由AI基礎設施長期資本支出驅動的結構性變革。

對投資者而言,儲存原廠、設備材料、AI晶片三大鏈條均存在清晰的產業邏輯支撐。而Gate股票提供的7×24小時美港韓三股交易服務,為全球投資者參與這一波儲存超級週期提供靈活高效的工具。在市場情緒極度恐懼(恐懼指數14-16)的當下,產業基本面與市場情緒之間的背離,往往孕育著最值得關注的結構性機會。

FAQ

Q1:HBM和DRAM的核心差異是什麼?

HBM與傳統DRAM的核心差異在於架構。傳統DRAM採用平面架構,透過製程升級提升效能;HBM則採用3D堆疊技術,利用TSV矽通孔將多個DRAM裸晶片垂直堆疊,實現超寬資料路徑。HBM3E頻寬可達1.2TB/s,是DDR5的10倍以上,但成本也是同容量DDR5的3-5倍。

Q2:為什麼AI大模型必須使用HBM?

大型模型訓練與推理需要大量參數的高速讀寫。傳統DRAM頻寬成長遠落後於運算能力提升(20年運算能力增6萬倍,頻寬僅增100倍),形成「記憶體牆」瓶頸。HBM憑藉TB/s級頻寬,能持續為GPU供給資料,避免運算能力空轉。所有領先的AI加速器都採用HBM。

Q3:HBM市場的主要玩家有哪些?

HBM市場高度集中。SK海力士2026年出貨市占率約52%,三星約39%,美光約8%。SK海力士以銷售額計算穩居第一,2026年HBM營收有望達59.5億美元。三大原廠2026年全部HBM產能已售罄,部分客戶已將產能鎖定至2028年。

Q4:HBM供不應求的狀況會持續多久?

國際投行普遍認為HBM供不應求將至少持續到2028年。需求端受AI基礎設施資本支出驅動,供給端受TSV工藝、封裝良率、設備交付週期等物理限制。即便現在擴產,新增產能釋放最快也要到2028-2029年。黃仁勳稱這是「持續數年的結構性產業困局」。

Q5:如何在Gate平台投資HBM相關股票?

Gate股票支援美股、港股、韓股7×24小時交易,覆蓋超12,500檔股票及ETF。用戶可透過統一帳戶使用USDT一站式投資,最低0.01股起投。HBM相關標的包括儲存原廠SK海力士(韓股)、三星電子(韓股)、美光(美股),以及AI晶片廠商NVIDIA(美股)等。

Like the Content