DDR5缺貨更嚴重 輝達、Google搶HBM建構AI生態系
談到價格走勢,苟嘉章表示,不只是現貨價格,OEM市場價格也同步上升,只是下半年漲幅不會像去年第4季與今年上半年如此劇烈,但整體價格仍會持續走高,主因仍是缺貨問題太大。他認為,目前真正供需吃緊的是DDR5,尤其高效能DDR5缺貨更為嚴重;反觀DDR4高價,部分是因代理商提前拉貨與市場炒作,實際基礎需求有限,後續仍有價格修正空間。
對於近期三星罷工議題,苟嘉章認為確實可能造成影響,但整體幅度應不大,估計約5%左右。他也觀察到,隨著韓國記憶體產業景氣大好,企業吸引力與員工分紅都出現變化,SK海力士因獎金優渥,社會形象明顯提升,甚至讓韓國過去「嫁三星」的傳統印象,逐漸轉向「嫁海力士」。
談到HBM市場,他指出,HBM供應不應只被輝達(NVIDIA)綁定,因為Google、博通(Broadcom)、AMD等業者同樣需要HBM。若未來中國市場也能取得HBM,市場結構將更趨分散。他認為,輝達確實帶動整體AI產業與台灣供應鏈向前,但其他業者也希望建立自己的AI生態系,市場回到較平衡狀態並非壞事。
輝達加速主導AI推論市場 KV Cache推升高階NAND需求
苟嘉章坦言,目前輝達生態系資源仍遠大於其他競爭者,因此台灣供應鏈在資源有限情況下,自然會優先配合最大贏家。大型供應商如台達電,可同時支援多個客戶,但中小型廠商往往只能集中資源押注輝達。他也觀察,輝達產品推進節奏極快,Vera Rubin平台持續提前推進,未來AI推論需求將成為下一波重要成長動能。
苟嘉章表示,AI伺服器核心主要分為算力(Compute)、連結(Connectivity),以及記憶體與儲存(Memory、Storage)三大領域。
他認為,輝達在GTC後已不再只是AI訓練(Training)主導者,而是進一步主導AI推論(Inference)市場。Blackwell GB200透過GPU、NVLink、矽光子與BlueField-4等架構,打造低延遲、高擴展性的推論平台,NVL72更可提供約1.16PB容量作為KV Cache使用,將進一步推升高階NAND需求。
苟嘉章指出,AI服務已進入Token經濟學(Token Economics),未來競爭重點不再只是伺服器價格,而是Token成本。隨著代理式AI(Agentic AI)快速發展,KV Cache需求將呈現指數型成長,不可能全部依賴HBM,因此CMX成為新戰場,且已不再只是傳統儲存,而是Compute的一部分。
他表示,KV Cache會依據使用者主題暫存相關資料,讓AI模型回應更有效率。隨著AI應用快速擴大,KV Cache需要更大容量才能發揮效能,部分CPU-only方案雖可涵蓋約50%至60%的企業推論需求,但AI基礎建設成本也持續攀升,沒有錢真的沒辦法競爭AI。
點擊閱讀下一則新聞