Google、Amazon、Microsoft、Meta、Oracle這五家北美雲端巨頭持續加碼AI基礎設施投資,到底在搶什麼?答案很直接:NVIDIA的整櫃式AI伺服器

以Vera Rubin NVL72為代表的rack-scale AI超級電腦,採用液冷技術、整合數十顆GPU與CPU的高密度算力機櫃,市場推估單櫃造價在新台幣數億元等級,整櫃重量可能接近數公噸、功耗上看百千瓦級。用半導體業的講法,這就是把頂級運算能力濃縮進機房的終極方案。

算力競賽的殘酷現實

研調機構預估,北美五大雲端巨頭的AI相關資本支出在未來數年將維持倍數級成長,相當比例將投入採購NVIDIA的高階AI伺服器與相關基礎設施。

這場競賽的邏輯很直接:算力即競爭力,誰在AI基礎建設上落後,誰就可能在AGI(通用人工智慧)賽局中失去先機。生成式AI已從單純的對話模型,進化為能自主解決複雜任務的「代理型AI」與「實體AI」。推論需求呈指數級爆發,迫使雲端服務供應商不得不持續加碼投資。

黃仁勳那句「買越多,省越多」,如今成了推動客戶採購的核心論述。從工程角度看,這句話不完全是行銷話術——當推論需求成長速度遠超硬體折舊速度時,提前布局確實比分批採購更划算。

從晶片供應商到平台商

過去,NVIDIA賣的是單張GPU或HGX基準板,客戶可以自行設計散熱與機殼。但進入Blackwell與Rubin時代,單晶片功耗大幅提升,傳統氣冷已無法有效散熱。NVIDIA因此改為推廣整座液冷機櫃(NVL72)的交付模式。

這不只是產品形式的改變,而是商業模式的升級——從晶片供應商變成「資料中心基礎設施平台商」。

依照目前公開資訊,Vera Rubin NVL72單櫃整合72顆Rubin GPU與36顆Vera CPU,採用新一代HBM與第六代NVLink架構。市場預期其整櫃AI推論效能將遠超Blackwell世代,有部分供應鏈分析甚至推估在特定工作負載下可達數倍以上的性能提升,但NVIDIA尚未公布完整、可比對的EFLOPS規格與官方售價。

更值得關注的是,市場傳出NVIDIA計畫在Rubin世代進一步推廣L10/L11等高整合交付模式,由NVIDIA直接掌握CPU、GPU、散熱與關鍵介面設計,再交由代工廠完成最終組裝。這個策略會壓縮傳統ODM的設計與獲利空間。

台灣供應鏈的位置

台灣供應鏈無疑是這波AI基礎建設浪潮的主要受益者。台積電的CoWoS先進封裝、鴻海的整合能力、廣達的伺服器組裝、奇鋐的散熱模組,全都參與NVIDIA的生態。

鴻海董事長劉揚偉直言:「鴻海早已不是單純的組裝廠,而是系統整合商。」鴻海在2025年GTC技術大會上首次完整展出Vera Rubin NVL72平台整機櫃方案,展現其在AI伺服器領域的技術實力。

但挑戰也隨之而來。當NVIDIA推動更高整合度的交付模式後,台廠會不會逐漸失去核心設計的議價能力,淪為高階組裝角色?這是供應鏈必須正視的課題。

另一個值得關注的是記憶體供需動態。研調預期,NVIDIA所帶動的AI伺服器與加速卡需求,將在2026-2027年成為記憶體市場成長的主要動能之一。部分報告甚至認為AI相關需求可能在規模上逼近、甚至超過智慧手機陣營,帶動記憶體進入新一輪景氣循環與價格上升。

長期挑戰:投資如何回收

雲端服務供應商持續投入巨額資本購買算力基礎設施,但硬體效能迭代速度極快。NVIDIA大約每兩年將新世代產品效能提升數倍,導致舊款GPU可能迅速失去競爭優勢。

「AI資料中心要如何回收投資?」這個問題,至今仍是產業共同面對的挑戰。若AI商業模式無法快速成熟,雲端服務供應商可能面臨「算力佃農」的風險——硬體折舊極快、回收期拉長,在短期財報上承受壓力。但不持續投資,又可能在競爭中失去市場地位。

這種兩難,正是當前AI產業發展的真實寫照。從工程角度看,這就像在產線投片前就得先決定要用哪一代製程——押對了吃肉,押錯了可能連湯都沒得喝,但不押注就只能看別人吃。

註:本文部分數據來自研調機構與供應鏈推估,非NVIDIA官方最終規格,僅供參考。