NVIDIA 預計在下週 3 月 16 日至 19 日舉辦的 GTC 大會中,發布至少兩款重磅產品,其中最受矚目的就是偏向推理運算的 LPU,以及下世代 GPU 架構「費曼」(Feynman) 。Feynman 延續了 NVIDIA 以著名科學家命名的傳統,雖然在去年的發展路線圖中就曾露面,但當時僅提到將搭配下世代 HBM 記憶體,詳細資訊非常有限 。
全球首發 1.6 奈米製程,台積電背面供電技術助陣
根據最新的爆料資訊,Feynman 顯示卡將首發採用台積電的 A16 製程 。這不僅是全球首款 1.6 奈米級製程,更是台積電首度導入 SPR(背面供電網路)技術的製程 。這項技術不僅能提升電晶體密度與效能,更大幅強化了供電能力,主要是為了滿足高效能運算(HPC)的極端需求 。
不過,A16 製程的代工價格非常昂貴。為了降低成本並提升產能,傳出 NVIDIA 計劃將部分封裝訂單轉向 Intel,利用 Intel 的 EMIB-T 封裝技術,減少對台積電 CoWoS 封裝的依賴 。
功耗直奔 1000W 以上,液冷散熱成標準配備
Feynman 預計將把 AI 效能推向新高度,但伴隨而來的是驚人的功耗問題 。現有的 Blackwell 架構功耗已接近 1000W,雙晶片的 Blackwell Ultra 甚至達到 1400W 。Feynman 的基本功耗也將從 1000W 起跳,若是雙晶片版本,功耗甚至可能挑戰 2000W 。
隨著功耗大漲,散熱設計也必須全面翻新。由於後續的 Vera Rubin 架構已明確規定全部採用液冷散熱,預期 Feynman 也將全面轉向更高效的液冷系統 。此外,雖然有傳言指 Feynman 會整合 Groq 的 LPU 技術,但考量到架構設計時程以及訓練與推理需求的差異,NVIDIA 更有可能將 LPU 作為獨立產品線推出 。
遊戲玩家還要再等等,2029 年才有望與 Feynman 見面
對於廣大的遊戲玩家來說,Feynman 顯示卡雖然強大,但距離實際上市還很遙遠 。Feynman 主要是鎖定 2028 年的市場需求 。明年下半年的遊戲卡升級預計會先採用 Rubin 架構,想要看到採用 Feynman 架構的遊戲顯示卡,最快可能要等到 2029 年了 。
NVIDIA 再次透過製程與架構的升級,展現其在 AI 領域的霸主地位。然而,1000W 甚至 2000W 的功耗,反映出高效能運算背後極大的能源代價。未來資料中心的建置不僅要搶晶片,更要搶電網與散熱方案。對於一般玩家而言,這類頂級架構的技術下放雖令人期待,但如何平衡功耗與家用的散熱環境,將是未來幾年顯示卡發展的一大挑戰。
- 延伸閱讀:輝達次世代「Vera Rubin」AI 系統棄用美光 HBM4?傳 SK 海力士與三星瓜分訂單
- 延伸閱讀:GIGABYTE 與輝達推出迷你 AI TOP ATOM 超級電腦,桌面小空間就是你的 AI 實驗室
- 延伸閱讀:輝達豪擲10億美元入股諾基亞:黃仁勳劍指6G霸權,重塑美國電信領導地位


