【GTC 2026】：黃仁勳於開幕演說親自發表Groq 3 LPU，為資料中心帶來10倍收益能力

NVIDIA GTC 2026 GPU技術大會於3月16~19日在美國聖荷西舉行，NVIDIA執行長黃仁勳於開幕演說中以DLSS 5做為開頭，並發表Groq 3 LPU語言處理器加速器。

不只升頻，更透過神經網路渲染

先前DLSS技術的應用主要聚焦於升頻，透過超解析度（Super Resolution）與畫格生成（Frame Generation）等方式提高遊戲的FPS效能，帶來更流暢的視覺體驗。但黃仁勳在GTC 2026 CEO Keynote演說中提到現在AI的推論膨脹（Inference Inflation）時刻已經降臨，無論是思考（Think）、推論（Inference）、推理（Reasoning）等環節所消耗的運算量與字詞（Token）都成爆炸性成長，而3D繪圖也開始往AI運算靠攏。

DLSS 5的重點功能在於神經網路渲染（Neural Rendering），能夠透過神經網路模型生成畫面中角色、頭髮、皮膚、衣物材質、環境物件、光線等元素，並在節省整體運算資源的前提下生成照片級的逼真影像，同時也讓遊戲開發者能夠透過細膩的選項與遮罩控制AI的效果與範圍，提供全新的視覺創作的可能性。

▲ NVIDIA執行長黃仁勳回顧過去20年CUDA通用運算架構的成長動力，由創新、生態系統、安裝基數、開發者等要素組成循環，並強調廣大安裝基數的一大優勢在於軟體效能改善時，將有數以百萬計的開發者與使用者同時受惠。

▲ 回顧過去3年的AI推論運算狀況，模型與字詞的規模成長幅度皆達到100倍之譜，可以說是面臨到「推論膨脹」的狀況。

▲ 受到推論膨脹的影響，市場需要更大量的運力與基礎建設，也讓NVIDIA完整堆疊的產值仍在不斷增長。

▲ DLSS 5除了透過AI改善遊戲效能與流暢度之外，更是藉由神經網路渲染帶來更加逼真的畫質表現。

▲在展示影片中可以看到DLSS 5帶來材質紋理與光線、陰影效果的提升。

Token加速器讓你買越多賺越多

黃仁勳除了在舞台上展示了在CES 26提到的Vera CPU（處理器）、Rubin GPU（繪圖處理器）、ConnectX-9乙太網路、BlueField-4 DPU（資料處理器）、NVLink 6交換器、Specturm-X矽光子乙太網路等6種晶片（詳細介紹請點我）之外，並首度揭露Groq 3 LPU（語言處理器）。

Groq 3的設計理念為針對LLM的AI推論運算進行加速，它採用Samsung的晶圓代工服務，雖然它本體搭載的SRAM（靜態隨機存取記憶體）容量僅有500 MB，但是頻寬高達150 TB/s，遠高於HBM 4高頻寬記憶體的22 TB/s，能夠有效提高字詞的生成速度，進而提高AI工廠的產能。

黃仁勳在演說中補充到，Vera Rubin的主要任務為提高AI運算的吞吐量，而Groq則是負責降低延持，彼此相輔相成有助於進一步增加AI工廠的收益能力。根據NVIDIA提供的數據，Rubin NVL72架構搭配Groq 3 LPX整合系統能在參數量達到2兆的GPT MoE 2T混合專家模型中，將AI推論運算效能提高至Blackwell NVL72架構的35倍，滿足頂級市場區間的運算需求。

黃仁勳也在舞台上展示了預計於2027年推出的Vera Rubin Ultra運算托盤，並表示在Vera Rubin與Vera Rubin Ultra世代皆會提供以光纖通訊為基礎的Oberon Scale-Up擴展方案，以及以銅線通訊為基礎的Kyber方案，讓企業能夠依據需求選擇更適合自己的解決方案。

▲ 與先前H200 NVL8相比，本世代的GB 300 NVL72在電力效率上有50倍提升，生成字詞的成本則降低35倍。黃仁勳也幽默地自封為「GB NVL72推論之王」。

▲ 下世代的VR家族將由7種不同晶片組成，除了我們先前介紹過的6種晶片之外，加上這次發表的Groq 3 LPU（語言處理器）。

▲ Groq 3的最大特色在於晶片上整合效能極高的SRAM，雖然容量僅有500 MB，但仍可大幅提高AI推論效能，並加速生成字詞。

▲ 與x86處理器搭配Hopper GPU相比，VR家族7種晶片的整合系統能夠在同為1 GW耗電量的條件下，讓每秒生成的字詞數量由2百萬提升至7億，成長幅度達到350倍。

▲ 圖中左起分別為Groq 3運算托盤、NVL交換器托盤、Vera Rubin運算托盤。

▲ 其中Groq 3運算托盤具有8組Groq 3 LPU，並具有主控處理器、相當於次處理器的FGPA、BlueField-4資料處理器、LPU C2C互連等元件。

▲ 另一區展示左起分別為BF4 STX儲存托盤、Vera運算托盤（由純CPU組成）、Spectrum-X CPO交換器托盤（具有矽光子通迅功能）。黃仁勳手持晶片為採用矽光子共同封裝的Spectrum CPO晶片。

▲ Vera Rubin運算托盤採用無纜線與水冷設計，托盤間的通訊也採用模組化的結構化纜線（structural Cable），能大幅簡化機櫃組裝，將施工時間由2天縮短至2小時。

▲ 黃仁勳也在舞台上展示了預計於2027年推出的Vera Rubin Ultra運算托盤。

▲ Blackwell NVL72架構在中階AI推論應用的效能較Hopper架構提高35倍，並打開參數量更大的高階AI推論應用市場區間，有助於服務提供商提高產品定價。

▲ Rubin NVL72架構除了較Blackwell NVL72架構提高2~3倍效能，更大的吞吐量讓它開創更高階的頂級（Premium）市場，藉由服務更有價值的客戶大幅提高產品定價，並創造更大的收益。

▲ Rubin NVL72架構搭配Groq 3 LPX能進一步將頂級的效能表現提高至Blackwell NVL72架構的35倍。

▲ Rubin世代解決方案能夠帶來5倍於Blackwell世代的收益能力，Vera Rubin搭配LPX的整合系統更能將年度收益推上3000億，10倍於Blackwell。

▲ 從產品路線圖可以看到2026與2027年NVIDIA將聚焦於Vera Rubin與Vera Rubin Ultra架構，2028年則會推出Rosa Feynman架構。

▲黃仁勳於GTC 2026開幕演說之重播影片。

讀者可以在NVIDIA官方YouTube頻到觀賞GTC 2026開幕演說重播影片，筆者也會持續帶來更多報導，請讀者保持關注。

【GTC 2026】：黃仁勳於開幕演說親自發表Groq 3 LPU，為資料中心帶來10倍收益能力

不只升頻，更透過神經網路渲染

Token加速器讓你買越多賺越多

您可能也會喜歡

XRP 正在形成自 2015 年以來建立的多週期三重底部

MICA Daily｜BTC 穩在 30 日移動平均線上，繼續保持有望看漲

川普直白揚言拿下古巴，華府石油禁運下島國大停電

熱門新聞

XRP 正在形成自 2015 年以來建立的多週期三重底部

MICA Daily｜BTC 穩在 30 日移動平均線上，繼續保持有望看漲

川普直白揚言拿下古巴，華府石油禁運下島國大停電

比特幣衝上75,500美元、以太坊叩關2400，摩根士丹利：油價飆升不動搖6月、9月降息預測

三星領投愛爾蘭新創 GridBeyond，虛擬電廠技術助數據中心應對 AI 電力需求

快速閱讀

Ethereum (ETH) 價格預測：市場預測與分析

Bitcoin (BTC) 價格預測：市場預測與分析

Ethereum (ETH) 7日價格變化

Ethereum (ETH) 短期價格預測

巨鯨悄悄建倉？鏈上數據揭示 Beeg Blue Whale (BEEG) 背後的聰明錢動向

加密貨幣價格