NVIDIA GTC 2026 GPU技術大會於3月16~19日在美國聖荷西舉行,NVIDIA執行長黃仁勳於開幕演說中以DLSS 5做為開頭,並發表Groq 3 LPU語言處理器加速器。NVIDIA GTC 2026 GPU技術大會於3月16~19日在美國聖荷西舉行,NVIDIA執行長黃仁勳於開幕演說中以DLSS 5做NVIDIA GTC 2026 GPU技術大會於3月16~19日在美國聖荷西舉行,NVIDIA執行長黃仁勳於開幕演說中以DLSS 5做為開頭,並發表Groq 3 LPU語言處理器加速器。NVIDIA GTC 2026 GPU技術大會於3月16~19日在美國聖荷西舉行,NVIDIA執行長黃仁勳於開幕演說中以DLSS 5做

【GTC 2026】:黃仁勳於開幕演說親自發表Groq 3 LPU,為資料中心帶來10倍收益能力

2026/03/17 06:37
閱讀時長 10 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 crypto.news@mexc.com 聯絡我們。

NVIDIA GTC 2026 GPU技術大會於3月16~19日在美國聖荷西舉行,NVIDIA執行長黃仁勳於開幕演說中以DLSS 5做為開頭,並發表Groq 3 LPU語言處理器加速器。

不只升頻,更透過神經網路渲染

先前DLSS技術的應用主要聚焦於升頻,透過超解析度(Super Resolution)與畫格生成(Frame Generation)等方式提高遊戲的FPS效能,帶來更流暢的視覺體驗。但黃仁勳在GTC 2026 CEO Keynote演說中提到現在AI的推論膨脹(Inference Inflation)時刻已經降臨,無論是思考(Think)、推論(Inference)、推理(Reasoning)等環節所消耗的運算量與字詞(Token)都成爆炸性成長,而3D繪圖也開始往AI運算靠攏。

DLSS 5的重點功能在於神經網路渲染(Neural Rendering),能夠透過神經網路模型生成畫面中角色、頭髮、皮膚、衣物材質、環境物件、光線等元素,並在節省整體運算資源的前提下生成照片級的逼真影像,同時也讓遊戲開發者能夠透過細膩的選項與遮罩控制AI的效果與範圍,提供全新的視覺創作的可能性。

NVIDIA執行長黃仁勳回顧過去20年CUDA通用運算架構的成長動力,由創新、生態系統、安裝基數、開發者等要素組成循環,並強調廣大安裝基數的一大優勢在於軟體效能改善時,將有數以百萬計的開發者與使用者同時受惠。

回顧過去3年的AI推論運算狀況,模型與字詞的規模成長幅度皆達到100倍之譜,可以說是面臨到「推論膨脹」的狀況。

受到推論膨脹的影響,市場需要更大量的運力與基礎建設,也讓NVIDIA完整堆疊的產值仍在不斷增長。

DLSS 5除了透過AI改善遊戲效能與流暢度之外,更是藉由神經網路渲染帶來更加逼真的畫質表現。

▲在展示影片中可以看到DLSS 5帶來材質紋理與光線、陰影效果的提升。

Token加速器讓你買越多賺越多

黃仁勳除了在舞台上展示了在CES 26提到的Vera CPU(處理器)、Rubin GPU(繪圖處理器)、ConnectX-9乙太網路、BlueField-4 DPU(資料處理器)、NVLink 6交換器、Specturm-X矽光子乙太網路等6種晶片(詳細介紹請點我)之外,並首度揭露Groq 3 LPU(語言處理器)。

Groq 3的設計理念為針對LLM的AI推論運算進行加速,它採用Samsung的晶圓代工服務,雖然它本體搭載的SRAM(靜態隨機存取記憶體)容量僅有500 MB,但是頻寬高達150 TB/s,遠高於HBM 4高頻寬記憶體的22 TB/s,能夠有效提高字詞的生成速度,進而提高AI工廠的產能。

黃仁勳在演說中補充到,Vera Rubin的主要任務為提高AI運算的吞吐量,而Groq則是負責降低延持,彼此相輔相成有助於進一步增加AI工廠的收益能力。根據NVIDIA提供的數據,Rubin NVL72架構搭配Groq 3 LPX整合系統能在參數量達到2兆的GPT MoE 2T混合專家模型中,將AI推論運算效能提高至Blackwell NVL72架構的35倍,滿足頂級市場區間的運算需求。

黃仁勳也在舞台上展示了預計於2027年推出的Vera Rubin Ultra運算托盤,並表示在Vera Rubin與Vera Rubin Ultra世代皆會提供以光纖通訊為基礎的Oberon Scale-Up擴展方案,以及以銅線通訊為基礎的Kyber方案,讓企業能夠依據需求選擇更適合自己的解決方案。

與先前H200 NVL8相比,本世代的GB 300 NVL72在電力效率上有50倍提升,生成字詞的成本則降低35倍。黃仁勳也幽默地自封為「GB NVL72推論之王」。

下世代的VR家族將由7種不同晶片組成,除了我們先前介紹過的6種晶片之外,加上這次發表的Groq 3 LPU(語言處理器)。

Groq 3的最大特色在於晶片上整合效能極高的SRAM,雖然容量僅有500 MB,但仍可大幅提高AI推論效能,並加速生成字詞。

與x86處理器搭配Hopper GPU相比,VR家族7種晶片的整合系統能夠在同為1 GW耗電量的條件下,讓每秒生成的字詞數量由2百萬提升至7億,成長幅度達到350倍。

圖中左起分別為Groq 3運算托盤、NVL交換器托盤、Vera Rubin運算托盤。

其中Groq 3運算托盤具有8組Groq 3 LPU,並具有主控處理器、相當於次處理器的FGPA、BlueField-4資料處理器、LPU C2C互連等元件。

另一區展示左起分別為BF4 STX儲存托盤、Vera運算托盤(由純CPU組成)、Spectrum-X CPO交換器托盤(具有矽光子通迅功能)。黃仁勳手持晶片為採用矽光子共同封裝的Spectrum CPO晶片。

Vera Rubin運算托盤採用無纜線與水冷設計,托盤間的通訊也採用模組化的結構化纜線(structural Cable),能大幅簡化機櫃組裝,將施工時間由2天縮短至2小時。

黃仁勳也在舞台上展示了預計於2027年推出的Vera Rubin Ultra運算托盤。

Blackwell NVL72架構在中階AI推論應用的效能較Hopper架構提高35倍,並打開參數量更大的高階AI推論應用市場區間,有助於服務提供商提高產品定價。

Rubin NVL72架構除了較Blackwell NVL72架構提高2~3倍效能,更大的吞吐量讓它開創更高階的頂級(Premium)市場,藉由服務更有價值的客戶大幅提高產品定價,並創造更大的收益。

Rubin NVL72架構搭配Groq 3 LPX能進一步將頂級的效能表現提高至Blackwell NVL72架構的35倍。

Rubin世代解決方案能夠帶來5倍於Blackwell世代的收益能力,Vera Rubin搭配LPX的整合系統更能將年度收益推上3000億,10倍於Blackwell。

從產品路線圖可以看到2026與2027年NVIDIA將聚焦於Vera Rubin與Vera Rubin Ultra架構,2028年則會推出Rosa Feynman架構。

▲黃仁勳於GTC 2026開幕演說之重播影片。

讀者可以在NVIDIA官方YouTube頻到觀賞GTC 2026開幕演說重播影片,筆者也會持續帶來更多報導,請讀者保持關注。

市場機遇
Gitcoin 圖標
Gitcoin實時價格 (GTC)
$0,0931
$0,0931$0,0931
-2,55%
USD
Gitcoin (GTC) 實時價格圖表
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。