每日經(jīng)濟(jì)新聞 2026-03-23 10:31:15
英偉達(dá)在GPU領(lǐng)域深耕多年,自1999年發(fā)布首款GPU至今,已有約27年時(shí)間。其芯片制程從220納米迭代至4納米左右,未來還將向1.6納米推進(jìn),這也是我們較為期待的投資價(jià)值。
本輪AI浪潮始于2023年,當(dāng)時(shí)市場主流GPU為A100與H100。截至目前,市場主流GPU已更新為Blackwell架構(gòu)芯片。A100與H100的核心技術(shù)特征是什么?其中H100芯片性能強(qiáng)勁,在2023年AI浪潮爆發(fā)后,迅速成為市場炙手可熱的GPU產(chǎn)品。
H100由中國臺灣臺積電采用4納米工藝代工生產(chǎn),單芯片集成800億個(gè)晶體管,還專門內(nèi)置了Transformer模型引擎。為什么要專門針對Transformer做硬件適配?當(dāng)前國內(nèi)外我們耳熟能詳?shù)母黝惔竽P?,其底層架?gòu)基本都是基于Transformer基礎(chǔ)架構(gòu)針對性優(yōu)化發(fā)展而來。
英偉達(dá)極具前瞻性地在Hopper架構(gòu)中,從硬件層面對Transformer做了專項(xiàng)優(yōu)化,也就是引入了對應(yīng)的專用引擎。英偉達(dá)也憑借這一核心優(yōu)勢,在短短兩年多的時(shí)間里,從一家規(guī)模中等的企業(yè),成長為全球市值第一的科技巨頭,由此也能充分看到AI產(chǎn)業(yè)的強(qiáng)勁爆發(fā)力。
總結(jié)來看,H100的核心優(yōu)勢是極致適配大模型訓(xùn)練場景。其在大模型訓(xùn)練中的能效比與運(yùn)算速度,相比上一代Ampere架構(gòu)的A100芯片,均有大幅提升。
英偉達(dá)在2023年前后發(fā)布的Blackwell芯片,則重點(diǎn)針對AI推理場景做了優(yōu)化。AI產(chǎn)業(yè)發(fā)展的后半程,推理場景的重要性愈發(fā)凸顯,Blackwell在推理場景優(yōu)化上做了大量技術(shù)布局,其中就包括低精度訓(xùn)練技術(shù)。什么是低精度運(yùn)算?GPU的晶體管數(shù)量是有限的,采用低精度數(shù)據(jù)進(jìn)行計(jì)算,能夠在單位時(shí)間內(nèi)完成更多次運(yùn)算,完美契合推理場景降本提效的核心需求。因此Blackwell架構(gòu)更側(cè)重推理場景優(yōu)化,同時(shí)也保留了極強(qiáng)的訓(xùn)練性能。
展望未來,大家可以重點(diǎn)關(guān)注英偉達(dá)的產(chǎn)品發(fā)布節(jié)奏與技術(shù)路線圖。本屆GTC大會上,英偉達(dá)正式披露了其未來數(shù)年的新品規(guī)劃,清晰梳理并展望了從Blackwell到Rubin再到Feynman的技術(shù)演進(jìn)路線。其中2027年將推出RubinUltra架構(gòu)、CPX芯片與CPU交換機(jī),2028年將實(shí)現(xiàn)Feynman架構(gòu)芯片的量產(chǎn),這些重磅新品均已在本屆GTC大會上完成首次亮相。
本屆大會的核心重磅發(fā)布之一,就是Feynman架構(gòu)芯片。目前英偉達(dá)市場主流GPU仍是Blackwell架構(gòu)的GB300,該芯片已實(shí)現(xiàn)量產(chǎn),目前仍在持續(xù)放量的GPU產(chǎn)品均基于GB300基礎(chǔ)架構(gòu)。按照本次大會披露的規(guī)劃,英偉達(dá)將于今年下半年推出Rubin架構(gòu)的新一代GPU,2028年實(shí)現(xiàn)Feynman架構(gòu)芯片的量產(chǎn),整體架構(gòu)迭代速度非??臁?/p>
。本次大會官方披露,F(xiàn)eynman架構(gòu)芯片將采用臺積電A16制程生產(chǎn),是全球首款1.6nmAI芯片。相較臺積電上一代N2P工藝,A16制程在同等電壓下速度提升約10%,更關(guān)鍵的是晶體管密度提高1.1倍,實(shí)現(xiàn)了翻倍以上的增長。摩爾定律帶來的計(jì)算密度提升,讓Feynman架構(gòu)芯片的性能表現(xiàn)實(shí)現(xiàn)了重大突破,單GPU算力達(dá)50PFLOPS,推理性能是Blackwell的5倍。該芯片的核心升級集中在制程層面,同時(shí)采用背部供電技術(shù),面向機(jī)器人、世界模型場景打造,初期英偉達(dá)將獨(dú)享A16產(chǎn)能,2028年正式量產(chǎn)。
第二個(gè)核心重磅發(fā)布,是大算力機(jī)柜的升級。當(dāng)前AI機(jī)柜的算力規(guī)模持續(xù)擴(kuò)大,英偉達(dá)目前主流的Blackwell架構(gòu)GB300機(jī)柜,單機(jī)柜搭載72張GPU卡。本屆大會上,英偉達(dá)正式推出了單機(jī)柜576卡的Rubin Ultra NVL576卡機(jī)柜,完整披露了這款機(jī)柜的核心架構(gòu)設(shè)計(jì)。本次大會正式展出了Rubin Ultra所采用的Kyber機(jī)架與正交背板連接方案,該方案采用正交背板實(shí)現(xiàn)前后向連接,將垂直部署的計(jì)算刀片與交換刀片直連,在Scale up架構(gòu)中替代傳統(tǒng)銅纜,有效提升單機(jī)柜算力集成度,相關(guān)光互聯(lián)技術(shù)細(xì)節(jié)也同步在本屆GTC大會上完成披露,成為本次大會的核心亮點(diǎn)之一。
第三個(gè)核心發(fā)布內(nèi)容,是英偉達(dá)CPO交換機(jī)的技術(shù)進(jìn)展與產(chǎn)業(yè)規(guī)劃。CPO是一項(xiàng)新興技術(shù),也是英偉達(dá)重點(diǎn)推進(jìn)的技術(shù)方向。本屆GTC大會上,英偉達(dá)正式展示了SN6800、SN6810、Q3450三款量產(chǎn)落地的CPO交換機(jī),這是全球首款量產(chǎn)的共封裝光學(xué)交換機(jī),標(biāo)志著CPO技術(shù)正式從實(shí)驗(yàn)室走向規(guī)?;逃谩M瑫r(shí)英偉達(dá)對CPO技術(shù)做了全面的技術(shù)解讀與產(chǎn)業(yè)規(guī)劃披露,黃仁勛明確表示“需要更多的銅纜產(chǎn)能,更多的光芯片產(chǎn)能,更多的CPO產(chǎn)能”,確立了銅纜、光學(xué)、CPO三條路線并行推進(jìn)的發(fā)展路徑,CPO技術(shù)的滲透率提升速度與規(guī)?;帕窟M(jìn)度有望持續(xù)超出市場預(yù)期。
第四個(gè)核心發(fā)布內(nèi)容,是市場高度關(guān)注的LPU芯片與配套機(jī)柜。英偉達(dá)去年已推出CPX系列產(chǎn)品,本屆大會正式發(fā)布了整合Groq技術(shù)的LPU芯片與配套機(jī)架,之所以持續(xù)布局LPU芯片,核心原因是適配快速增長的AI推理場景需求。AI發(fā)展初期,尤其是2023年,絕大部分算力都用于大模型訓(xùn)練;但對于商業(yè)化云廠商而言,模型訓(xùn)練完成后,需要通過落地應(yīng)用實(shí)現(xiàn)商業(yè)變現(xiàn),不能只做投入。因此長期來看,AI推理賽道具備極高的產(chǎn)業(yè)價(jià)值。
AI推理有明確的技術(shù)特征,整體分為Prefill(預(yù)填充)與Decode(解碼)兩個(gè)階段。這兩個(gè)階段對硬件的需求存在差異,因此要提升推理效率,最優(yōu)方案是將兩個(gè)階段拆分運(yùn)行。英偉達(dá)為此做了大量技術(shù)布局,無論是去年發(fā)布的CPX芯片,還是本屆GTC大會上正式發(fā)布的LPU芯片,核心目標(biāo)都是更好地適配AI推理的發(fā)展趨勢。該LPU芯片可視為專為推理場景設(shè)計(jì)的專用集成電路(ASIC),采用三星4nm制程,單芯片帶寬達(dá)150TB/S,核心目標(biāo)是實(shí)現(xiàn)極致的低延遲與高吞吐量,引入后將由其負(fù)責(zé)Decode環(huán)節(jié),相較于BlackwellNVL72吞吐效率提升35倍,預(yù)期2026年下半年出貨。英偉達(dá)在AI訓(xùn)練領(lǐng)域已建立極高的技術(shù)壁壘,其也希望在推理賽道構(gòu)建起同樣堅(jiān)固的護(hù)城河。
以上就是本屆GTC大會我們重點(diǎn)梳理的核心發(fā)布內(nèi)容,在此做簡要總結(jié):
1.Rubin Ultra576卡機(jī)柜及其先進(jìn)互聯(lián)方案;
2.Feynman架構(gòu)芯片的正式亮相與參數(shù)披露;
3.CPO交換機(jī)的量產(chǎn)落地與技術(shù)規(guī)劃解讀;
4.LPU等推理專用芯片的正式發(fā)布與落地計(jì)劃。
長期來看,AI行業(yè)發(fā)展遠(yuǎn)未觸頂,2026年全球AI資本開支預(yù)計(jì)超7000億美元,Agent技術(shù)進(jìn)入規(guī)?;逃迷?,產(chǎn)業(yè)成長空間全面打開。投資層面,核心推薦通信ETF國泰(515880),光模塊、服務(wù)器等算力核心權(quán)重超75%,2025年漲幅居全市場ETF首位;半導(dǎo)體設(shè)備ETF國泰(159516)受益于全球存儲擴(kuò)產(chǎn)與國產(chǎn)替代雙重邏輯,具備充足業(yè)績彈性。同時(shí)短期布局需警惕美聯(lián)儲貨幣政策不確定性、大宗商品漲價(jià)推高運(yùn)營成本等潛在風(fēng)險(xiǎn)。
風(fēng)險(xiǎn)提示:
投資人應(yīng)當(dāng)充分了解基金定期定額投資和零存整取等儲蓄方式的區(qū)別。定期定額投資是引導(dǎo)投資人進(jìn)行長期投資、平均投資成本的一種簡單易行的投資方式。但是定期定額投資并不能規(guī)避基金投資所固有的風(fēng)險(xiǎn),不能保證投資人獲得收益,也不是替代儲蓄的等效理財(cái)方式。
無論是股票ETF/LOF基金,都是屬于較高預(yù)期風(fēng)險(xiǎn)和預(yù)期收益的證券投資基金品種,其預(yù)期收益及預(yù)期風(fēng)險(xiǎn)水平高于混合型基金、債券型基金和貨幣市場基金。
基金資產(chǎn)投資于科創(chuàng)板和創(chuàng)業(yè)板股票,會面臨因投資標(biāo)的、市場制度以及交易規(guī)則等差異帶來的特有風(fēng)險(xiǎn),提請投資者注意。
板塊/基金短期漲跌幅列示僅作為文章分析觀點(diǎn)之輔助材料,僅供參考,不構(gòu)成對基金業(yè)績的保證。
文中提及個(gè)股短期業(yè)績僅供參考,不構(gòu)成股票推薦,也不構(gòu)成對基金業(yè)績的預(yù)測和保證。
以上觀點(diǎn)僅供參考,不構(gòu)成投資建議或承諾。如需購買相關(guān)基金產(chǎn)品,請您關(guān)注投資者適當(dāng)性管理相關(guān)規(guī)定、提前做好風(fēng)險(xiǎn)測評,并根據(jù)您自身的風(fēng)險(xiǎn)承受能力購買與之相匹配的風(fēng)險(xiǎn)等級的基金產(chǎn)品?;鹩酗L(fēng)險(xiǎn),投資需謹(jǐn)慎。
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP