2026-04-24 20:07:55
4月24日,DeepSeek發(fā)布并開源全新系列模型V4預(yù)覽版,同步推出高性能版和輕量版,首次在官方技術(shù)報告中寫入華為昇騰NPU和英偉達GPU。這打破了中國大模型廠商對英偉達的依賴,標(biāo)志著國產(chǎn)算力替代邏輯的推進。昇騰950超節(jié)點將提升吞吐能力、降低單位Token成本,推動國產(chǎn)算力供給規(guī)?;N騰產(chǎn)業(yè)鏈已成形,服務(wù)器整機制造為核心環(huán)節(jié)。
每經(jīng)記者|王晶 吳澤鵬 每經(jīng)編輯|陳俊杰
4月24日,AI(人工智能)領(lǐng)域的目光不約而同地聚焦在同一件事上——DeepSeek正式發(fā)布并開源了全新系列模型V4的預(yù)覽版本,同步推出高性能版的DeepSeek-V4-Pro,以及輕量版的DeepSeek-V4-Flash。據(jù)官方披露,DeepSeek-V4擁有百萬字超長上下文,在Agent(智能體)能力、世界知識和推理性能上均在國內(nèi)和開源領(lǐng)域保持領(lǐng)先。
人們在討論新模型到底有多強的同時,另一個更具產(chǎn)業(yè)意義的話題也迅速升溫——DeepSeek首次在官方技術(shù)報告中,把華為昇騰NPU(神經(jīng)網(wǎng)絡(luò)處理器)和英偉達GPU(圖形處理器)寫進了同一份硬件驗證清單。“我們在英偉達GPU和華為昇騰NPU兩個平臺上均驗證了細(xì)粒度EP(專家并行)方案。”這標(biāo)志著萬億參數(shù)級別的模型首次在正式文檔中完成了對國產(chǎn)AI芯片的“官方認(rèn)定”。
長期以來,中國大模型廠商的訓(xùn)練與推理幾乎全部依賴英偉達的GPU和CUDA生態(tài),但DeepSeek-V4的發(fā)布,終于打破了這個局面。
這背后是一條清晰的國產(chǎn)算力替代邏輯:如果DeepSeek這樣一個頂級開源大模型,能夠在華為昇騰生態(tài)上跑出不輸于英偉達平臺的推理性能,那么它將向整個行業(yè)釋放一個信號——在大模型推理側(cè),國產(chǎn)芯片已具備承載實際商業(yè)負(fù)載的能力。
在DeepSeek-V4發(fā)布前,市場上便傳出其已提前適配華為昇騰950等國產(chǎn)AI芯片。隨著正式發(fā)布,目前可以確認(rèn)的是,該模型已經(jīng)完成了在昇騰NPU平臺上的推理適配(不一定基于昇騰950訓(xùn)練)。
在以往大模型開發(fā)過程中,早期測試與適配往往優(yōu)先開放給英偉達、AMD等美系芯片廠商。此次DeepSeek在模型階段就推進國產(chǎn)算力適配,也被業(yè)內(nèi)視為路徑上的重要變化。
昇騰芯片是國產(chǎn)算力陣營中的代表,也是華為整個AI戰(zhàn)略的基礎(chǔ)。2018年10月,華為全聯(lián)接大會正式發(fā)布首款采用華為自研達芬奇架構(gòu)的AI芯片昇騰910與昇騰310。其中,昇騰310是SoC(系統(tǒng)級芯片)小芯片,和人們的手機芯片差不多,只有指甲蓋那么大;昇騰910是大芯片,和人們的掌心差不多大,主要面向云端高性能計算;2019年昇騰芯片正式投入商用,但此后幾年,昇騰在公開市場的聲量和產(chǎn)品節(jié)奏上都相對低調(diào)。
直到2025年9月,華為輪值董事長徐直軍罕見公布昇騰芯片的演進和目標(biāo)。他表示,未來三年,華為已經(jīng)規(guī)劃了昇騰多款芯片,包括950PR,950DT以及昇騰960和970。其中,昇騰950系列分為兩個型號——950PR與950DT,兩者共用Ascend 950 Die,但面向不同任務(wù)場景。其中,950PR面向推理Prefill階段和推薦業(yè)務(wù)場景,規(guī)劃于今年第一季度推出;950DT則更注重推理Decode階段和訓(xùn)練場景,規(guī)劃將于2026年第四季度推出。
從發(fā)布節(jié)奏來看,昇騰芯片將進入一個快速迭代和性能持續(xù)飆升的周期。不過,由于受限于先進制程的獲取,華為單顆昇騰芯片的算力目前還難以直接與英偉達芯片競爭。為此,華為還選擇了一條不同的技術(shù)路徑:通過“超節(jié)點+集群”的算力解決方案,將多顆芯片高效互聯(lián),以集成的方式滿足持續(xù)增長的算力需求。
以芯片制程為例,在摩爾定律放緩的情況下,7納米到3納米,可能每代性能提升不超過20%。而超節(jié)點可以將模型算力利用率從30%提升到45%,相當(dāng)于提升了50%,通過資源的高效調(diào)度,在一定程度上可以彌補芯片工藝代差。目前,國內(nèi)除了華為,包括阿里、字節(jié)、騰訊、百度、中科曙光、浪潮信息、新華三等多家廠商均推出超節(jié)點方案。
“由于美國‘制裁’,我們不能產(chǎn)出最先進工藝制程的芯片,但我們基于過去三十多年構(gòu)筑的聯(lián)接技術(shù)能力,使得我們能夠做到萬卡級的超節(jié)點,經(jīng)營萬卡級的超節(jié)點,做到在世界上算力最強?!毙熘避娬f道。
如果說昇騰950解決的是“能不能跑”,那么Atlas 950 SuperPoD解決的則是“能不能跑得更便宜、更大規(guī)模”。
從價格看,DeepSeek V4-Pro每百萬Tokens(詞元)輸入是1元,輸出是12元,V4-Flash每百萬Tokens輸入是0.2元,輸出是2元。但同時,DeepSeek明確表示:“預(yù)計下半年昇騰950超節(jié)點批量上市并部署之后,Pro版本的價格也會大幅度下調(diào)。”
據(jù)悉,華為Atlas 950 SuperPoD采用面向大規(guī)模AI訓(xùn)練場景的超節(jié)點架構(gòu)設(shè)計,該系統(tǒng)由8192張基于950昇騰加速卡構(gòu)成,總體由128個計算機柜和32個互聯(lián)機柜組成,整套系統(tǒng)共計160個機柜,其上市時間為2026年四季度。相較于英偉達同樣將在下半年上市的NVL144,Atlas 950超節(jié)點卡的規(guī)模是其56.8倍,總算力是其6.7倍,內(nèi)存容量是其15倍。不過客觀來看,集群也面臨諸如能耗、占地DeepSeek面積大等問題。
從架構(gòu)上看,DeepSeek-V4屬于典型的MoE模型,總參數(shù)規(guī)模達1.6萬億、激活參數(shù)49B,這對推理集群的規(guī)模和效率提出了極高要求。外界普遍認(rèn)為,一旦昇騰950超節(jié)點批量上市,理論上將帶來三重變化。
具體來看:首先,吞吐能力顯著提升。 8192卡的超節(jié)點尤其適合MoE架構(gòu)、上下文并行、專家并行與高并發(fā)推理場景;其次,單位Token成本下降。 高并發(fā)推理的關(guān)鍵不在單卡峰值算力,而在單位時間能服務(wù)多少請求、生成多少Tokens。吞吐提升后,API價格便有了下調(diào)空間;第三,國產(chǎn)算力供給規(guī)?;?。 如果DeepSeek-V4-Pro不再高度依賴稀缺的海外高端GPU,Pro版本就可以走向“大規(guī)模商業(yè)化”,并且適配國產(chǎn)芯片也證明了,AI推理不一定只能依靠最貴的GPU,國產(chǎn)算力同樣可以開辟一條新路。
DeepSeek-V4適配昇騰的消息,也讓國產(chǎn)算力產(chǎn)業(yè)鏈徹底站上了聚光燈下——一顆昇騰芯片背后,是一條從服務(wù)器整機到覆銅板的龐大鏈條。在這個鏈條上,最核心的環(huán)節(jié)是什么?哪些上市公司參與了關(guān)鍵節(jié)點的產(chǎn)業(yè)分工?市場規(guī)模到底有多大?《每日經(jīng)濟新聞》記者進行了梳理。
首先,在國產(chǎn)AI芯片格局上,昇騰已實現(xiàn)斷層領(lǐng)先。根據(jù)市場研究機構(gòu)IDC最新發(fā)布的報告,2025年中國AI加速卡市場總出貨量達到約400萬張,其中國產(chǎn)芯片合計出貨約165萬張,市場份額首次突破四成,躍升至41%。英偉達以55%市場份額排名第一,該公司此前市場份額高達95%。
在國產(chǎn)陣營中,梯隊格局已基本成形。華為出貨量達81.2萬張,不僅斷層領(lǐng)跑各大國產(chǎn)廠商,還占據(jù)了國產(chǎn)芯片總出貨量的近一半,占全市場約20%的份額。阿里巴巴旗下的平頭哥以約26.5萬張位列第二,百度昆侖芯與寒武紀(jì)各約11.6萬張,并列第三。
更重要的是市場趨勢的變化。知名調(diào)研機構(gòu)Bernstein Research發(fā)布報告指出,受外部出口管制持續(xù)加碼等因素影響,2026年以華為昇騰為首的國產(chǎn)AI芯片市占率有望首次超過50%,預(yù)計到2028年,中國本土AI芯片產(chǎn)量即可覆蓋國內(nèi)需求,供應(yīng)需求比例預(yù)計達到104%。
其次,從產(chǎn)業(yè)鏈的價值分布來看,最核心的環(huán)節(jié)是服務(wù)器整機制造。AI芯片必須被物理集成到服務(wù)器中,才能進入算力中心、云廠商和政企客戶,這一環(huán)節(jié)也最快轉(zhuǎn)化為訂單和營收。根據(jù)中商產(chǎn)業(yè)研究院分析師預(yù)測,2026年市場規(guī)模將達到2859億元。
圍繞服務(wù)器整機制造,昇騰產(chǎn)業(yè)鏈分為三層:最內(nèi)層是服務(wù)器整機制造商,獲單最為直接;中間層是由CANN架構(gòu)為核心的軟件生態(tài),決定廠商的生態(tài)黏性;最外層是上游材料和元件供應(yīng)商,包括覆銅板、交換機、高速銅連接模組等。
在整機制造環(huán)節(jié),目前格局高度集中。華鯤振宇是華為生態(tài)中唯一同時獲得“鯤鵬+昇騰”雙領(lǐng)先級認(rèn)證、連續(xù)兩年獲評戰(zhàn)略級伙伴的企業(yè),其“天宮”系列AI服務(wù)器已量產(chǎn)并進入多個省級智算中心。A股上市公司中,神州數(shù)碼旗下神州鯤泰自有產(chǎn)線是華為昇騰生態(tài)的重要整機硬件伙伴。拓維信息則是華為鯤鵬、昇騰、鴻蒙的全方位合作伙伴。
在上游材料和組件的“賣鏟子”領(lǐng)域,同樣有關(guān)鍵企業(yè)深度嵌入昇騰產(chǎn)業(yè)鏈。例如,華豐科技是華為高速背板連接器的核心供應(yīng)商,作為第一大客戶,在去年貢獻了超60%的收入。
此外,伴隨昇騰芯片從910C向950的升級,超節(jié)點架構(gòu)對交換芯片、交換機和銅連接等環(huán)節(jié)的需求大幅提升。華泰證券研報判斷2026年為“國產(chǎn)超節(jié)點元年”,并測算到2028年國產(chǎn)超節(jié)點市場空間有望達到3414億元,2026年至2028年的年復(fù)合增長率高達194%。
如果說硬件性能的突破是基礎(chǔ),那么軟件生態(tài)就是昇騰能否長期繁榮的關(guān)鍵,CANN作為昇騰的軟件層,其生態(tài)主導(dǎo)權(quán)正在演變?yōu)殛P(guān)鍵競爭壁壘——歷史上,英偉達正是憑借CUDA生態(tài)奠定了其在AI領(lǐng)域的統(tǒng)治地位。一個重要的信號來自運營商層面:根據(jù)中國移動采購與招標(biāo)網(wǎng)的公示信息,中國移動2026年—2027年人工智能超節(jié)點設(shè)備集中采購項目已開標(biāo),采購規(guī)模為6208張AI加速卡,總金額約20.6億元,中標(biāo)文件明確全線采用華為CANN生態(tài)方案,涵蓋華鯤振宇、河南昆侖、長江計算等五家企業(yè)。有分析指出,這是三大運營商在集團層面首次啟動AI超節(jié)點設(shè)備集采,標(biāo)志著運營商級基礎(chǔ)設(shè)施正在加速接入國產(chǎn)CANN生態(tài)。
需要說明的是,產(chǎn)業(yè)鏈機遇的背后也有變數(shù)——其中,算力供給瓶頸是最關(guān)鍵的不確定性——昇騰芯片的產(chǎn)能能否跟上爆發(fā)式需求,將直接決定整條產(chǎn)業(yè)鏈的訂單能否如期兌現(xiàn)。而這場由DeepSeek與昇騰共同點燃的算力變革,才剛剛拉開序幕。
封面圖片來源:蘭素英
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP