撰文 | 曹雙濤
編輯 | 楊博丞
題圖 | IC Photo
上線4天銷量超1000萬套,全平臺最高同時在線人數(shù)超300萬人,Steam平臺27萬+評價,96%好評。國產(chǎn)首款3A游戲《黑神話:悟空》的火爆,帶火的不僅只有山西,也有國產(chǎn)GPU廠商。
《黑神話:悟空》正式發(fā)售之際,摩爾線程發(fā)布的V270.80驅(qū)動程序已解決DirectX11模式下運行《黑神話:悟空》Benchmark時的閃退問題。大量玩家的關(guān)注,8月25日摩爾線程百度資訊指數(shù)達(dá)到近30天峰值。
圖源:百度指數(shù)
成立于2020年10月的摩爾線程,在國內(nèi)GPU廠商中屬于相對低調(diào)的存在。直到2023年10月,美國商務(wù)部突然將摩爾線程列入貿(mào)易管制“黑名單”,摩爾線程才引發(fā)市場大量關(guān)注。
但創(chuàng)投圈中,摩爾線程卻屬于“高調(diào)”的存在。摩爾線程不僅核心團(tuán)隊來自英偉達(dá),且創(chuàng)始人張建中為原英偉達(dá)中國區(qū)總經(jīng)理、英偉達(dá)全球副總裁。濃厚的英偉達(dá)基因以及近幾年從高層到地方,對國產(chǎn)替代政策的大力支持,摩爾線程受到資本高度青睞。
據(jù)悉,摩爾線程成立至今完成的5輪融資中,每輪融資陣容都極其強(qiáng)大,資方涵蓋上下游資本、頭部機(jī)構(gòu)、政府基金、戰(zhàn)略投資等等。
圖源:天眼查
資本助推下,摩爾線程發(fā)展速度較快。圍繞TOC端桌面顯卡,摩爾線程現(xiàn)有產(chǎn)品包括MTT S80、S70、S50、S30、S10。圍繞TOB端AI大模型,摩爾線程產(chǎn)品包括訓(xùn)推一體機(jī)MCCX D800、AI超融合一體機(jī)KUAE FUSION,用于部署服務(wù)器推理、訓(xùn)練。且支持LLaMA、GLM、Aquila、Baichuan、GPT、Bloom、玉言等各類主流大模型的開源。
換言之,摩爾線程已建立從芯片、板卡、服務(wù)器、集群到軟件的全棧AI智算產(chǎn)品線,市場認(rèn)為摩爾線程是國內(nèi)僅有能從功能上對標(biāo)英偉達(dá)的國產(chǎn)GPU芯片廠商。但持續(xù)補(bǔ)齊軟件生態(tài)、AI大模型技術(shù)迭代速度快帶來的技術(shù)持續(xù)創(chuàng)新壓力,以及國內(nèi)GPU市場正進(jìn)入洗牌階段,讓摩爾線程真正成為英偉達(dá)仍需持續(xù)發(fā)力。
一、桌面顯卡銷量有限,生態(tài)體系搭建仍需發(fā)力
“其盛也,始則人畏之。甚則人惡之,極則群起而攻之”。這或許是當(dāng)下英偉達(dá)的真實寫照。
自2024年至今,英偉達(dá)先后引來歐盟、法國等多地監(jiān)管機(jī)構(gòu)調(diào)查,要求其提供相關(guān)銷售等數(shù)據(jù)。市場此前曾傳出法國反壟斷機(jī)構(gòu)對英偉達(dá)當(dāng)?shù)剞k公室展開突襲搜查,扣押部分物件和相關(guān)數(shù)據(jù)。
另據(jù)外媒報道,英偉達(dá)已收到美國司法部具有法律意義上的傳票,正式對英偉達(dá)展開調(diào)查。受此影響,英偉達(dá)市值暴跌近2800億美元,創(chuàng)下美股最高紀(jì)錄。按照合同賠償客戶只是小事,英偉達(dá)后續(xù)開放諸多技術(shù)才是關(guān)鍵。習(xí)慣高調(diào)強(qiáng)勢的黃仁勛未來將如何應(yīng)對,成為全球科技產(chǎn)業(yè)關(guān)注的焦點。
圖源:Yahoo Finance
英偉達(dá)遭到全球多國調(diào)查,早在供應(yīng)鏈預(yù)料范圍內(nèi)。服務(wù)器供應(yīng)鏈表示,英偉達(dá)在AI GPU市占率高達(dá)九成,唯一同級對手就是AMD與Intel,但二者出貨量和英偉達(dá)相比差距甚大。
在全球市場幾乎沒有對手的英偉達(dá),不僅掌控者帶下游客戶的定價權(quán)、供貨排期權(quán)。且上游難以取代的臺積電以及富士康、廣達(dá)等龐大供應(yīng)鏈同樣缺乏自主權(quán)。
但英偉達(dá)并不滿足于此,一方面,通過技術(shù)持續(xù)升級、投資等多重方式,促進(jìn)GPU產(chǎn)品的購買和使用,維持其競爭優(yōu)勢。
公開數(shù)據(jù)顯示,自2023年至2024年8月底,英偉達(dá)參與投資數(shù)量高達(dá)74筆,涉及金額高達(dá)109億美元。其中包括資料中心設(shè)計、開發(fā)和營運公司Applied Digital,Google技術(shù)人員在日本創(chuàng)立的Sakana AI等等。
另一方面,黃仁勛并不想讓英偉達(dá)僅充當(dāng)供應(yīng)商角色,正試圖將英偉達(dá)打造成數(shù)據(jù)中心所有關(guān)鍵元素的一站式服務(wù)平臺——即AI工廠,以增加客戶對英偉達(dá)產(chǎn)品的依賴。
面對英偉達(dá)難以撼動的地位及芯片短缺問題,國內(nèi)以騰訊、阿里為代表的大廠依托資金和技術(shù),加速推進(jìn)自研AI芯片進(jìn)程。比如騰訊自主研發(fā)的影片編解碼芯片滄海已進(jìn)入量產(chǎn)階段,支持從云端游戲到視訊直播等服務(wù)。部分資金和技術(shù)實力欠佳的廠商,或選擇租賃或選擇從東南亞購入A100和H100系列芯片,后經(jīng)香港流入國內(nèi)市場。
此外,調(diào)整大模型的訓(xùn)練方式,成為不少廠商的策略之一。零一萬物CEO創(chuàng)辦人李開復(fù)提到,因缺乏足夠GPU資源,他們只能開發(fā)出更高效的AI基礎(chǔ)設(shè)施和推論引擎。這種低精度訓(xùn)練模式,同樣被應(yīng)用到美國海外大廠,核心優(yōu)勢在于加速模型的輸出速度。
海外谷歌、OpenAl、微軟等大廠除加速自研芯片進(jìn)程外,近期微軟、Google與英特爾等眾多大廠攜手成立Ultra Accelerator Link。UALink聯(lián)盟成立的背后,正是想切斷谷歌的生態(tài)護(hù)城河。
圖源:基于公開信息整理
服務(wù)器供應(yīng)鏈表示,英偉達(dá)的護(hù)城河絕非只是多年累積的強(qiáng)大GPU技術(shù)和投入10多年研發(fā)的平行運算架構(gòu)CUDA。2014年推出的NVLink以及NVSwitch交換器芯片等,讓英偉達(dá)的GPU技術(shù)與生態(tài)系統(tǒng)更為強(qiáng)大與完整。CUDA為封閉生態(tài)系,只能在英偉達(dá)自家GPU上運行。 NVLink同樣為英偉達(dá)獨家研發(fā),競爭者只能采用現(xiàn)有PCIe等其他互連協(xié)定。
目前國內(nèi)GPU產(chǎn)業(yè)面臨核心且突出問題為缺乏類似英偉達(dá)CUDA的軟件生態(tài)體系,雖說摩爾線程構(gòu)建MUSA生態(tài)來兼容 CUDA,但京東平臺不少已購MTT S80用戶稱,MTT S80因存在軟件兼容問題、卡頓問題,可能并不適合新生小白使用。
圖源:京東
不少游戲玩家測評后發(fā)現(xiàn),MTT S80實際表現(xiàn)與英偉達(dá)等一線大廠的顯卡之間還有很大的差距。以黑神話測試工具的標(biāo)準(zhǔn)來看,MTT S80大致處于勉強(qiáng)能玩的樣子?!逗谏裨挘何蚩铡烽_服后,不少玩家也都反應(yīng)打開游戲后出現(xiàn)黑屏、閃退的情況。
游戲玩家李陽(化名)告訴DoNews,在摩爾線程V270.80驅(qū)動版本以及1280*720p分辨率,《黑神話:悟空》的最高分辨率僅有20多幀,真正進(jìn)入游戲后無法暢玩。
圖源:受訪者提供
桌面顯卡仍需提高的競爭力,直接影響到其桌面級顯卡銷量增長。京東官方旗艦店MTTS80評論量僅有2000+,其他顯卡產(chǎn)品評論量更是不足2000+,這側(cè)面說明摩爾線程桌面級顯卡出貨量欠佳。
另外,對標(biāo)華為鴻蒙生態(tài)來看,從和APP廠商前期溝通到中期APP廠商排期、開發(fā)、測試,到最終完全上線,整個內(nèi)容生態(tài)搭建不僅耗時較長且需廠商以龐大的銷售團(tuán)隊和技術(shù)團(tuán)隊為支撐。
圖源:京東
不僅僅是軟件生態(tài),芯片互聯(lián)同樣是一大問題。聯(lián)發(fā)科CEO蔡力直言,從整個系統(tǒng)角度來看,芯片之間的互聯(lián)技術(shù)是除運算部分之外發(fā)展的最大瓶頸。換言之,如何持續(xù)攻克軟硬件問題,或許是摩爾線程這家相對年輕的GPU企業(yè)需長期解決的問題。
二、大模型技術(shù)持續(xù)升級,面臨持續(xù)創(chuàng)新壓力
為“圍剿”英偉達(dá),國內(nèi)廠商逐漸分化兩條現(xiàn)實路徑,一是以燧原、天數(shù)智芯等為代表的多數(shù)廠商,為避免和英偉達(dá)競爭,從對硬件、軟件要求都不高的推理場景抓起。
另一條為摩爾線程、華為為代表的少數(shù)廠商,選擇從千卡向萬卡進(jìn)發(fā),著重訓(xùn)練場景,直接硬剛英偉達(dá)。
如摩爾線程的夸娥(KUAE)智算集群解決方案基于大模型智算加速卡MTT S4000,從千卡可擴(kuò)展至萬卡集群,以打造大模型和通用人工智能的先進(jìn)算力基礎(chǔ)設(shè)施。
摩爾線程創(chuàng)始人兼CEO張建中表示,夸娥萬卡智算集群作為摩爾線程全棧AI戰(zhàn)略的一塊重要拼圖,可為各行各業(yè)數(shù)智化轉(zhuǎn)型提供澎湃算力。
廠商的理想或許很美好,但現(xiàn)實卻是國產(chǎn)AI芯片落地過程難免出現(xiàn)各種問題。華為推出的升騰Ascend系列AI芯片客戶包括訊飛、百度、騰訊等互聯(lián)網(wǎng)大廠。但援引英國《金融時報》報道,在AI模型訓(xùn)練方面,Ascend和英偉達(dá)芯片仍存在差距,先后出現(xiàn)穩(wěn)定性問題、芯片之間連接問題、華為CANN平臺錯誤頻傳問題等等。百度使用華為芯片時常出現(xiàn)崩潰,進(jìn)而影響AI項目的開發(fā)工作。
為解決問題,華為直接派出工程師到現(xiàn)場處理客戶問題,百度、科大訊飛和騰訊均有華為團(tuán)隊支持。華為Ascend系列芯片在給摩爾線程敲響警鐘的同時,相較于家大業(yè)大的華為來說,摩爾線程在資金、人員配置等方面稍有不足。若采取和華為常用的“堆人頭”定制化服務(wù)方式,對其綜合成本、現(xiàn)金流和盈利也提出高挑戰(zhàn)。
除上述問題外,當(dāng)前全球GPU廠商所面臨的難題為AI大模型技術(shù)迭代速度過快和芯片長開發(fā)周期的矛盾,這對摩爾線程的持續(xù)創(chuàng)新能力、市場洞察能力均提出極高要求。
今年以來半導(dǎo)體產(chǎn)業(yè)重點關(guān)注高帶寬存儲器以及高速傳輸技術(shù)兩大方向,這點不管從三星、SK海力士、美光快速調(diào)配產(chǎn)能,加速量產(chǎn)HBM來滿足市場需求,還是運算芯片大廠陸續(xù)投入通信與傳輸技術(shù)開發(fā),如英偉達(dá)的NVLink、英特爾主導(dǎo)的UALink,博通及Marvell都全力投入各層次高速傳輸技術(shù)開發(fā),聯(lián)發(fā)科和神盾集團(tuán)通過SerDes和UCIE相關(guān)IP技術(shù)切入市場均能側(cè)面證實。
但GPU中行業(yè)IP核占用的面積超過80%。但I(xiàn)P的研發(fā)并不輕松,GPU IP自研需要36—48個月以及200個工程師。采用外購IP雖能將開發(fā)周期縮短12—18個月。且高端芯片前端和后續(xù)設(shè)計1—3年,流片環(huán)節(jié)需3—6個月。若流片失敗,只能繼續(xù)上演該過程。且即使流片成功,還需經(jīng)過3—12個月產(chǎn)品測試優(yōu)化,才能開啟量產(chǎn)。
這就意味著GPU廠商提出的AI芯片設(shè)計理念在當(dāng)時或許很新穎,但若是被制成成品時,很有可能無法跟上市場需求和業(yè)界技術(shù)進(jìn)展,最終被市場所淘汰。
換言之,AI大模型時代下GPU廠商面臨壓力遠(yuǎn)比此前更大,想要生存更加不易。張建中也曾指出,摩爾線程目標(biāo)為至少先存活10年。
三、國產(chǎn)GPU洗牌加劇,摩爾線程迎大考
不僅僅是摩爾線程想要“活下來”,國內(nèi)很多投資人也不斷告訴自己的被投項目需要“先活下來”。
近兩年,國內(nèi)GPU廠商從一度當(dāng)紅的芯片領(lǐng)域,但在地緣政治帶來的不確定以及經(jīng)營管理團(tuán)隊融資欠缺等多因素共同影響下,行業(yè)急轉(zhuǎn)直下。
燒光融資的GPU廠商,或裁員或解散。進(jìn)而到2024年,這種情況不僅未能迎來改善,反而仍在繼續(xù)惡化,國產(chǎn)GPU行業(yè)正迎來洗牌整合期。雖說燧原6年完成10次融資,累計融資金額高達(dá)70億元,目前正啟動A股IPO進(jìn)程。但并非所有GPU廠商都有燧原這么“幸運”累計獲約25億元融資,估值約150億元,且為重慶當(dāng)?shù)谹I獨角獸的象帝先因和資本對賭失敗,反遭投資者反撲。業(yè)務(wù)關(guān)停、大規(guī)模裁員、創(chuàng)始人從“吸金人”變成失信人。
圖源:象帝先官方
南京礪算子公司礪算上海,近期雖獲得東芯與其他投資者投資2億元、1.28億元,暫時解除資金鏈斷裂危機(jī),但GPU的重資金屬性意味其后續(xù)可能還需尋求大量外部資金續(xù)命。大量GPU公司的倒閉讓投資人血虧,對GPU項目愈發(fā)謹(jǐn)慎背景下。全球科技市場的持續(xù)生變,讓該問題更加雪上加霜。
宏碁董事長暨執(zhí)行長陳俊圣指出,全球科技產(chǎn)業(yè)正上演恐怖電影。廠商或建立算力中心或建立資料中心,雖說發(fā)展路徑不同,但均需要服務(wù)器、存儲器、海量數(shù)據(jù)。投入這么多成本,又要多少廠商挖到金礦?微軟通過Copilot雖有所受益,但其又是否會愿意投入下去呢?或許當(dāng)前廠商仍關(guān)注AI硬件、算力等等,但核心仍是商業(yè)模式得以延續(xù)。
陳俊圣的擔(dān)憂正是當(dāng)前全球科技產(chǎn)業(yè)的真實寫照,這輪全球AI大模型浪潮,短期內(nèi)除英偉達(dá)外,真正利潤大幅度增長的廠商有限。在AI大模型上游,AI大模型的爆發(fā)讓國產(chǎn)服務(wù)器一哥、號稱算力龍頭的浪潮信息2024年上半年業(yè)績大增、轉(zhuǎn)虧為盈,業(yè)績創(chuàng)下歷史新高。
圖源:浪潮信息財報
但浪潮信息業(yè)績大幅度改善的背后,頗有以價換量意味。2024年上半年7.74%的毛利率創(chuàng)下浪潮信息近幾年最低毛利率,浪潮信息方面稱,毛利率下跌主要受客戶結(jié)構(gòu)、產(chǎn)品結(jié)構(gòu)、原材料供應(yīng)、市場競爭等多方面的綜合影響。換言之,若后續(xù)GPU廠商競爭激烈,是否同樣會采取以價換量策略呢?
圖源:浪潮信息財報
對大模型廠商來說,Open AI仍處在虧損中。援引The Informantion報道,Open AI的營收雖從2023年底的16億美元快速上漲到今年上半年的34億美元。但《紐約時報》預(yù)測,Open AI的技術(shù)投入或超過70億美元,為其收入的2倍以上。目前Open AI正調(diào)整組織架構(gòu),募集新一輪資本。
但Open AI的34億美元收入建立在周活躍用戶2億,每月收費20美元的基礎(chǔ)。國內(nèi)又有多少大模型廠商,能做到GPT的用戶規(guī)模且讓用戶愿意持續(xù)付費呢?當(dāng)大模型廠商長期處在虧損中,并不斷調(diào)整算法模型降低對AI芯片的需求,GPU廠商又會面臨何種問題呢?
此外,目前本土GPU芯片跟英偉達(dá)的產(chǎn)品相比,仍存在不小差距。從芯片設(shè)計上來看,跟英偉達(dá)的差距為12—18個月。在芯片制造制程上,英偉達(dá)已采用3納米制程,國內(nèi)目前止步于5-7納米,這讓本就處在融資難、退出難的資本市場不得不更加謹(jǐn)慎。
隨著客戶結(jié)構(gòu)和AI大模型市場的改變,摩爾線程又要如何應(yīng)對未來可能出現(xiàn)的資金流問題,持續(xù)補(bǔ)充業(yè)務(wù)所需大量資金呢?
或許摩爾線程所經(jīng)歷的這些問題,正是當(dāng)前國內(nèi)眾多GPU廠商的現(xiàn)狀。正如張建中所言,摩爾線程希望做的事情是解決最難做的事情,幫助國家、幫助行業(yè)解決缺少大算力的問題。
在國產(chǎn)替代這條路上,或許摩爾線程仍有諸多難題需要一一解決。但正是眾多摩爾線程廠商的出現(xiàn),國內(nèi)和海外的差距才有望逐漸縮小,并可能實現(xiàn)反超。