撰文 | 曹雙濤
編輯 | 楊博丞
題圖 | IC Photo
上線4天銷量超1000萬套,全平臺最高同時在線人數超300萬人,Steam平臺27萬+評價,96%好評。國產首款3A游戲《黑神話:悟空》的火爆,帶火的不僅只有山西,也有國產GPU廠商。
《黑神話:悟空》正式發(fā)售之際,摩爾線程發(fā)布的V270.80驅動程序已解決DirectX11模式下運行《黑神話:悟空》Benchmark時的閃退問題。大量玩家的關注,8月25日摩爾線程百度資訊指數達到近30天峰值。
圖源:百度指數
成立于2020年10月的摩爾線程,在國內GPU廠商中屬于相對低調的存在。直到2023年10月,美國商務部突然將摩爾線程列入貿易管制“黑名單”,摩爾線程才引發(fā)市場大量關注。
但創(chuàng)投圈中,摩爾線程卻屬于“高調”的存在。摩爾線程不僅核心團隊來自英偉達,且創(chuàng)始人張建中為原英偉達中國區(qū)總經理、英偉達全球副總裁。濃厚的英偉達基因以及近幾年從高層到地方,對國產替代政策的大力支持,摩爾線程受到資本高度青睞。
據悉,摩爾線程成立至今完成的5輪融資中,每輪融資陣容都極其強大,資方涵蓋上下游資本、頭部機構、政府基金、戰(zhàn)略投資等等。
圖源:天眼查
資本助推下,摩爾線程發(fā)展速度較快。圍繞TOC端桌面顯卡,摩爾線程現(xiàn)有產品包括MTT S80、S70、S50、S30、S10。圍繞TOB端AI大模型,摩爾線程產品包括訓推一體機MCCX D800、AI超融合一體機KUAE FUSION,用于部署服務器推理、訓練。且支持LLaMA、GLM、Aquila、Baichuan、GPT、Bloom、玉言等各類主流大模型的開源。
換言之,摩爾線程已建立從芯片、板卡、服務器、集群到軟件的全棧AI智算產品線,市場認為摩爾線程是國內僅有能從功能上對標英偉達的國產GPU芯片廠商。但持續(xù)補齊軟件生態(tài)、AI大模型技術迭代速度快帶來的技術持續(xù)創(chuàng)新壓力,以及國內GPU市場正進入洗牌階段,讓摩爾線程真正成為英偉達仍需持續(xù)發(fā)力。
一、桌面顯卡銷量有限,生態(tài)體系搭建仍需發(fā)力
“其盛也,始則人畏之。甚則人惡之,極則群起而攻之”。這或許是當下英偉達的真實寫照。
自2024年至今,英偉達先后引來歐盟、法國等多地監(jiān)管機構調查,要求其提供相關銷售等數據。市場此前曾傳出法國反壟斷機構對英偉達當地辦公室展開突襲搜查,扣押部分物件和相關數據。
另據外媒報道,英偉達已收到美國司法部具有法律意義上的傳票,正式對英偉達展開調查。受此影響,英偉達市值暴跌近2800億美元,創(chuàng)下美股最高紀錄。按照合同賠償客戶只是小事,英偉達后續(xù)開放諸多技術才是關鍵。習慣高調強勢的黃仁勛未來將如何應對,成為全球科技產業(yè)關注的焦點。
圖源:Yahoo Finance
英偉達遭到全球多國調查,早在供應鏈預料范圍內。服務器供應鏈表示,英偉達在AI GPU市占率高達九成,唯一同級對手就是AMD與Intel,但二者出貨量和英偉達相比差距甚大。
在全球市場幾乎沒有對手的英偉達,不僅掌控者帶下游客戶的定價權、供貨排期權。且上游難以取代的臺積電以及富士康、廣達等龐大供應鏈同樣缺乏自主權。
但英偉達并不滿足于此,一方面,通過技術持續(xù)升級、投資等多重方式,促進GPU產品的購買和使用,維持其競爭優(yōu)勢。
公開數據顯示,自2023年至2024年8月底,英偉達參與投資數量高達74筆,涉及金額高達109億美元。其中包括資料中心設計、開發(fā)和營運公司Applied Digital,Google技術人員在日本創(chuàng)立的Sakana AI等等。
另一方面,黃仁勛并不想讓英偉達僅充當供應商角色,正試圖將英偉達打造成數據中心所有關鍵元素的一站式服務平臺——即AI工廠,以增加客戶對英偉達產品的依賴。
面對英偉達難以撼動的地位及芯片短缺問題,國內以騰訊、阿里為代表的大廠依托資金和技術,加速推進自研AI芯片進程。比如騰訊自主研發(fā)的影片編解碼芯片滄海已進入量產階段,支持從云端游戲到視訊直播等服務。部分資金和技術實力欠佳的廠商,或選擇租賃或選擇從東南亞購入A100和H100系列芯片,后經香港流入國內市場。
此外,調整大模型的訓練方式,成為不少廠商的策略之一。零一萬物CEO創(chuàng)辦人李開復提到,因缺乏足夠GPU資源,他們只能開發(fā)出更高效的AI基礎設施和推論引擎。這種低精度訓練模式,同樣被應用到美國海外大廠,核心優(yōu)勢在于加速模型的輸出速度。
海外谷歌、OpenAl、微軟等大廠除加速自研芯片進程外,近期微軟、Google與英特爾等眾多大廠攜手成立Ultra Accelerator Link。UALink聯(lián)盟成立的背后,正是想切斷谷歌的生態(tài)護城河。
圖源:基于公開信息整理
服務器供應鏈表示,英偉達的護城河絕非只是多年累積的強大GPU技術和投入10多年研發(fā)的平行運算架構CUDA。2014年推出的NVLink以及NVSwitch交換器芯片等,讓英偉達的GPU技術與生態(tài)系統(tǒng)更為強大與完整。CUDA為封閉生態(tài)系,只能在英偉達自家GPU上運行。 NVLink同樣為英偉達獨家研發(fā),競爭者只能采用現(xiàn)有PCIe等其他互連協(xié)定。
目前國內GPU產業(yè)面臨核心且突出問題為缺乏類似英偉達CUDA的軟件生態(tài)體系,雖說摩爾線程構建MUSA生態(tài)來兼容 CUDA,但京東平臺不少已購MTT S80用戶稱,MTT S80因存在軟件兼容問題、卡頓問題,可能并不適合新生小白使用。
圖源:京東
不少游戲玩家測評后發(fā)現(xiàn),MTT S80實際表現(xiàn)與英偉達等一線大廠的顯卡之間還有很大的差距。以黑神話測試工具的標準來看,MTT S80大致處于勉強能玩的樣子。《黑神話:悟空》開服后,不少玩家也都反應打開游戲后出現(xiàn)黑屏、閃退的情況。
游戲玩家李陽(化名)告訴DoNews,在摩爾線程V270.80驅動版本以及1280*720p分辨率,《黑神話:悟空》的最高分辨率僅有20多幀,真正進入游戲后無法暢玩。
圖源:受訪者提供
桌面顯卡仍需提高的競爭力,直接影響到其桌面級顯卡銷量增長。京東官方旗艦店MTTS80評論量僅有2000+,其他顯卡產品評論量更是不足2000+,這側面說明摩爾線程桌面級顯卡出貨量欠佳。
另外,對標華為鴻蒙生態(tài)來看,從和APP廠商前期溝通到中期APP廠商排期、開發(fā)、測試,到最終完全上線,整個內容生態(tài)搭建不僅耗時較長且需廠商以龐大的銷售團隊和技術團隊為支撐。
圖源:京東
不僅僅是軟件生態(tài),芯片互聯(lián)同樣是一大問題。聯(lián)發(fā)科CEO蔡力直言,從整個系統(tǒng)角度來看,芯片之間的互聯(lián)技術是除運算部分之外發(fā)展的最大瓶頸。換言之,如何持續(xù)攻克軟硬件問題,或許是摩爾線程這家相對年輕的GPU企業(yè)需長期解決的問題。
二、大模型技術持續(xù)升級,面臨持續(xù)創(chuàng)新壓力
為“圍剿”英偉達,國內廠商逐漸分化兩條現(xiàn)實路徑,一是以燧原、天數智芯等為代表的多數廠商,為避免和英偉達競爭,從對硬件、軟件要求都不高的推理場景抓起。
另一條為摩爾線程、華為為代表的少數廠商,選擇從千卡向萬卡進發(fā),著重訓練場景,直接硬剛英偉達。
如摩爾線程的夸娥(KUAE)智算集群解決方案基于大模型智算加速卡MTT S4000,從千卡可擴展至萬卡集群,以打造大模型和通用人工智能的先進算力基礎設施。
摩爾線程創(chuàng)始人兼CEO張建中表示,夸娥萬卡智算集群作為摩爾線程全棧AI戰(zhàn)略的一塊重要拼圖,可為各行各業(yè)數智化轉型提供澎湃算力。
廠商的理想或許很美好,但現(xiàn)實卻是國產AI芯片落地過程難免出現(xiàn)各種問題。華為推出的升騰Ascend系列AI芯片客戶包括訊飛、百度、騰訊等互聯(lián)網大廠。但援引英國《金融時報》報道,在AI模型訓練方面,Ascend和英偉達芯片仍存在差距,先后出現(xiàn)穩(wěn)定性問題、芯片之間連接問題、華為CANN平臺錯誤頻傳問題等等。百度使用華為芯片時常出現(xiàn)崩潰,進而影響AI項目的開發(fā)工作。
為解決問題,華為直接派出工程師到現(xiàn)場處理客戶問題,百度、科大訊飛和騰訊均有華為團隊支持。華為Ascend系列芯片在給摩爾線程敲響警鐘的同時,相較于家大業(yè)大的華為來說,摩爾線程在資金、人員配置等方面稍有不足。若采取和華為常用的“堆人頭”定制化服務方式,對其綜合成本、現(xiàn)金流和盈利也提出高挑戰(zhàn)。
除上述問題外,當前全球GPU廠商所面臨的難題為AI大模型技術迭代速度過快和芯片長開發(fā)周期的矛盾,這對摩爾線程的持續(xù)創(chuàng)新能力、市場洞察能力均提出極高要求。
今年以來半導體產業(yè)重點關注高帶寬存儲器以及高速傳輸技術兩大方向,這點不管從三星、SK海力士、美光快速調配產能,加速量產HBM來滿足市場需求,還是運算芯片大廠陸續(xù)投入通信與傳輸技術開發(fā),如英偉達的NVLink、英特爾主導的UALink,博通及Marvell都全力投入各層次高速傳輸技術開發(fā),聯(lián)發(fā)科和神盾集團通過SerDes和UCIE相關IP技術切入市場均能側面證實。
但GPU中行業(yè)IP核占用的面積超過80%。但IP的研發(fā)并不輕松,GPU IP自研需要36—48個月以及200個工程師。采用外購IP雖能將開發(fā)周期縮短12—18個月。且高端芯片前端和后續(xù)設計1—3年,流片環(huán)節(jié)需3—6個月。若流片失敗,只能繼續(xù)上演該過程。且即使流片成功,還需經過3—12個月產品測試優(yōu)化,才能開啟量產。
這就意味著GPU廠商提出的AI芯片設計理念在當時或許很新穎,但若是被制成成品時,很有可能無法跟上市場需求和業(yè)界技術進展,最終被市場所淘汰。
換言之,AI大模型時代下GPU廠商面臨壓力遠比此前更大,想要生存更加不易。張建中也曾指出,摩爾線程目標為至少先存活10年。
三、國產GPU洗牌加劇,摩爾線程迎大考
不僅僅是摩爾線程想要“活下來”,國內很多投資人也不斷告訴自己的被投項目需要“先活下來”。
近兩年,國內GPU廠商從一度當紅的芯片領域,但在地緣政治帶來的不確定以及經營管理團隊融資欠缺等多因素共同影響下,行業(yè)急轉直下。
燒光融資的GPU廠商,或裁員或解散。進而到2024年,這種情況不僅未能迎來改善,反而仍在繼續(xù)惡化,國產GPU行業(yè)正迎來洗牌整合期。雖說燧原6年完成10次融資,累計融資金額高達70億元,目前正啟動A股IPO進程。但并非所有GPU廠商都有燧原這么“幸運”累計獲約25億元融資,估值約150億元,且為重慶當地AI獨角獸的象帝先因和資本對賭失敗,反遭投資者反撲。業(yè)務關停、大規(guī)模裁員、創(chuàng)始人從“吸金人”變成失信人。
圖源:象帝先官方
南京礪算子公司礪算上海,近期雖獲得東芯與其他投資者投資2億元、1.28億元,暫時解除資金鏈斷裂危機,但GPU的重資金屬性意味其后續(xù)可能還需尋求大量外部資金續(xù)命。大量GPU公司的倒閉讓投資人血虧,對GPU項目愈發(fā)謹慎背景下。全球科技市場的持續(xù)生變,讓該問題更加雪上加霜。
宏碁董事長暨執(zhí)行長陳俊圣指出,全球科技產業(yè)正上演恐怖電影。廠商或建立算力中心或建立資料中心,雖說發(fā)展路徑不同,但均需要服務器、存儲器、海量數據。投入這么多成本,又要多少廠商挖到金礦?微軟通過Copilot雖有所受益,但其又是否會愿意投入下去呢?或許當前廠商仍關注AI硬件、算力等等,但核心仍是商業(yè)模式得以延續(xù)。
陳俊圣的擔憂正是當前全球科技產業(yè)的真實寫照,這輪全球AI大模型浪潮,短期內除英偉達外,真正利潤大幅度增長的廠商有限。在AI大模型上游,AI大模型的爆發(fā)讓國產服務器一哥、號稱算力龍頭的浪潮信息2024年上半年業(yè)績大增、轉虧為盈,業(yè)績創(chuàng)下歷史新高。
圖源:浪潮信息財報
但浪潮信息業(yè)績大幅度改善的背后,頗有以價換量意味。2024年上半年7.74%的毛利率創(chuàng)下浪潮信息近幾年最低毛利率,浪潮信息方面稱,毛利率下跌主要受客戶結構、產品結構、原材料供應、市場競爭等多方面的綜合影響。換言之,若后續(xù)GPU廠商競爭激烈,是否同樣會采取以價換量策略呢?
圖源:浪潮信息財報
對大模型廠商來說,Open AI仍處在虧損中。援引The Informantion報道,Open AI的營收雖從2023年底的16億美元快速上漲到今年上半年的34億美元。但《紐約時報》預測,Open AI的技術投入或超過70億美元,為其收入的2倍以上。目前Open AI正調整組織架構,募集新一輪資本。
但Open AI的34億美元收入建立在周活躍用戶2億,每月收費20美元的基礎。國內又有多少大模型廠商,能做到GPT的用戶規(guī)模且讓用戶愿意持續(xù)付費呢?當大模型廠商長期處在虧損中,并不斷調整算法模型降低對AI芯片的需求,GPU廠商又會面臨何種問題呢?
此外,目前本土GPU芯片跟英偉達的產品相比,仍存在不小差距。從芯片設計上來看,跟英偉達的差距為12—18個月。在芯片制造制程上,英偉達已采用3納米制程,國內目前止步于5-7納米,這讓本就處在融資難、退出難的資本市場不得不更加謹慎。
隨著客戶結構和AI大模型市場的改變,摩爾線程又要如何應對未來可能出現(xiàn)的資金流問題,持續(xù)補充業(yè)務所需大量資金呢?
或許摩爾線程所經歷的這些問題,正是當前國內眾多GPU廠商的現(xiàn)狀。正如張建中所言,摩爾線程希望做的事情是解決最難做的事情,幫助國家、幫助行業(yè)解決缺少大算力的問題。
在國產替代這條路上,或許摩爾線程仍有諸多難題需要一一解決。但正是眾多摩爾線程廠商的出現(xiàn),國內和海外的差距才有望逐漸縮小,并可能實現(xiàn)反超。