撰文 | 張? ?宇
編輯 | 楊博丞
題圖 | 圖蟲創(chuàng)意
1月16日,AI知識(shí)智能技術(shù)開發(fā)商智譜AI舉辦了首屆技術(shù)開放日(Zhipu DevDay),全面展示了其投身大模型事業(yè)三年多以來所積累的技術(shù)成果,并發(fā)布了新一代基座大模型GLM-4。
智譜AI CEO張鵬表示,GLM-4的整體性能相比上一代大幅提升,逼近GPT-4,可以支持更長的上下文,具備更強(qiáng)的多模態(tài)能力。同時(shí),GLM-4的推理速度更快,支持更高的并發(fā),大大降低推理成本。
圖源:智譜AI
除此之外,GLM-4大幅提升了智能體能力,GLM-4 All Tools實(shí)現(xiàn)自主根據(jù)用戶意圖,自動(dòng)理解、規(guī)劃復(fù)雜指令,自由調(diào)用網(wǎng)頁瀏覽器、Code Interpreter代碼解釋器和多模態(tài)文生圖大模型以完成復(fù)雜任務(wù)。GLMs個(gè)性化智能體定制功能亦同時(shí)上線,用戶用簡單的提示詞指令就能創(chuàng)建屬于自己的GLM智能體,大幅降低了大模型使用門檻。
“追趕OpenAI”“對(duì)標(biāo)Open AI是智譜AI成立以來的目標(biāo)”,是張鵬在對(duì)外分享時(shí)屢次提及的幾句話,目前大模型的競爭已經(jīng)不再是從0到1的有與無之爭,而是落地之爭,各家大模型開始貼身肉搏,被稱為“中國OpenAI”的智譜AI,究竟能否在大模型角逐戰(zhàn)中順利突圍?
一、暫時(shí)難以對(duì)標(biāo)OpenAI
智譜AI作為國內(nèi)第一開源大模型,有著較強(qiáng)的技術(shù)架構(gòu),但對(duì)標(biāo)OpenAI仍有一些距離。
張鵬坦言,和國外大模型相比,國內(nèi)的大模型發(fā)展起步晚了一些,加上高性能算力限制、數(shù)據(jù)質(zhì)量的差距等,國內(nèi)大模型在規(guī)模和核心能力上都與世界先進(jìn)水平存在一定差距,這樣的差距大約在一年左右。
從技術(shù)路線來看,OpenAI則更加注重通用性、可移植性和可擴(kuò)展性,其GPT系列模型可以在多個(gè)場景下應(yīng)用,并且具有高度的可定制性。相比之下,智譜AI的技術(shù)路線是“大模型+小模型”,通過大模型的預(yù)訓(xùn)練和微調(diào),來適應(yīng)不同場景和任務(wù)的需求。這種技術(shù)路線可以提高模型的泛化能力和應(yīng)用范圍,但也存在著模型復(fù)雜度高、計(jì)算量大、訓(xùn)練時(shí)間長等問題。
在模型規(guī)模,OpenAI的GPT系列模型規(guī)模較大,可以處理大量的自然語言數(shù)據(jù),從而獲得更好的模型性能。相比之下,智譜AI的模型規(guī)??赡茌^小,處理數(shù)據(jù)的能力有限,這可能會(huì)影響其模型性能和泛化能力。而在數(shù)據(jù)資源方面,OpenAI擁有大量的自然語言數(shù)據(jù)資源,可以用來訓(xùn)練和優(yōu)化其模型。相比之下,智譜AI的數(shù)據(jù)資源可能相對(duì)較少,導(dǎo)致其模型訓(xùn)練的效果和性能受到限制。
這意味著,想要盡快彌補(bǔ)與OpenAI之間的差距,智譜AI必須要持續(xù)提升大模型能力,訓(xùn)練參數(shù)自然也需要提升,但硬幣的另一面是,智譜AI在資金方面也將面臨著一個(gè)巨大的難題。
首先,硬件是一筆巨額投入,根據(jù)美國市場研究機(jī)構(gòu)TrendForce推算,處理ChatGPT的訓(xùn)練數(shù)據(jù)需要2萬枚GPU芯片,而隨著OpenAI進(jìn)一步展開ChatGPT和其他GPT模型的商業(yè)應(yīng)用,其GPU需求量將突破3萬張(該報(bào)告計(jì)算以A100芯片為主)。
此外,訓(xùn)練大模型的成本也不容小覷,根據(jù)國盛證券發(fā)布的《ChatGPT需要多少算力》估算,GPT-3訓(xùn)練一次的成本約為140萬美元,對(duì)于一些更大的LLM(大型語言模型),訓(xùn)練成本介于200萬美元至1200萬美元之間。
巨額資金從哪里來,以及能換回多少價(jià)值,對(duì)于智譜AI而言是一個(gè)未知數(shù)。
不過,好在智譜AI備受投資機(jī)構(gòu)青睞。2023年10月,智譜AI稱年內(nèi)已成功融資超過25億人民幣。這一重要的融資里程碑得到了多家知名機(jī)構(gòu)的積極支持,主要參與方包括社?;?、中關(guān)村自主創(chuàng)新基金、以及美團(tuán)、螞蟻、阿里、騰訊、小米、金山、順為資本、Boss直聘、好未來、紅杉、高瓴等多家機(jī)構(gòu),同時(shí)也包括一些老股東的跟投。
圖源:天眼查
尤其是2023年至今,智譜AI接連拿下5輪融資,估值超過100億元,躋身國內(nèi)AI領(lǐng)域“獨(dú)角獸”企業(yè)。智譜AI表示,融資將被用于進(jìn)一步推動(dòng)其基座大模型的研發(fā),以更好地支持廣泛的行業(yè)生態(tài),促進(jìn)與合作伙伴一起實(shí)現(xiàn)高速增長的愿景。
二、商業(yè)化高墻難越
商業(yè)化落地是驗(yàn)證一項(xiàng)新技術(shù)價(jià)值的最直接的方式?,F(xiàn)階段來看,國內(nèi)大模型百花齊放,但大部分仍處于講技術(shù)、講發(fā)展的階段,對(duì)于商業(yè)化落地,基本上處于探索階段。
整體而言,大模型企業(yè)的盈利方式主要包括大模型、大模型+算力、大模型+應(yīng)用。其中,大模型和大模型+算力為主要盈利方式。
智譜AI盈利方式和行業(yè)盈利方式基本一致,一是根據(jù)客戶需求,提供大模型定制化開發(fā)服務(wù),云端私有化本地私有化最高價(jià)格分別為120萬元/年和3690萬元/年;二是標(biāo)準(zhǔn)版大模型,提供API接入方式,按照Tokens使用收費(fèi),ChatGLM-Turbo、CharacterGLM、Text-Embedding收費(fèi)標(biāo)準(zhǔn)分別為0.005元/千Tokens、0.015元/千Tokens、0.005元/千Tokens。目前,智譜AI的商業(yè)化主要面向企業(yè)和機(jī)構(gòu)的B端用戶。
作為對(duì)比,OpenAI的商業(yè)化同樣分為C端和B端兩個(gè)部分,具體而言,針對(duì)C端市場,OpenAI推出ChatGPT Plus訂閱計(jì)劃,每月收費(fèi)20美元,相較于免費(fèi)版本,即便在高峰時(shí)段用戶也能正常訪問ChatGPT,響應(yīng)時(shí)間更快,并且可以優(yōu)先使用新功能等。而針對(duì)B端市場,OpenAI發(fā)布了ChatGPT API,開發(fā)者可以將ChatGPT集成到產(chǎn)品中,以更加高效地發(fā)揮出價(jià)值。
值得注意的是,OpenAI還在2023年8月推出了企業(yè)服務(wù)版,該服務(wù)版有望每月給OpenAI帶來6500萬元的收入。整個(gè)2023年,OpenAI推出的多項(xiàng)付費(fèi)方案已經(jīng)帶來了超過110億元的收入。
一個(gè)普遍的現(xiàn)象在于,包括智譜AI在內(nèi)的國內(nèi)大模型產(chǎn)品,在高投入的同時(shí)還難以帶來穩(wěn)定的盈利。雖然大模型商業(yè)化之路道阻且長,但曙光已現(xiàn)。三六零2023年半年報(bào)顯示,“360智腦”大模型已經(jīng)開始創(chuàng)收,金額近2000萬元;商湯集團(tuán)也公布,生成式AI在2023年上半年相關(guān)收入增長670%。
愛分析相關(guān)報(bào)告指出,目前大模型商業(yè)化提速較快的行業(yè)為能源和金融,其原因在于這兩個(gè)行業(yè)密集分布的央國企。央國企數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)完備、算力投入高、AI應(yīng)用場景多且基礎(chǔ)強(qiáng),這些原因促進(jìn)央國企與大模型的快速融合。
對(duì)于智譜AI而言,目前大模型商業(yè)化的路徑已經(jīng)較為清晰,但能否走通大模型的商業(yè)化之路,關(guān)鍵不僅在于商業(yè)模式的探索嘗試,更在于解決大模型發(fā)展的底層問題。
三、國產(chǎn)大模型何去何從?
根據(jù)工信部賽迪研究院最新數(shù)據(jù),2023年我國語言大模型市場規(guī)模實(shí)現(xiàn)較快提升,應(yīng)用場景不斷豐富。預(yù)計(jì)2023年我國大模型市場規(guī)模將達(dá)到132.3億元,增長率將達(dá)110%。
未來,隨著技術(shù)的不斷迭代進(jìn)步,大模型將在具身智能、自動(dòng)駕駛等領(lǐng)域開拓新的應(yīng)用場景。
具體而言,大模型的發(fā)展將有三大趨勢(shì):首先是大模型智能能力的提升,未來大模型將具有更高的精度、更強(qiáng)的理解能力和更廣泛的適用性,這意味著大模型能夠更好地理解自然語言,還能夠進(jìn)行更多的復(fù)雜任務(wù),比如全域控制、創(chuàng)作等等;其次是大模型將應(yīng)用于更多領(lǐng)域,除了傳統(tǒng)的文本處理之外,大模型也將在語音識(shí)別、圖像生成、視頻理解等方面發(fā)揮更大的作用,用戶可以在更多的場景中享受到AI帶來的便利。此外,大模型將更加定制化,能夠更好地滿足用戶的個(gè)性化需求,用戶可以根據(jù)自己的實(shí)際需求選擇合適的模型,并進(jìn)行定制化配置。
大模型飛速發(fā)展,但并不意味著無序發(fā)展。未來,針對(duì)大模型的監(jiān)管將愈加嚴(yán)格,2023年7月,網(wǎng)信辦等七部門發(fā)布了《生成式人工智能服務(wù)暫行管理辦法》,明確規(guī)定大模型產(chǎn)品需注重?cái)?shù)據(jù)隱私安全,不能非法獲取、披露、利用個(gè)人信息和隱私、商業(yè)秘密,不可侵犯知識(shí)產(chǎn)權(quán);大模型生成的內(nèi)容應(yīng)當(dāng)體現(xiàn)社會(huì)主義核心價(jià)值觀,不能生成歧視性的內(nèi)容等等。
對(duì)于大模型的未來,張鵬顯得十分樂觀,“2024年,大模型市場將從野蠻生長回歸冷靜,對(duì)于大模型的投資與炒作將會(huì)告一段落,行業(yè)焦點(diǎn)也將從模型本身轉(zhuǎn)向?qū)ふ覒?yīng)用。不過這并不代表大模型的技術(shù)演進(jìn)速度會(huì)下降,向上探索的天花板還遠(yuǎn)遠(yuǎn)沒到。”