DoNews7月26日消息,2025世界人工智能大會(huì)(WAIC)于今日在上海開(kāi)幕。作為全球人工智能領(lǐng)域的頂級(jí)盛會(huì),本屆大會(huì)以“智能時(shí)代 同球共濟(jì)”為主題,匯聚全球智慧,展現(xiàn)中國(guó)方案。
活動(dòng)首日,MiniMax創(chuàng)始人、CEO閆俊杰先生作為特邀嘉賓出席大會(huì)開(kāi)幕式并在大會(huì)主論壇(上午場(chǎng))發(fā)表主題演講《每個(gè)人的AI,Everyone's AI》。
以下為分享全文:
大家好,我給大家分享的題目是《每個(gè)人的AI,Everyone's AI》。講這個(gè)題目,跟我個(gè)人過(guò)去經(jīng)歷有關(guān)。當(dāng)Hinton先生開(kāi)始設(shè)計(jì) AlexNet 之時(shí),我是國(guó)內(nèi)第一批從事深度學(xué)習(xí)研究的博士生;當(dāng)AlphaGo人機(jī)大戰(zhàn)上演,也是人工智能走進(jìn)所有人視野之時(shí),我在參與一家創(chuàng)業(yè)公司;而當(dāng)ChatGPT出來(lái)的前一年,我們開(kāi)始創(chuàng)立MiniMax,也是國(guó)內(nèi)第一批大模型公司。
在過(guò)去的15年里,當(dāng)我每天面對(duì)任務(wù)寫(xiě)代碼,看論文做實(shí)驗(yàn)的時(shí)候,一直都在想一件事:如此受關(guān)注的人工智能到底是什么?人工智能跟這個(gè)社會(huì)到底有什么樣的聯(lián)系?
隨著我們模型變得越來(lái)越好,我們發(fā)現(xiàn)人工智能正逐步成為社會(huì)的生產(chǎn)力。比如,我們?cè)谧鋈斯ぶ悄苎芯康臅r(shí)候,每天需要分析大量的數(shù)據(jù),一開(kāi)始我們需要來(lái)寫(xiě)一些軟件來(lái)分析這些數(shù)據(jù),后續(xù)我們發(fā)現(xiàn)其實(shí)可以讓 AI 來(lái)生成一個(gè)軟件,來(lái)幫助分析所有數(shù)據(jù)。
作為一個(gè)研究員, 我非常關(guān)心每天AI領(lǐng)域的所有進(jìn)展,一開(kāi)始我們?cè)O(shè)想,是不是可以做一款A(yù)PP,來(lái)幫我們追蹤各領(lǐng)域的進(jìn)展?后面我們發(fā)現(xiàn),這件事也不需要自己來(lái)做,讓一個(gè) AI Agent 來(lái)自動(dòng)跟蹤更加高效。
AI是更強(qiáng)的生產(chǎn)力,也是越來(lái)越強(qiáng)的創(chuàng)意。比如,15 年前上海舉辦世博會(huì)的時(shí)候,有一個(gè)非?;鸨募槲锝小昂殹薄_^(guò)去 15 年,上海有了全方位的發(fā)展,我們?nèi)绻肜^續(xù)用“海寶”IP生成一系列更具上海特色,符合時(shí)下潮流的衍生形象時(shí),AI 可以做得更好。正如現(xiàn)場(chǎng)屏幕展示的,徐匯書(shū)院×海寶、武康大樓×海寶,AI 能一鍵直出,幫我們生成各種各樣的創(chuàng)意形象。
再比如最近非?;鸬腖abubu,此前制作一個(gè)Labubu創(chuàng)意視頻,可能需要兩個(gè)月,花費(fèi)大約幾十甚至百萬(wàn)人民幣。通過(guò)越來(lái)越強(qiáng)的AI視頻模型,像大屏幕右邊展示的Labubu視頻,基本一天時(shí)間就可以生成出來(lái),成本只有幾百塊錢(qián)。
過(guò)去六個(gè)月,我們的視頻模型海螺(Hailuo)已經(jīng)在全世界生成超過(guò)3億個(gè)視頻。通過(guò)高質(zhì)量的 AI 模型,互聯(lián)網(wǎng)上的大部分內(nèi)容與創(chuàng)意會(huì)變得越來(lái)越普及,低門(mén)檻讓每個(gè)人的創(chuàng)意得以充分發(fā)揮。
除了釋放生產(chǎn)力與創(chuàng)意之外,我們發(fā)現(xiàn), AI 的使用其實(shí)已經(jīng)超出最初的的設(shè)計(jì)與預(yù)期,各種各樣想象不到的應(yīng)用場(chǎng)景正在發(fā)生;比如解析一個(gè)古文字、模擬一次飛行、設(shè)計(jì)一個(gè)天文望遠(yuǎn)鏡……這樣意想不到的場(chǎng)景,隨著模型能力越來(lái)越強(qiáng),變得越來(lái)越可行;僅僅需要少量協(xié)作,就可以把每個(gè)人的想法變成現(xiàn)實(shí)。僅僅需要少量協(xié)作,就可以把每個(gè)人的想法變成現(xiàn)實(shí)。
面對(duì)這么多變化,一個(gè)想法開(kāi)始在我的心里涌現(xiàn)出來(lái):作為一個(gè)AI創(chuàng)業(yè)者,AI 公司并不是重新復(fù)制一個(gè)互聯(lián)網(wǎng)公司,AI 是一個(gè)更基礎(chǔ)更根本的生產(chǎn)力,是對(duì)個(gè)人能力和社會(huì)能力的持續(xù)增強(qiáng)。這里有兩點(diǎn)比較關(guān)鍵:第一、AI是一種能力,第二是AI是可持續(xù)的。
人類(lèi)很難突破生物定律,永不停歇學(xué)習(xí)新知識(shí),持續(xù)變聰明,而AI可以。當(dāng)我們?cè)诮ㄔ旄玫?AI 模型時(shí),我們也發(fā)現(xiàn),AI 也在和我們?nèi)祟?lèi)一起進(jìn)步,一起做出來(lái)更好的AI。就在我們公司內(nèi)部,員工每天需要寫(xiě)很多代碼,做很多研究型實(shí)驗(yàn),這里邊大概有 70% 的代碼是 AI 來(lái)寫(xiě),90% 數(shù)據(jù)分析是靠 AI 來(lái)做。
AI 怎么能變得越來(lái)越專(zhuān)業(yè)?大約在一年前,當(dāng)時(shí)訓(xùn)練模型還需要大量的基礎(chǔ)標(biāo)注工作,標(biāo)注員是一個(gè)不可或缺的工種。而今年,當(dāng) AI 能力變得越來(lái)越強(qiáng)的時(shí)候,大量機(jī)械的標(biāo)注工作被專(zhuān)業(yè)AI完成,標(biāo)注員則可以專(zhuān)注于更有價(jià)值的專(zhuān)家型工作,一起幫助模型變得更好。
標(biāo)注工作也不再是簡(jiǎn)單給 AI一個(gè)答案,而是教會(huì)AI思考的過(guò)程,讓AI來(lái)學(xué)習(xí)人類(lèi)的思考過(guò)程,從而使AI能力變得更加泛化,越來(lái)越接近人類(lèi)頂尖專(zhuān)家的水平。
除了通過(guò)專(zhuān)家來(lái)教 AI 之外,還有另外一種進(jìn)步,就是在環(huán)境中大量學(xué)習(xí)。在過(guò)去半年, 通過(guò)各種環(huán)境,從編程IDE,到 Agent 環(huán)境, 再到游戲沙盒,當(dāng)我們把 AI 放到一個(gè)能夠持續(xù)提供可驗(yàn)證的獎(jiǎng)勵(lì)環(huán)境中學(xué)習(xí),只要這個(gè)環(huán)境可以被定義出來(lái),有明確的獎(jiǎng)勵(lì)信號(hào),AI 就可以把問(wèn)題給解決。這個(gè)強(qiáng)化學(xué)習(xí)也變得可持續(xù),規(guī)模越來(lái)越大。
基于這些觀察,我們有一個(gè)非常確定性的判斷:AI 會(huì)變得越來(lái)越強(qiáng),而且這種增強(qiáng)幾乎是沒(méi)有盡頭的。
接下來(lái)出現(xiàn)的問(wèn)題是,AI這么強(qiáng),對(duì)社會(huì)的影響越來(lái)越大,那么AI到底會(huì)不會(huì)被壟斷?它是會(huì)被掌握在一家組織里,還是掌握在多家組織里呢?
我們認(rèn)為,AI領(lǐng)域一定會(huì)有多個(gè)玩家持續(xù)存在。原因有三點(diǎn):第一,我們目前用到的所有模型,都依賴(lài)對(duì)齊(Model Alignment)。很明顯,不同模型的對(duì)齊目標(biāo)其實(shí)是不一樣的,比如有的模型對(duì)齊目標(biāo)是一個(gè)靠譜的程序員,那么做 Agent 就會(huì)特別的強(qiáng);有的模型它對(duì)齊目標(biāo)是與人的交互,那么它就會(huì)比較有情商, 能夠做流暢的對(duì)話(huà);有的模型可能會(huì)充滿(mǎn)想象力。不同的對(duì)齊目標(biāo)反映了不同公司或者組織的價(jià)值觀,這些價(jià)值觀最終會(huì)導(dǎo)致模型的表現(xiàn)非常不一樣,也會(huì)使得不同的模型擁有各自的特點(diǎn),并且長(zhǎng)期存在。
第二,我們?cè)谧罱肽暧玫?AI 系統(tǒng)其實(shí)都已經(jīng)不是單個(gè)模型了,而是一個(gè)多 Agent系統(tǒng),里面涉及多個(gè)模型, 不同的模型也可以使用不同的工具,通過(guò)這樣的方式讓AI智能水平越來(lái)越高,能夠解決越來(lái)越復(fù)雜的問(wèn)題。這個(gè)東西帶來(lái)的結(jié)果是,單一模型的優(yōu)勢(shì)在這樣一個(gè)多 Agent 系統(tǒng)里逐漸變?nèi)?/strong>。
第三,在過(guò)去半年,有很多非常智能的系統(tǒng),都不是大公司所擁有的。背后的原因,是過(guò)去一年開(kāi)源模型如雨后春筍般涌現(xiàn),開(kāi)源模型變得越來(lái)越有影響力。這張圖是過(guò)去一年比較受關(guān)注 AI 的排行榜,可以發(fā)現(xiàn)最好的模型還是閉源的,但最好的開(kāi)源模型越來(lái)越多,同時(shí)也在不斷逼近最好的閉源模型。
基于這三點(diǎn)原因,我們認(rèn)為, AI 一定會(huì)被掌握在多家公司的手中。
與此同時(shí),我們認(rèn)為 AI 一定會(huì)變得越來(lái)越普惠,使用成本也會(huì)變得更加可控。
在過(guò)去一年半, AI 模型的大小沒(méi)有發(fā)生特別大的變化,即便我們可使用算力更多了。為什么呢?對(duì)所有實(shí)用模型而言,計(jì)算速度是一個(gè)比較關(guān)鍵的因素。如果模型計(jì)算速度特別慢,就會(huì)降低用戶(hù)的使用意愿,所以所有公司都關(guān)注模型的參數(shù)量和智能水平之間的平衡。
此前,模型大小增長(zhǎng)和芯片的進(jìn)步速度基本上是成正比的。我們知道芯片的進(jìn)步速度是每 18 個(gè)月會(huì)翻一倍,模型也會(huì)相應(yīng)保持這樣的增長(zhǎng)趨勢(shì)。而現(xiàn)在,雖然大家都有更多的算力了,模型參數(shù)卻沒(méi)有變得更大。那這些增長(zhǎng)的算力花在哪呢?
首先說(shuō)訓(xùn)練,規(guī)模增長(zhǎng)的速度在過(guò)去半年已經(jīng)變得比較緩慢,訓(xùn)練單個(gè)模型的成本實(shí)際上卻沒(méi)有顯著增加。這些算力花在做更多的研究跟探索上。而我們知道研究和探索,除了取決于算力之外,還取決于高效的整體實(shí)驗(yàn)設(shè)計(jì),高效的研發(fā)團(tuán)隊(duì),以及一些天才的創(chuàng)意。
結(jié)果是,擁有非常多算力的公司和沒(méi)擁有那么多算力的公司,在訓(xùn)練上其實(shí)的差異可能不會(huì)那么大。沒(méi)有那么多算力的公司,可以通過(guò)持續(xù)提升自己的實(shí)驗(yàn)設(shè)計(jì)、提升思考能力和組織形式,讓實(shí)驗(yàn)探索變得更加高效。
再說(shuō)推理,在過(guò)去一年,最好模型的推理成本其實(shí)是降了一個(gè)數(shù)量級(jí),通過(guò)大量的計(jì)算網(wǎng)絡(luò)系統(tǒng)和優(yōu)化算法,我們認(rèn)為在接下來(lái)一兩年之內(nèi),最好模型的推理成本可能還能再降低一個(gè)數(shù)量級(jí)。總結(jié)而言,我們認(rèn)為訓(xùn)練單個(gè)模型的成本不會(huì)顯著地增加。
我們認(rèn)為,大量創(chuàng)新能讓 AI 研發(fā)變成一個(gè)沒(méi)有那么燒錢(qián)的行業(yè),但是算力使用還會(huì)增加。盡管 Token 會(huì)變得很便宜,但是使用 Token 的數(shù)量會(huì)顯著增加。去年ChatBot單個(gè)對(duì)話(huà)只要消耗幾千個(gè)Token,現(xiàn)在 Agent 單個(gè)對(duì)話(huà)可能消耗幾百萬(wàn)個(gè)Token,并且因?yàn)锳I解決的問(wèn)題越來(lái)越復(fù)雜,越來(lái)越實(shí)用,那么用的人也會(huì)越來(lái)越多。
讓每個(gè)人都用得起AI,這是我們對(duì) AI 發(fā)展的判斷。Intelligence with Everyone,這也是我們創(chuàng)業(yè)的初衷。我們認(rèn)為 AGI一定會(huì)實(shí)現(xiàn),并且一定會(huì)服務(wù)大眾、普惠大眾。
如果有一天 AGI 實(shí)現(xiàn)了,其過(guò)程一定是由做 AI 的公司們和他們的用戶(hù)一起來(lái)實(shí)現(xiàn),并且這個(gè) AGI 應(yīng)該屬于多家AI 公司和它的廣泛用戶(hù),而不是只屬于單個(gè)組織某家公司。
我們也愿意長(zhǎng)期為這個(gè)目標(biāo)而奮斗。感謝大家!