撰文:程書書
編輯:李信馬
頭圖:豆包AI
DeepSeek的火爆有目共睹,自春節(jié)假期期間在社交媒體上引發(fā)廣泛討論,當下正以迅猛之勢向各個行業(yè)滲透。隨著“XXX接入DeepSeek”的消息如雪花般飛來,接入DeepSeek似乎成為當下?lián)肀I的“先進”標志。
圖源:DeepSeek截圖
隨著騰訊、百度、阿里、字節(jié)等大模型第一梯隊的大廠們都相繼宣布接入DeepSeek,“AI六小虎”中的階躍星辰和MiniMax等也都做出了同樣的選擇。
但有意思的是,騰訊、百度、阿里、字節(jié)等接入DeepSeek的程度不同。
對比來看,騰訊、百度接入DeepSeek最“深”。除了業(yè)務側(cè)產(chǎn)品(像騰訊的微信、騰訊文檔、QQ瀏覽器,百度的百度搜索、百度智能云旗下應用產(chǎn)品等),自研的AI助手騰訊元寶、文小言(原文心一言)也都接入了DeepSeek-R1。
阿里則是業(yè)務側(cè)產(chǎn)品接入了DeepSeek,像釘釘支持用戶使用DeepSeek 系列模型創(chuàng)建釘釘AI助理、定制智能多維表格,阿里云百煉平臺上線全尺寸DeepSeek模型,以及1688宣布將基于DeepSeek開發(fā)生意大模型,但給自研的大模型產(chǎn)品通義千問還是留有一部分獨立空間。
而字節(jié)對于DeepSeek的接入相對最“淺”,僅有火山引擎及其旗下產(chǎn)品和飛書官宣上線了DeepSeek系列模型。但一般來說,云平臺通常會提供多種大模型供用戶選擇和使用,以滿足不同的應用需求?;鹕揭嫫煜碌拇竽P头掌脚_火山方舟在此前,也上架了除自家豆包外的其他大模型,像智譜AI的GLM 模型、月之暗面的Moonshot等。至于飛書,準確來說,是飛書的多維表格中接入了 DeepSeek R1。
接入的最“淺”,是否意味著字節(jié)最為“自信”?認為其自研模型能達到或是趕超DeepSeek的水平?
2 月 13 日,字節(jié)舉辦了新一期的 All Hands 全員會上,關(guān)于DeepSeek的現(xiàn)象級熱度,字節(jié) CEO 梁汝波反思的同時,強調(diào)了2025年的重點目標:追求 “智能” 上限,關(guān)注關(guān)鍵技術(shù),字節(jié)的應對策略透露出戰(zhàn)略級的調(diào)整。
前幾天又有消息稱,前谷歌大牛吳永輝加入字節(jié)跳動擔任大模型團隊Seed基礎研究負責人,進一步釋放其堅持自研大模型的信號,未來,字節(jié)AI能否又后來居上呢?
01、遲到的入場與資本驅(qū)動的反超
字節(jié)有這樣的發(fā)展思路其實并不令人意外。畢竟,其旗下的豆包大模型在過去一年里已經(jīng)上演了一場“后來者居上”的逆襲劇情。
時間回溯到2022年11月,ChatGPT發(fā)布后在全球掀起了一場AI浪潮,國產(chǎn)大模型也隨之迎來了爆發(fā)期。2023年,眾多大廠和創(chuàng)新型企業(yè)紛紛亮出自研大模型產(chǎn)品,比如百度的文心、阿里的通義千問1.0、騰訊的混元、360的智腦、華為的盤古、科大訊飛的星火、商湯的日日新、百川大模型,以及智譜AI的GLM等,一時間群雄逐鹿,好不熱鬧。
然而,直到2023年1月,字節(jié)的大模型研發(fā)團隊才正式成立。
反應過來的字節(jié),在7個月后,推出自研的“云雀”大模型(后更名為“豆包”),同時還推出了一款多模態(tài)大模型——BuboGPT。在之后的大模型“價格戰(zhàn)”中,更是打出響亮的一槍。
圖源:火山引擎原動力大會圖片
進入2024年,為了在大模型追逐戰(zhàn)里搶占先機,字節(jié)一方面四處挖人:先后挖來了零一萬物原預訓練負責人黃文灝、Google 原 VideoPoet 項目負責人蔣路等。10 月份,還被曝出以八位數(shù)年薪的豪爽手筆挖走了阿里通義千問技術(shù)負責人周暢。
另一方面,字節(jié)傾注全系流量推廣豆包APP。2024年3月18日,抖音巨量廣告發(fā)布公告,限制AIGC軟件投流,從4月2日到年末,非字節(jié)系產(chǎn)品無人能使用抖音、頭條的巨大流量池。而根據(jù)AppGrowing的數(shù)據(jù)顯示,豆包智能助手在去年4月、5月的投放金額接近1800萬元,到6月上旬,這一數(shù)字飆升至1.24億元。在字節(jié)這種不計成本的投入下,成功讓豆包成了月活7000萬的國內(nèi)頭部AI APP。
如果以往的經(jīng)驗,這一賽道上,同行想要追趕上豆包恐怕是難上加難。
據(jù)浙商證券研報顯示,字節(jié)在 AI 領域的投入堪稱大手筆,2024 年的資本開支高達 800 億元,這一數(shù)字接近百度、阿里、騰訊三家總和(約 1000 億元),研發(fā)投入顯著領先于同行競爭對手。有媒體報道稱,字節(jié)計劃在2025年投入超1500億元用于資本支出。
另一方面,字節(jié)跳動早些年在移動互聯(lián)網(wǎng)時代積累下的成功 To C 經(jīng)驗,如今也轉(zhuǎn)化為了其獨特的差異化優(yōu)勢。相較于競爭對手,字節(jié)擁有更為豐沛海量的流量資源,能夠為落地應用的快速起量提供強有力的支撐保障。
據(jù)不完全統(tǒng)計,字節(jié)在2024年發(fā)布了接近20款AI應用,基本覆蓋了圖像、語音、音樂、視頻、3D等主流模態(tài)和場景。這種“飽和式”打法,讓字節(jié)成為AI領域“軍火庫”最齊全的科技公司之一。
02、DeepSeek重新定義游戲規(guī)則
然而,DeepSeek的出現(xiàn),卻改變了行業(yè)以往的規(guī)則。
首先,C端發(fā)生了肉眼可見的變化,隨著DeepSeek接連發(fā)布V3模型和R1模型后,豆包在過去一年建立的DAU優(yōu)勢,瞬間被瓦解。據(jù)QuestMobile數(shù)據(jù)顯示,DeepSeek在1月28日的日活躍用戶數(shù)就首次超越豆包,2月1日突破3000萬大關(guān)。且快速增長的用戶日活還沒“花錢”。用影視圈的說法是,全是“自來水”。
讓DeepSeek從豆包、Kimi等AI智能助手App中脫穎而出的,除了其對指令的理解以及答案的更為準確外,還有它出色的思維鏈(Long-CoT)能力。
不同于以往的AI大多只給結(jié)果,DeepSeek模型能夠展示思考過程,包括問題復述、回顧反思、知識調(diào)用(結(jié)論的來源和引用的網(wǎng)站等關(guān)鍵信息)與公式化等環(huán)節(jié)等。透明的思考路徑既為用戶提供了深入了解模型推理細節(jié)的機會,也能夠增強用戶對?AI?系統(tǒng)的信任。
而自1月份開始,阿里、科大訊飛、百川智能、月之暗面等AI企業(yè),也開始密集為旗下模型升級了深度思考能力。
圖源:KIMI截圖
當然,除了思維鏈模型,DeepSeek身上還有開源模式和低算力需求的優(yōu)勢。前者降低了進軍AI領域的技術(shù)門檻,后者在保持高準確性的同時顯著降低了內(nèi)存占用和計算開銷。這也使得DeepSeek在to B端更有性價比。
DeepSeek技術(shù)上突破所帶來的優(yōu)勢,打破了此前國內(nèi)市場的競爭格局與規(guī)則,科技大廠們似乎又回到同一起跑線。
面對新的游戲規(guī)則,相比百度、阿里、騰訊果斷接入DeepSeek的態(tài)度,字節(jié)的選擇確實更難。也選擇深度擁抱DeepSeek,那么此前建立的優(yōu)勢可能會功虧一簣;如若不,就意味著要和DeepSeek“硬剛”。
字節(jié)當下所展現(xiàn)出的態(tài)度,似乎更像是選擇 “硬碰硬” 式的應對。在其全員會的前兩天,豆包大模型團隊還提出了全新的稀疏模型架構(gòu)UltraMem,推理速度較MoE架構(gòu)提升2~6倍,推理成本最高可降低83%,看起來頗有劍指 DeepSeek 核心優(yōu)勢的意圖。
長遠來看,字節(jié)未必沒有勝算,上文的競爭規(guī)律在新一輪的賽程中同樣適用。在技術(shù)側(cè)的迭代和升級速度上“持久戰(zhàn)”,以及做好大模型技術(shù)與各類應用、場景的深度融合工作。
字節(jié)過去一年在應用端已經(jīng)打下一定基礎,在技術(shù)側(cè)方面,當下 “智能上限” 更高的 DeepSeek,同樣得直面技術(shù)迭代挑戰(zhàn)。
不過就當下情況來看,字節(jié)似乎處于比較被動的境地。通過接入DeepSeek,騰訊已經(jīng)在C端用戶的爭奪上展現(xiàn)出了趕超勢頭。從2月22日開始,騰訊旗下的AI應用“騰訊元寶”,就超越了豆包,躍居中國區(qū)蘋果應用商店免費APP下載排行榜第二位,并一直維持至今。
圖源:七麥數(shù)據(jù)
阿里也在DeepSeek帶來的新局面下,開始加大AI技術(shù)方面的投入。阿里集團CEO吳泳銘在2月20日晚財報電話會上稱:“未來三年在云和AI的基礎設施投入預計將超越過去十年的總和。”
擴大到全球范圍,在DeepSeek的刺激下,更多科技公司開始提速。如果不能盡快推出新的可以媲美DeepSeek的自研推理大模型,字節(jié)接下來或許將會更加的被動。