亚洲无码综合色图,美女裸体网站国产免费一区二区,日韩欧美综合在线一区

DoNews > 專欄 > MAU被豆包反超，DeepSeek擠了點牙膏

MAU被豆包反超，DeepSeek擠了點牙膏

字母榜 2025-10-24 16:38:37

187398

分享到

在R2多次傳聞更新然后被“鴿”之后，DeepSeek又?jǐn)D了一點牙膏。

10月20日，DeepSeek團隊在Hugging Face與GitHub上線并開源了DeepSeek-OCR，參數(shù)規(guī)模約3B，采用了“視覺-文字壓縮”方案，相較傳統(tǒng)OCR模型提升了的掃描效率。DeepSeek-OCR的出現(xiàn)，有望補上DeepSeek在工具模型領(lǐng)域的又一塊拼圖。

然而，最近兩個月，這家火爆2025的AI獨角獸，在C端用戶規(guī)模上遭遇了頭號競爭對手——豆包的反超。根據(jù)QuestMobile此前披露的數(shù)據(jù)，中國消費級AI助手的榜首在近期易位，8月數(shù)據(jù)顯示，“豆包”月活（MAU）約為1.57億，環(huán)比增長6.6%，反超DeepSeek約1.43億升至第一。在一些業(yè)內(nèi)分析視角，“豆包”的反超源于其多模態(tài)能力的廣泛應(yīng)用，以及與抖音生態(tài)的深度接入。

不過，DeepSeek方面似乎堅信憑借模型技術(shù)迭代，也可以走出差異化道路。

如果把2025年看作國內(nèi)C端AI的“分水嶺”，上半場無疑是DeepSeek以開源與推理能力拉動的“技術(shù)爆炸時刻”，下半場豆包的反超，則更像是互聯(lián)網(wǎng)巨頭在深度整合資源后的“反擊時刻”。而讓出C端市場頭把交椅的Deepseek，卻遲遲沒有對旗下主力模型進行大版本更新。本次DeepSeek-OCR的“擠牙膏”，似乎是這家國內(nèi)頂流AI創(chuàng)業(yè)公司，技術(shù)鏈路優(yōu)先理念的又一次延續(xù)。

OCR，一項大眾并不陌生的技術(shù)，指將文本圖像轉(zhuǎn)換為機器可讀文本格式的流程。和此前的OCR系統(tǒng)/模型不同，Deepseek-OCR采用了“視覺-文字壓縮”方案，這樣一個只有3B大小的模型，卻在OmniDocBench測試中，僅使用100個視覺標(biāo)記就勝過了GOT-OCR 2.0，后者用了256個視覺標(biāo)記。而在標(biāo)記數(shù)量少于800個的情況下，它也擊敗了MinerU 2.0，后者每頁需要超過6000個標(biāo)記。

另一方面，百度在此前正式發(fā)布并開源其自研的多模態(tài)文檔解析模型PaddleOCR-VL。這一模型在全球權(quán)威的文檔解析評測榜單OmniBenchDoc V1.5中，以92.6分的成績登頂全球第一。而Deepseek緊隨其后發(fā)布的Deepseek-OCR的操作，在一些行業(yè)社群中被冠以“阻擊競爭對手”的標(biāo)題。

回到Deepseek-OCR的“視覺-文字壓縮”方案，通常情況下，大語言模型在執(zhí)行OCR任務(wù)時計算成本極高——處理的文字單元越多，計算量就會呈二次方增長。傳統(tǒng)的OCR系統(tǒng)在識別一頁文檔時，往往需要處理上千個文字標(biāo)記才能完成用戶指令。

而在Deepseek-OCR，模型工程人員嘗試了一種更高效的路徑：利用視覺語言模型（VLM），直接在語義層面對圖像中的文字信息進行壓縮，將原本需要成千上萬文字標(biāo)記才能表達(dá)的內(nèi)容，映射為更少量、更具語義密度的視覺標(biāo)記，從而顯著降低整體計算成本。

此外，DeepSeek-OCR還擁有“深度解析模式”，能將財務(wù)類圖表直接轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)，自動生成Markdown表格與圖像。這意味著，一份包含數(shù)字、曲線、圖注的財報截圖，不再需要人工復(fù)制粘貼或二次整理，系統(tǒng)就能還原出可編輯的分析稿格式。

這套系統(tǒng)的核心由兩部分組成：負(fù)責(zé)圖像理解的DeepEncoder，以及基于DeepSeek-3B-MoE架構(gòu)的文字生成模塊。DeepEncoder約有3.8億參數(shù)，專門分析圖像并生成壓縮后的視覺特征；而文字生成部分啟用了5.7億個活躍參數(shù)，用于根據(jù)這些視覺特征生成高精度的文字描述。

據(jù)了解，Deepseek-OCR在10倍壓縮下解碼精度可達(dá)97%，即使在20倍壓縮下也能保持60%的準(zhǔn)確率。這意味著一張圖像僅需LLM所需token的一小部分，即可表示整篇文檔。

從技術(shù)維度看，該模型代表著DeepSeek正在從“語言模型＋Chatbot”核心路徑，向更多的用戶場景拓展。伴隨著Deepseek-OCR的正式開源，其相關(guān)能力有望進一步產(chǎn)品化，在長文本、表格、跨頁文檔的壓縮與提取場景均有應(yīng)用空間。

回顧Deepseek的通用大模型產(chǎn)品線不難發(fā)現(xiàn)，OCR能力一直是R1系列的能力短板。此前，盡管DeepSeek R1在成本效益和邏輯性能方面具有明顯的優(yōu)勢，但PDF解讀等場景與其他頂級模型（Claude Opus 4和ChatGPT-5）相比仍然較為有限。缺乏原生OCR、文件大小限制以及文件API缺失，使得DeepSeek R1無法成為完整的文檔解決方案。

所以，DeepSeek-OCR既有可能衍生出獨立工具產(chǎn)品，也可能是后續(xù)通用模型迭代的“技術(shù)積累”動作。而傳說中的大版本更新，根據(jù)《The Information》在此前的報道中披露，“盡管DeepSeek工程師過去數(shù)月一直在高強度開發(fā)R2模型，但CEO梁文鋒對新模型的性能表現(xiàn)并不滿意。”

R2的面世時間也因此一拖再拖，但產(chǎn)品領(lǐng)域的競爭對手卻已經(jīng)拍馬趕到。就在幾周前，另一款A(yù)I App取代了Deepseek ，成為了新的C端AI應(yīng)用月活冠軍。豆包，帶著字節(jié)系產(chǎn)品的龐大生態(tài)，在下半年卷土重來。

根據(jù)QuestMobile數(shù)據(jù)，2025年8月，豆包月活用戶數(shù)約為1.57億，環(huán)比增長約6.6%；同期DeepSeek月活約為1.43億。豆包時隔兩個季度，在國內(nèi)C端AI應(yīng)用市場中重新奪回頭部地位。

奪回“月活冠軍”，豆包的成功離不開其生態(tài)優(yōu)勢與用戶觸點積累。和Deepseek不同，豆包定位為面向所有“大眾用戶”、強調(diào)場景化體驗，在語音、圖像、社交分享等領(lǐng)域均延展了模型能力，降低了用戶使用門檻。與此相比，DeepSeek雖在技術(shù)上表現(xiàn)強勁，卻更像ChatGPT模式的聊天應(yīng)用，入口單一、使用門檻相對更高。

具體而言，豆包對于Deepseek的包圍主要體現(xiàn)在以下三個領(lǐng)域：一方面，豆包天然可以借助抖音等字節(jié)系社交平臺的分發(fā)能力。從豆包面世以來，字節(jié)方面在AI產(chǎn)品投放上積攢了大量經(jīng)驗，在一些視頻網(wǎng)站上，各種“劇情”的豆包廣告層出不窮，許多新用戶往往在這一過程中被動接觸并轉(zhuǎn)化。

另一方面，豆包在立項一開始就瞄準(zhǔn)了最廣泛的受眾，產(chǎn)品體驗面更寬。甚至在兩個產(chǎn)品的名字上就可以窺探一二。相比起“Deepseek”的極客風(fēng)，“豆包”這個名字，對于國內(nèi)用戶也相對更朗朗上口。在APP的logo設(shè)計上，豆包也選擇了更加擬人化的處理。據(jù)了解，在豆包立項之初，人格化交互能力就是豆包能力建設(shè)的板塊之一，隨豆包一同公測的還有聊天Agent“小寧”，可以說，陪伴/擬人的屬性在一開始就是豆包基因的一部分。

此外，憑借著字節(jié)在語音/視頻生成等多領(lǐng)域建立起的模型矩陣，如今的豆包堪稱AI圈的超級APP。支持多種多模態(tài)（文本、語音、圖像、視頻生成）功能，功能繁雜的同時也有清晰的用戶引導(dǎo)邏輯，小白用戶上手快，讓“非AI玩家”也能有不錯的體驗。

《WIRED》在此前披露的一篇專欄中這樣形容“豆包”：“它就像ChatGPT、Midjourney、Sora、Character.ai、TikTok、Perplexity等眾多功能集成在一個應(yīng)用程序中?！笔聦嵶C明，這種大而全的一體化AI解決方案，對于0基礎(chǔ)的AI產(chǎn)品用戶確實相對友好。

據(jù)《南華早報》報道，今年1月，爆火的DeepSeek取代ChatGPT，一度奪得App Store美區(qū)榜首位置。但在隨后一段時期，國內(nèi)幾大AI巨頭紛紛開始發(fā)力，C端AI應(yīng)用市場陷入了投流和“內(nèi)卷”的競爭中，除了剛剛奪回第一名寶座的豆包，騰訊旗下的元寶在8月也收獲了22.4%的用戶增長，MAU達(dá)到3300萬。螞蟻集團旗下的AQ健康應(yīng)用也沖進了榜單前十，該應(yīng)用于6月推出，8月用戶數(shù)環(huán)比增長60.1%。

而據(jù)QuestMobile數(shù)據(jù)顯示，5月份離開DeepSeek的用戶中，約有40%轉(zhuǎn)投豆包。在“好用”和“好玩又好用”之間，對于大部分普通用戶而言，后者的吸引力顯然更大一些。

在這場頭名競逐中，豆包和背后的字節(jié)跳動擁有了科技巨頭級的體量、數(shù)據(jù)和全球布局，而DeepSeek的優(yōu)勢在于靈活、學(xué)院派的研究范式，以及一條更“專注”的技術(shù)路線。而在2025年10月的節(jié)點，是豆包憑借著更大的生態(tài)體量，成功擠到了隊伍最前面。

盡管DeepSeek在2025年初曾取得引人關(guān)注的用戶增長與技術(shù)突破，但其后增長勢頭出現(xiàn)減緩跡象。咨詢公司羅蘭貝格此前披露的報告指出，截至2025年2月，DeepSeek與豆包在中國Top 10 AI應(yīng)用中并列，但彼時Deepseek領(lǐng)先豆包約3600萬MAU。此后，豆包在8月完成反超。

從產(chǎn)品更新節(jié)奏看，DeepSeek在2024年底發(fā)布V3模型，今年5月發(fā)布R1-0528，優(yōu)化了R1模型的幻覺問題。但在這之后，盡管大版本更新傳言不斷，但傳說中的R2卻遲遲未現(xiàn)真身。在本次OCR模型發(fā)布之前，Deepseek在下半年的主要動作是更新了V3.1模型，支持混合推理模式以及128K tokens的長上下文輸入。

而在月活榜單被豆包擠到第二名后，Deepseek也并未在App端交互/生態(tài)上做出大幅優(yōu)化動作。事實上，從年初爆火到至今，Deepseek App一直沿用著類似“ChatGPT”風(fēng)格的交互邏輯，沒有豆包里各種第一方/第三方Agent，堅定走在“模型即產(chǎn)品”的道路上。

在戰(zhàn)略路徑上，Deepseek始終堅持“技術(shù)深耕”的路線。本次更新的Deepseek-OCR模型也說明，這家AI獨角獸在LLM領(lǐng)域仍然有著領(lǐng)先的技術(shù)探索能力。但面對競爭對手們龐大的生態(tài)優(yōu)勢，Deepseek眼下的產(chǎn)品理念和風(fēng)格，對于用戶規(guī)模的轉(zhuǎn)化效率仍有待觀察。

不過，DeepSeek確實沒理由太過焦慮，即使被豆包反超，Deepseek仍然坐擁1.5億月活，在C端領(lǐng)域已經(jīng)打響了口碑。而在技術(shù)指標(biāo)上，Deepseek也一直在延續(xù)超大參數(shù)模型策略，V3系列總參數(shù)量高達(dá)671B，同期AI“六小龍”其他的開源模型，如智譜GLM-4.5只有355B。

此外，在一些業(yè)內(nèi)視角看來，DeepSeek-OCR的發(fā)布，一方面在C端工具類場景有著不錯的應(yīng)用前景，同時也可能成為模型訓(xùn)練的“催化劑”。據(jù)了解，DeepSeek-OCR每天可以在單個Nvidia A100 GPU上處理超過20萬頁數(shù)據(jù)。如果使用20臺服務(wù)器，每臺服務(wù)器運行8塊A100處理器，吞吐量將躍升至每天3300萬頁。

這樣的吞吐效率，可以有效幫助構(gòu)建其他大模型的訓(xùn)練數(shù)據(jù)集。對于走超大參數(shù)路線的AI企業(yè)而言，LLM訓(xùn)練中往往需要海量高質(zhì)量文本，而DeepSeek-OCR出現(xiàn)，無疑在這一領(lǐng)域指向了一條更高效的解決鏈路。

未來，DeepSeek如果想要在后續(xù)和豆包“掰掰手腕”，生態(tài)因素仍然是不得不考慮的因素。強如OpenAI，進入2025年后，也在積極拓展模型能力在各領(lǐng)域生態(tài)的構(gòu)建，不管是參與AI玩具等硬件方案的研究，還是Sora2以短視頻平臺的方式與用戶見面，OpenAI已經(jīng)給Deepseek留下了參考模板。

換言之，Deepseek眼下的要緊事，除了加速下一代模型的迭代外，利用好手上的龐大的C端用戶規(guī)模同樣至關(guān)重要。由于模型產(chǎn)品線不同，Deepseek短期內(nèi)顯然無法復(fù)刻字節(jié)/OpenAI的生態(tài)策略。但對于這家技術(shù)底色濃厚的AI獨角獸而言，在C端生態(tài)上能否搞出一些差異化的路線，將是它能否再度向豆包發(fā)起沖擊的重要因素。

特別聲明：本文為合作媒體授權(quán)DoNews專欄轉(zhuǎn)載，文章版權(quán)歸原作者及原出處所有。文章系作者個人觀點，不代表DoNews專欄的立場，轉(zhuǎn)載請聯(lián)系原作者及原出處獲取授權(quán)。(有任何疑問都請聯(lián)系idonews@donews.com)