幾天前,豆包又推出了一款新產(chǎn)品——豆包輸入法。
輸入法是古老的工具型產(chǎn)品。在移動(dòng)端,用戶早已習(xí)慣了使用手機(jī)自帶的輸入法,或是沿襲PC時(shí)代的習(xí)慣,使用搜狗輸入法、QQ輸入法等。
直到2022年微信輸入法橫空出世,這塊穩(wěn)得不能再穩(wěn)的市場才迎來新的變量。憑借微信的龐大用戶池,微信輸入法很快成為許多用戶的新選擇。
但如前所述,微信對于輸入法似乎興趣不大。過去三年間,它并沒有給輸入法增添復(fù)雜花哨的功能,即便是AI能力也十分克制。這也和微信長期以來的產(chǎn)品哲學(xué)一脈相承。
相比之下,豆包輸入法顯得頗為“激進(jìn)”。
它把語音輸入作為最大賣點(diǎn),傳統(tǒng)的鍵盤輸入只保留了拼音輸入法,試圖以更簡單的使用體驗(yàn)吸引用戶。
但顯而易見的是,豆包及其背后的字節(jié),并非對輸入法市場產(chǎn)生了濃厚興趣。豆包輸入法更像是字節(jié)對微信的又一次突襲,角度極其刁鉆,又十分精妙。
豆包此前已經(jīng)成為國內(nèi)用戶量最大的AI APP,MAU(月活躍用戶)達(dá)1.7億。但與14億MAU的微信相比,豆包仍存在數(shù)量級的差距。
這就造成了一個(gè)長期問題:字節(jié)使出渾身解數(shù),為豆包吸引了近2億用戶;但倘若微信全面接入騰訊自己的AI服務(wù),那么字節(jié)在AI應(yīng)用層被騰訊反超,并非不可能。
事實(shí)上,騰訊已經(jīng)在這么做了——微信搜索框已經(jīng)演進(jìn)為“AI搜索”。
豆包的解法是:既然無法正面擊敗微信,那就“化身”工具型應(yīng)用,直接“住進(jìn)”微信的聊天框里,滿足微信用戶的AI應(yīng)用需求,從微信汲取新用戶。
豆包輸入法,就在這樣的背景下誕生了。
除了輸入法,從最基本的截圖,再到效率化的辦公工具,最后是會議紀(jì)要的智能,豆包正在針對微信的一系列“槽點(diǎn)”做文章,以期獲取增長。
背負(fù)著十億用戶的微信,遇上豆包這個(gè)挑戰(zhàn)者。前者實(shí)力雄厚,后者卻不按常理出牌、專門挑微信的“軟肋”進(jìn)攻,肉搏戰(zhàn)才剛剛開始。
A
打開豆包輸入法,其頁面布局、配色幾乎和微信輸入法相同,降低了用戶從微信輸入法切換到豆包輸入法的門檻。
與微信輸入法相比,豆包輸入法的優(yōu)勢在于語音識別。
豆包用的是Seed - ASR2.0模型,而不是傳統(tǒng)的機(jī)械轉(zhuǎn)寫語音。相較于傳統(tǒng)語音識別,基于大模型的語音識別能夠理解上下文、識別專業(yè)術(shù)語、自動(dòng)斷句。
實(shí)測中,能過濾說話時(shí)的 “嗯、呃” 等口頭禪及重復(fù)表述,還會依據(jù)語境梳理語義。就算是用中英混合表達(dá) ,比如“幫我scan入電腦做個(gè)copy,再share給大家” ,豆包輸入法依然能準(zhǔn)確識別并轉(zhuǎn)寫。
此外,當(dāng)用戶處在嘈雜的環(huán)境里用語音輸入時(shí),豆包也能夠準(zhǔn)確過濾背景噪音,識別出真正的語音內(nèi)容。
使用微信輸入法測試同樣的內(nèi)容,微信輸入法也能識別中英混雜的語音。但是在嘈雜環(huán)境中,尤其是地鐵場景,豆包輸入法則更準(zhǔn)確一些。
豆包輸入法還提供了150MB的離線語音模型,無網(wǎng)時(shí)也能實(shí)現(xiàn)0.8秒低延遲語音轉(zhuǎn)換,而微信輸入法在離線場景下的語音識別表現(xiàn)較差,小錯(cuò)誤較多。
相較于微信輸入法,豆包輸入法取消了輸入法皮膚管理、五筆輸入,手寫輸入、AI搜索等功能,僅保留了拼音輸入和語音輸入。
此外,豆包還壓縮了安裝包的體積,APK有146MB。相比之下,微信輸入法安卓版將近200MB,iOS版更是有400MB。
但豆包輸入法也有一些巧思。
比如輸入“吳承恩是哪個(gè)朝代”,微信輸入法會聯(lián)想“的人”,而豆包輸入法則是會在聯(lián)想窗口回答“明朝”。當(dāng)用戶輸入 “CT 值” 這類專業(yè)詞匯時(shí),豆包輸入法能關(guān)聯(lián)醫(yī)學(xué)解釋。
微信輸入法:
豆包輸入法:
豆包輸入法發(fā)布時(shí),字節(jié)方面表示之所以要?jiǎng)h除傳統(tǒng)輸入法常見的功能,就是為了凸顯AI元素,把AI作為輸入法的核心競爭力來打造。
相比之下,微信似乎更看重輸入法作為生態(tài)補(bǔ)充的角色,并沒有投入全部資源去做極致的AI體驗(yàn)。微信輸入法的關(guān)聯(lián)更多是輔助社交場景的簡單功能,像輸入關(guān)鍵詞關(guān)聯(lián)表情包、小程序等,在深度語義聯(lián)想、專業(yè)內(nèi)容輔助上稍顯不足。
微信輸入法發(fā)布于2022年,2024年6月它就推出了接入騰訊混元大模型的首個(gè)AI版本,2025年1月更是迭代到了4.0版本??墒窃趯?shí)際產(chǎn)品的體驗(yàn)過程中,微信輸入法的AI能力,展現(xiàn)得相當(dāng)克制。
B
這不是字節(jié)第一次對微信發(fā)起挑戰(zhàn)。
早在2019年,字節(jié)就推出獨(dú)立社交產(chǎn)品多閃,主打視頻社交,以“隨拍”等功能對標(biāo)微信朋友圈,發(fā)起對微信社交版圖的首次高調(diào)挑戰(zhàn)。
2025 年多閃更是密集迭代31次,升級為專注即時(shí)通訊的“抖音聊天版”并登頂應(yīng)用商店社交榜,再次以生態(tài)協(xié)同的方式與微信形成競爭。
隨著AI時(shí)代到來,豆包成為字節(jié)挑戰(zhàn)微信的又一員大將。
2025年6月,豆包全量上線了AI播客功能。該功能最大的特點(diǎn)是真實(shí)感很強(qiáng),比如自然的停頓、“嗯” 這類附和語,甚至偶爾還會出現(xiàn)主持人口誤修正。
同時(shí),豆包AI播客的處理速度很快,8萬字的英文文檔播客只需要3秒就能完成轉(zhuǎn)換,且提供多音色選擇,還會自動(dòng)為播客配圖、生成進(jìn)度條和標(biāo)簽。
而且豆包AI播客具備實(shí)時(shí)交互和多輪追問能力。用戶收聽時(shí)可隨時(shí)中斷并提出問題,比如收聽行業(yè)報(bào)告類播客時(shí),追問市場規(guī)模預(yù)測邏輯,系統(tǒng)會結(jié)合文檔內(nèi)容給出針對性解答。
微信AI播客2025年8月開始灰度測試,僅在 “快訊” 板塊實(shí)行,功能比較基礎(chǔ)。生成男女主播對談形式的快訊播客,更偏向資訊播報(bào)的風(fēng)格,沒有真人播客中那種交互感。
豆包對微信發(fā)起的突襲,命中了微信的一些“槽點(diǎn)”。
就拿截圖功能來說,微信的截圖支持方框、圓圈等基礎(chǔ)標(biāo)注,也有文字提取和翻譯等常用能力,對于手機(jī)端的日常截圖場景來說足夠用了。但微信的截圖功能不包含任何AI能力。
豆包的截圖提問功能中,用戶在截圖完成后,可以讓豆包總結(jié)截圖的內(nèi)容,還可以對截圖內(nèi)容進(jìn)行追問、解答。
又比如,微信一大核心功能就是傳文件,但是微信的文件傳輸功能存在有效期限制,且無法對傳輸?shù)奈募M(jìn)行深度處理。
豆包則推出了AI云盤。這個(gè)功能不僅提供多設(shè)備文件同步和管理,更核心的是能對上傳的各類文檔、圖片進(jìn)行智能解析。
例如,用戶上傳一份項(xiàng)目策劃PDF,微信僅能讓接收方查看原文,而豆包可提取PDF中的核心目標(biāo),然后總結(jié)全文。
同時(shí)該云盤無普通文件有效期的困擾,用戶隨時(shí)可調(diào)用文件進(jìn)行二次解讀或編輯,這對于經(jīng)常需要處理各類文檔的職場人來說,比微信文件傳輸更可靠,分流了大量文件傳輸后的解析需求。
C
不過站在客觀的立場上,微信之所以顯得中規(guī)中矩,也有其深層原因。
微信作為一個(gè)承載了社交、支付、資訊、生活服務(wù)等功能的國民級應(yīng)用,它的任何變動(dòng)都需要評估廣泛影響。這種考量在無形中提高了創(chuàng)新的門檻和風(fēng)險(xiǎn)。
一個(gè)功能上線前,產(chǎn)品團(tuán)隊(duì)需要考慮技術(shù)可行性和用戶需求,對現(xiàn)有生態(tài)的影響、對不同用戶群體的適應(yīng)性、可能引發(fā)的輿論反應(yīng)。一個(gè)看似簡單的界面調(diào)整,可能會讓數(shù)千萬中老年用戶感到困惑;一個(gè)新功能的推出,可能會影響到數(shù)百萬小程序開發(fā)者的利益。
此前騰訊推出的ima就是個(gè)典型案例,其全稱為 “信息管理助手” 的縮寫,本質(zhì)是一款聚焦信息管理的 AI 工作平臺,核心功能圍繞知識管理、辦公協(xié)作、智能寫作等展開。
它的能力包括全網(wǎng)AI搜索、知識庫管理、AI 寫作輔助、錄音紀(jì)要、圖片解讀等,還推出了微信小程序,方便用戶在微信生態(tài)內(nèi)快速收藏公眾號文章等內(nèi)容到知識庫。
然而,ima作為主打知識庫的工具,卻存在創(chuàng)建文檔、表格等基礎(chǔ)操作入口難尋的問題,打開后多為空白界面。還有用戶反映,其宣傳語模糊,難以清晰理解產(chǎn)品價(jià)值,導(dǎo)致實(shí)際使用率較低。
這種情況的出現(xiàn),不是因?yàn)榧夹g(shù)不夠好,而是因?yàn)槲⑿诺挠脩艋鶖?shù)太大、使用場景太多樣化,任何功能都要遷就所有使用者,這就導(dǎo)致功能做到最后越來越臃腫,越來越復(fù)雜。
微信還背負(fù)著沉重的“技術(shù)債務(wù)”:多年的發(fā)展積累了海量的歷史數(shù)據(jù),需要兼容各個(gè)版本的功能,保證支付等金融功能的絕對穩(wěn)定。任何技術(shù)棧的升級都可能引發(fā)連鎖反應(yīng),影響到整個(gè)系統(tǒng)的穩(wěn)定性。
系統(tǒng)越龐大,改動(dòng)的風(fēng)險(xiǎn)就越高,一個(gè)小的bug可能影響數(shù)千萬用戶。所以微信的開發(fā)團(tuán)隊(duì)必須格外謹(jǐn)慎,每一行代碼的改動(dòng)都要經(jīng)過嚴(yán)格的測試和評審。
這種謹(jǐn)慎當(dāng)然是必要的,但也在客觀上限制了創(chuàng)新的速度。當(dāng)競爭對手快速迭代、大膽嘗試新功能時(shí),微信必須保持克制,優(yōu)先保證系統(tǒng)的穩(wěn)定運(yùn)行。
微信團(tuán)隊(duì)當(dāng)然知道哪些功能可以做得更好,哪些體驗(yàn)可以優(yōu)化,但他們必須考慮改動(dòng)的代價(jià)。一個(gè)新功能可能讓一部分用戶欣喜,但也可能讓另一部分用戶反感。一次界面調(diào)整可能提升了效率,但也可能增加了學(xué)習(xí)成本。這些都需要權(quán)衡和取舍。
微信的更新往往是溫和的、漸進(jìn)的,不會有激進(jìn)的變革。新功能的推出會經(jīng)過長時(shí)間的內(nèi)測以及灰度測試,確保足夠穩(wěn)定才會全量發(fā)布。即使發(fā)布后,也會保留舊版本的入口,給用戶適應(yīng)的時(shí)間。這種做法保證了穩(wěn)定,但也讓微信在創(chuàng)新速度上落后于挑戰(zhàn)者。
豆包作為挑戰(zhàn)者,情況完全不同。
它沒有需要兼容的歷史版本,沒有不能得罪的龐大用戶群體,沒有牽一發(fā)而動(dòng)全身的復(fù)雜生態(tài)。想要嘗試新功能,可以快速上線測試,效果不好就下線調(diào)整,不用擔(dān)心引發(fā)用戶流失或輿論危機(jī)。
這種靈活性讓豆包能夠敏捷地響應(yīng)市場變化。當(dāng)發(fā)現(xiàn)用戶對某個(gè)功能有強(qiáng)烈需求時(shí),可以在幾周內(nèi)完成開發(fā)和上線;當(dāng)競爭對手推出新功能時(shí),可以快速跟進(jìn)甚至做得更好。這種速度是微信難以匹敵的。
豆包求變,微信求不變。這不是能力的差距,而是角色和生存位的不同。挑戰(zhàn)者需要通過創(chuàng)新來打開市場,所以必須激進(jìn);守成者需要保護(hù)既有的優(yōu)勢,所以必須穩(wěn)健。
特別聲明:本文為合作媒體授權(quán)DoNews專欄轉(zhuǎn)載,文章版權(quán)歸原作者及原出處所有。文章系作者個(gè)人觀點(diǎn),不代表DoNews專欄的立場,轉(zhuǎn)載請聯(lián)系原作者及原出處獲取授權(quán)。(有任何疑問都請聯(lián)系idonews@donews.com)