“激活一臺(tái)手機(jī),第一步竟然是登錄豆包?!?/p>
這并非想象的場(chǎng)景,而是體驗(yàn)的豆包手機(jī)助手時(shí)的真實(shí)一幕。作為技術(shù)預(yù)覽版的首批體驗(yàn)用戶,直面AI還體驗(yàn)了其在啟用權(quán)限、交互方式以及端側(cè)集成上的初步形態(tài)。
豆包,這個(gè)中國(guó)用戶并不陌生的名字,這一次在字節(jié)與中興合作的工作樣機(jī)Nubia M153上,以“手機(jī)原生AI助手”的身份登臺(tái)亮相。
手持這臺(tái)技術(shù)驗(yàn)證機(jī),你可以通過(guò)語(yǔ)音、側(cè)邊AI鍵或者Ola Friend耳機(jī)喚醒豆包,在任何界面就當(dāng)前屏幕內(nèi)容發(fā)問(wèn)。或者直接讓它代替你,在其他App里完成比價(jià)下單、整理日程、生成紀(jì)要等復(fù)雜任務(wù)。
中興官方頁(yè)面顯示,這款工程機(jī)僅向行業(yè)體驗(yàn)者開(kāi)放預(yù)約。在二手市場(chǎng)上,它已出現(xiàn)溢價(jià)銷(xiāo)售的情況。
打造手機(jī)助手,是字節(jié)跳動(dòng)AI業(yè)務(wù)邊界的又一次外擴(kuò)。過(guò)去幾年,豆包已經(jīng)在“云端”證明了自己:據(jù)火山引擎方面公開(kāi)披露,豆包大模型日均Token調(diào)用量從2024年5月的1200億漲到2025年9月的30萬(wàn)億。
此外,豆包在原生AI App中長(zhǎng)期位居用戶規(guī)模第一。現(xiàn)在,它跨過(guò)App的邊界正式“搬進(jìn)手機(jī)”。
近年來(lái),“原生AI手機(jī)助手”成為行業(yè)內(nèi)的共同迭代方向,但真正能跑通復(fù)雜鏈路的產(chǎn)品并不多。蘋(píng)果宣布為Siri引入生成式AI能力,卻接連推遲關(guān)鍵升級(jí)節(jié)點(diǎn);其他廠商的AI助手受限于權(quán)限與模型能力,對(duì)于跨App交互等復(fù)雜場(chǎng)景仍未能普遍落地。
在這樣的背景下,字節(jié)與中興的合作的意義不言自明:把豆包AI強(qiáng)大的模型能力,從App生態(tài)中推向真正的手機(jī)隨身入口。
對(duì)手機(jī)產(chǎn)業(yè)而言,這像是打開(kāi)了手機(jī)原生AI的“魔盒”:當(dāng)?shù)谝慌_(tái)設(shè)備跑通了整套能力,接下來(lái)的比拼,就不再是有沒(méi)有AI,而是誰(shuí)的AI真正“能用”。
01
除了側(cè)鍵能直接呼出豆包,在這臺(tái)技術(shù)驗(yàn)證機(jī)的背面,攝像頭模組旁刻著一行小字:Powered By Doubao(由豆包驅(qū)動(dòng))。一個(gè)小彩蛋,道出了這臺(tái)手機(jī)“機(jī)魂”的與眾不同。
真“原生”,是上手使用豆包手機(jī)助手的第一感覺(jué):激活新機(jī)時(shí),在系統(tǒng)設(shè)置環(huán)節(jié)首先要登錄用戶的豆包賬戶。隨后系統(tǒng)提示,你可以通過(guò)手機(jī)側(cè)邊鍵一鍵觸發(fā)豆包AI,提醒你這里的“豆包”,相比單獨(dú)使用豆包App,有著完全不同的操作邏輯。
這樣的原生感,是字節(jié)和中興本次深度合作的結(jié)果——在操作系統(tǒng)層面為豆包App做了一輪“底層改造”。在這臺(tái)Nubia M153上,豆包AI能力落地場(chǎng)景也更貼近日常生活。比如,豆包可以幫你在社交軟件等App里回復(fù)消息,如果你告訴它對(duì)方的身份,豆包還能幫助你編輯更合適的對(duì)話風(fēng)格和語(yǔ)氣。
要實(shí)現(xiàn)這樣的能力,一邊是大模型對(duì)復(fù)雜語(yǔ)言與上下文的理解,另一邊則是手機(jī)廠商在底層生態(tài)上向AI進(jìn)一步開(kāi)發(fā)。理解指令后,豆包可以模擬/替代用戶完成點(diǎn)擊、輸入等操作。在國(guó)內(nèi)廠商的原生AI助手方案里,這無(wú)疑是一種新鮮的嘗試。
從用戶視角來(lái)看,這種交互邏輯也難免會(huì)觸發(fā)一個(gè)新問(wèn)題——讓一個(gè)第三方大模型“代替你點(diǎn)擊屏幕”這件事,到底安不安全?
為了解釋這種“原生AI助手”背后的安全邏輯,豆包在官網(wǎng)發(fā)布了《隱私安全白皮書(shū)》,明確記憶數(shù)據(jù)優(yōu)先本地處理并加密存儲(chǔ),不用于模型訓(xùn)練;所有敏感調(diào)用需用戶授權(quán)并保持可見(jiàn)。喚起記憶時(shí),狀態(tài)欄有常駐提示,用戶可隨時(shí)關(guān)閉或清除記憶功能。
針對(duì)網(wǎng)友關(guān)心的權(quán)限、隱私問(wèn)題,豆包手機(jī)助手3日晚發(fā)布聲明做了進(jìn)一步的回應(yīng)。聲明中提到,豆包手機(jī)助手使用的 INJECT_EVENTS(模擬點(diǎn)擊)系統(tǒng)權(quán)限為安卓官方能力,所有跨應(yīng)用執(zhí)行任務(wù)的 AI 助手均需依賴類(lèi)似權(quán)限。
豆包手機(jī)助手在使用該權(quán)限時(shí),建立了透明的管理體系,調(diào)用必須經(jīng)用戶主動(dòng)授權(quán);執(zhí)行長(zhǎng)任務(wù)時(shí)有明確提示且隨時(shí)可以中斷;涉及支付、身份驗(yàn)證等敏感環(huán)節(jié)時(shí)任務(wù)會(huì)暫停,由用戶手動(dòng)確認(rèn),豆包手機(jī)助手不會(huì)代替用戶進(jìn)行相關(guān)授權(quán)和敏感操作。
從實(shí)際體驗(yàn)看,“真原生”的差異首先體現(xiàn)在喚醒方式和系統(tǒng)權(quán)限上。用戶可以通過(guò)側(cè)邊AI鍵、語(yǔ)音,或者Ola Friend耳機(jī)直接喚醒豆包,在任何界面直接就屏幕內(nèi)容追問(wèn)——不管是聊天界面、商品詳情頁(yè)還是票務(wù)頁(yè)面,都可以一鍵截屏給AI理解,而不是復(fù)制鏈接、截屏上傳。
此外,豆包手機(jī)助手打通了相冊(cè)和一部分系統(tǒng)能力,例如在原生相冊(cè)里對(duì)圖片下達(dá)“刪掉路人”“清理雜物”這樣的修圖指令,可以直接觸發(fā)豆包的多模態(tài)能力。
直面AI還測(cè)試了訂票、打車(chē)等多個(gè)日常場(chǎng)景:在明確需求后,豆包手機(jī)助手可以自行完成所有前置流程,直到支付這樣的敏感環(huán)節(jié),才會(huì)提醒用戶需要手動(dòng)介入。
這種“半自動(dòng)”的交互模式帶著一點(diǎn)折中意味,但也是大模型在端側(cè)落地、面向普通用戶時(shí)不得不考慮的安全邊界:既要讓AI真正“替你做事”,但要把最終的所有權(quán)留給用戶。
不過(guò),站在即將跨入2026年的時(shí)間節(jié)點(diǎn)回看,用戶對(duì)手機(jī)AI的期待,正在從“能聊天”迅速走向“能辦事”。QuestMobile的報(bào)告顯示,自2024年9月以來(lái),六大手機(jī)廠商的AI助手在過(guò)去一年合計(jì)新增用戶約6500萬(wàn),總規(guī)模達(dá)到5.29億。
目前,NubiaM153上的豆包手機(jī)助手只是一個(gè)技術(shù)預(yù)覽版,主要面向行業(yè)用戶開(kāi)放,并未正式進(jìn)入大眾消費(fèi)市場(chǎng)。但從這臺(tái)工程機(jī)上,已經(jīng)可以窺探到手機(jī)“真原生AI”路徑的樣貌。
02
在體驗(yàn)過(guò)程中,一個(gè)最直觀的感受是:相比獨(dú)立App里的豆包,Nubia M153上的豆包已經(jīng)不再是一個(gè)“會(huì)回答問(wèn)題”的AI,而是一個(gè)可以跨界到物理世界、真正替用戶完成動(dòng)作的“執(zhí)行者”。在理解用戶指令的基礎(chǔ)上,它在手機(jī)上一層一層地接管了,那些過(guò)去屬于人類(lèi)手指的繁瑣操作。
以跨App多輪任務(wù)鏈路為例,針對(duì)相冊(cè)中的某張血壓儀照片,讓豆包在淘寶中“挑便宜同款”,然后“把這件鏈接發(fā)給張三”,豆包不僅能維持上下文記憶,識(shí)別出“張三”是QQ中的好友昵稱,還能跟隨鏈路推進(jìn)完成全部步驟。從相冊(cè)到淘寶,再到QQ好友“張三”的對(duì)話框,這一流程全程由豆包自行跑通,無(wú)需用戶中途干預(yù)。
與之相比,我們用同樣路徑測(cè)試另一家旗艦手機(jī)的AI助手,它停在了“打開(kāi)淘寶—完成搜索”的環(huán)節(jié),只能等待用戶的進(jìn)一步操作。
這種差距在屏幕理解場(chǎng)景中被進(jìn)一步放大。在實(shí)際測(cè)試?yán)铮拱梢栽谌魏谓缑嫱ㄟ^(guò)“就屏提問(wèn)”,自動(dòng)截取當(dāng)前頁(yè)面、分析內(nèi)容并執(zhí)行命令——從總結(jié)一篇6000字的長(zhǎng)文,到提取要點(diǎn)、排序邏輯,再到將某一段落總結(jié)發(fā)送給飛書(shū)群同事。盡管這個(gè)過(guò)程需要在后臺(tái)等待一段時(shí)間,但它已經(jīng)做到了真正意義上的“脫手可用”。
當(dāng)用戶真正把豆包當(dāng)作“代辦者”時(shí),它不僅能在助手層面完成流程交互,還能把AI的多模態(tài)能力滲透進(jìn)日常操作。比如,豆包可以在相冊(cè)中對(duì)指定圖片直接進(jìn)行“AI P圖”,這一過(guò)程以往需要手動(dòng)打開(kāi)對(duì)應(yīng)App。而原生豆包AI可以直接調(diào)用Seedream能力,完成“把這張雪碧圖片P成可樂(lè)”的操作。
在社交場(chǎng)景里,這種“可介入性”表現(xiàn)得更明顯。例如,你想給某位飛書(shū)好友發(fā)送信息“明天我想請(qǐng)個(gè)假”,當(dāng)你告知豆包對(duì)方身份是“老板”時(shí),豆包能識(shí)別這一語(yǔ)境中隱藏的意圖,提示你措辭可以更禮貌、更正式一點(diǎn),并提供調(diào)整后的版本。這種“介入對(duì)話”的能力,把助手的角色從“工具”變得更像“副駕駛”,能夠在用戶需求表達(dá)尚不完整時(shí),及時(shí)響應(yīng)并自動(dòng)推斷下一步動(dòng)作。
陌生來(lái)電識(shí)別也是類(lèi)似的邏輯。詢問(wèn)豆包“剛才給我打電話的是誰(shuí)”,豆包可以結(jié)合歸屬地、歷史舉報(bào)記錄及模型推斷給出風(fēng)險(xiǎn)提示,告訴用戶是否存在詐騙可能。
在多語(yǔ)言表達(dá)方面,豆包手機(jī)助手可以承擔(dān)翻譯、對(duì)話轉(zhuǎn)寫(xiě)、跨語(yǔ)言(包括方言)任務(wù)等工作。實(shí)機(jī)測(cè)試中,和豆包App此前展現(xiàn)出的能力類(lèi)似,當(dāng)用戶突然使用廣東話給出指令時(shí),豆包手機(jī)助手可以平滑切換到對(duì)應(yīng)方言場(chǎng)景,把一個(gè)普通話“知心姐姐”,變成會(huì)講粵語(yǔ)的“靚女”。
正因如此,豆包手機(jī)助手填補(bǔ)了當(dāng)下行業(yè)最稀缺的一塊能力空白:全局跨應(yīng)用任務(wù)執(zhí)行。蘋(píng)果Siri仍在修修補(bǔ)補(bǔ),未能實(shí)現(xiàn)產(chǎn)品迭代;大多數(shù)手機(jī)AI助手要么擅長(zhǎng)回答,要么擅長(zhǎng)展示,卻無(wú)法替用戶完成一整條鏈路。
豆包手機(jī)助手的出現(xiàn),讓這條路徑第一次有了清晰的樣子:用戶說(shuō)一句話,從理解、決策到執(zhí)行,原本需要用戶手動(dòng)在App間來(lái)回切換完成的機(jī)械勞動(dòng),如今開(kāi)始一點(diǎn)點(diǎn)交給豆包來(lái)跑。
而要撐起一場(chǎng)手機(jī)AI的“新世代”,不僅需要系統(tǒng)足夠開(kāi)放,也需要基座模型的強(qiáng)大能力賦能,技術(shù)的底座和生態(tài)的兼容,二者缺一不可。
03
在豆包上手機(jī)之前,字節(jié)已經(jīng)用了三年時(shí)間不斷打磨這個(gè)“AI小助手”,讓它從一個(gè)LLM產(chǎn)品,進(jìn)化成一個(gè)原生AI超級(jí)App。
QuestMobile、IDC等機(jī)構(gòu)的數(shù)據(jù)顯示:豆包是中國(guó)C端用戶規(guī)模最大的原生AI應(yīng)用,2024年中月活突破1.5億。2025年初,DeepSeek的橫空出世曾短暫刷新流量峰值,但從今年8月開(kāi)始,豆包重新完成反超,依靠強(qiáng)大的生態(tài)優(yōu)勢(shì)穩(wěn)居榜首。
不過(guò),對(duì)于大眾用戶來(lái)說(shuō),“好用的AI應(yīng)用”和“真正的手機(jī)助手”之間始終隔著一道物理層面的鴻溝。
再?gòu)?qiáng)的模型能力,如果被限制在App框架內(nèi),就無(wú)法接管用戶的真實(shí)數(shù)字生活。你可以在豆包App里寫(xiě)文案、改圖片、做視頻,但只要涉及外賣(mài)、改地址、查物流、訂火車(chē)票,這些操作都必須跳回到對(duì)應(yīng)的App中完成,AI在其中所能扮演的角色依然有限。
與此同時(shí),2025年,各大手機(jī)廠商紛紛將端側(cè)AI推上戰(zhàn)略高度。華為小藝推出“全局語(yǔ)音調(diào)度”,支持部分跨應(yīng)用任務(wù)鏈;小米澎湃OS宣布開(kāi)放系統(tǒng)級(jí)AI接口,可在多個(gè)場(chǎng)景中調(diào)用大模型執(zhí)行代理任務(wù);Vivo、OPPO、榮耀也分別展示了原生AI智能體路徑。
一個(gè)不容忽視的趨勢(shì)是:所有廠商都意識(shí)到,只有把模型能力前置,讓用戶在任何界面、任何動(dòng)作鏈路中隨時(shí)調(diào)用AI,手機(jī)助手這件事才算真正開(kāi)始。這一年,AI在手機(jī)上的競(jìng)爭(zhēng),比的不再是“誰(shuí)的模型更大”,而是“誰(shuí)能真正跑在用戶需求的最前端”。
在NubiaM153上,豆包手機(jī)助手的姿態(tài)顯得十分“前衛(wèi)”。在原生AI助手的加持下,手機(jī)里的各個(gè)App被重新組織成一個(gè)由AI統(tǒng)籌的“任務(wù)空間”。
在這個(gè)空間里,用戶只負(fù)責(zé)提目標(biāo),豆包負(fù)責(zé)“跑腿”。過(guò)去需要手動(dòng)跳轉(zhuǎn)多個(gè)App才能完成的鏈路,如今只需要用戶給出一句指令;如果再配上已經(jīng)適配的AI可穿戴硬件,比如OlaFriend,很多場(chǎng)景甚至不需要掏出手機(jī)——耳機(jī)里那聲“豆包豆包”,另一邊的手機(jī)后臺(tái)已經(jīng)開(kāi)始忙碌起來(lái)。
這種AI時(shí)代的“脫手感”,正在改寫(xiě)用戶與手機(jī)的關(guān)系:從App時(shí)代的“我有需求時(shí)點(diǎn)開(kāi)你”,到AI助手時(shí)代的“你隨時(shí)站在我旁邊”。對(duì)豆包而言,這是一次從云端走向端側(cè)的關(guān)鍵躍遷;對(duì)手機(jī)而言,則是一次從“應(yīng)用集合”走向“AI中樞”的角色變化。
根據(jù)Counterpoint的預(yù)測(cè),到2028年,Gen-AI智能手機(jī)的出貨量將占全球智能手機(jī)銷(xiāo)量的54%以上,屆時(shí)相關(guān)設(shè)備存量可能超過(guò)10億部,成為市場(chǎng)的主流配置。
與此同時(shí),QuestMobile的數(shù)據(jù)表明,截至2025年9月,移動(dòng)端AI應(yīng)用(包括原生App、In-AppAI、手機(jī)廠商AI助手在內(nèi))的月活用戶總規(guī)模已達(dá)7.29億,僅手機(jī)廠商/系統(tǒng)級(jí)AI助手這一類(lèi),就覆蓋約5.35億用戶,表明越來(lái)越多用戶開(kāi)始將AI助手視為“手機(jī)的基本功能”。
硬件側(cè)也在同步加碼。Counterpoint此前發(fā)布的產(chǎn)業(yè)白皮書(shū)顯示,面向生成式AI的手機(jī)SoC正在加速演進(jìn),旗艦平臺(tái)的峰值A(chǔ)I算力在2025年將普遍跨過(guò)60TOPS這一性能臺(tái)階。
公開(kāi)信息顯示,Nubia M153工程機(jī)所采用的高通驍龍8至尊版平臺(tái),NPU峰值A(chǔ)I算力已達(dá)到約80TOPS。算力與能效的雙向抬升,為“原生AI助手”釋放更復(fù)雜的能力提供了充分硬件冗余。
把視角再拉遠(yuǎn)一點(diǎn),會(huì)看到一條更長(zhǎng)的時(shí)間線:2011年,Siri作為“第一代手機(jī)語(yǔ)音助手”,曾經(jīng)給整個(gè)行業(yè)演示過(guò)“對(duì)著手機(jī)說(shuō)話”的想象。但十多年后,蘋(píng)果內(nèi)部對(duì)GenAI路線的不一致,導(dǎo)致Siri重構(gòu)歷程充滿了混亂與不穩(wěn)定,即使披上AppleIntelligence的外衣,在短期內(nèi)仍難支撐起“跨應(yīng)用、多模態(tài)、代辦任務(wù)”的理想。
蘋(píng)果軟件工程高級(jí)副總裁費(fèi)德里奇此前公開(kāi)承認(rèn),Siri重構(gòu)的V2架構(gòu)只在大約三分之二的場(chǎng)景下能正確執(zhí)行,新的Siri版本從2024年底一路推遲到2026年才有望正式上線。
從這個(gè)意義上說(shuō),豆包手機(jī)助手在Nubia M153上完成的,不只是一次產(chǎn)品形態(tài)的探索,而是試圖接力那條被Siri開(kāi)啟、卻沒(méi)有跑完的賽道。
盡管還在技術(shù)驗(yàn)證階段,但一個(gè)構(gòu)想已經(jīng)悄然成型:豆包用一次原生AI入口的試驗(yàn),正在一點(diǎn)點(diǎn)實(shí)現(xiàn)那件Siri沒(méi)做成的事。
特別聲明:本文為合作媒體授權(quán)DoNews專欄轉(zhuǎn)載,文章版權(quán)歸原作者及原出處所有。文章系作者個(gè)人觀點(diǎn),不代表DoNews專欄的立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者及原出處獲取授權(quán)。(有任何疑問(wèn)都請(qǐng)聯(lián)系idonews@donews.com)