2025年11月3日,以“前沿發(fā)明,引領(lǐng)智能躍遷”為主題的“2025百度十大科技前沿發(fā)明”發(fā)布會(huì)在北京召開。今年發(fā)布的前沿發(fā)明涵蓋大模型、深度學(xué)習(xí)框架、AI算力、智能體、AI搜索、數(shù)字人、無(wú)人駕駛等AI技術(shù)突破,展現(xiàn)百度AI應(yīng)用加速走向效果涌現(xiàn)背后的底層創(chuàng)新實(shí)力。北京市知識(shí)產(chǎn)權(quán)局黨組書記、局長(zhǎng)孟波,百度首席技術(shù)官(CTO)王海峰等出席發(fā)布活動(dòng)并致辭。
百度首席技術(shù)官王海峰表示,當(dāng)下人工智能已融入人們的生產(chǎn)生活,效果正在涌現(xiàn)。作為以技術(shù)立身的人工智能公司,百度始終站在AI創(chuàng)新前沿,人工智能全領(lǐng)域?qū)@B續(xù)7年排名國(guó)內(nèi)第一,生成式AI和大模型專利申請(qǐng)量中國(guó)第一、全球領(lǐng)先,深度學(xué)習(xí)專利申請(qǐng)量全球第一,高級(jí)別自動(dòng)駕駛專利族全球領(lǐng)先。百度重視通過(guò)專利保護(hù)自主創(chuàng)新成果,也致力于推動(dòng)成果轉(zhuǎn)化,為產(chǎn)業(yè),為社會(huì)創(chuàng)造價(jià)值,將AI的便利與價(jià)值帶給每一個(gè)人。

百度首席技術(shù)官王海峰
北京市知識(shí)產(chǎn)權(quán)局黨組書記、局長(zhǎng)孟波指出,保護(hù)知識(shí)產(chǎn)權(quán)就是保護(hù)創(chuàng)新,北京市知識(shí)產(chǎn)權(quán)局深入貫徹落實(shí)國(guó)家知識(shí)產(chǎn)權(quán)戰(zhàn)略,整合知識(shí)產(chǎn)權(quán)資源,不斷提升首都知識(shí)產(chǎn)權(quán)全環(huán)節(jié)改革力度、全鏈條保護(hù)能力、全領(lǐng)域服務(wù)水平,北京市展現(xiàn)出強(qiáng)勁的創(chuàng)新實(shí)力和活力。百度憑借人工智能專利申請(qǐng)布局和高活躍度的開源項(xiàng)目,展現(xiàn)了其在科技創(chuàng)新行業(yè)中的領(lǐng)先地位和對(duì)行業(yè)發(fā)展的引領(lǐng)擔(dān)當(dāng)。希望百度繼續(xù)加強(qiáng)科技創(chuàng)新,力爭(zhēng)推出更多原創(chuàng)性、顛覆性發(fā)明,持續(xù)走在全國(guó)乃至全球技術(shù)創(chuàng)新前列,助力北京在人工智能領(lǐng)域率先實(shí)現(xiàn)高水平科技自立自強(qiáng)。

北京市知識(shí)產(chǎn)權(quán)局黨組書記、局長(zhǎng)孟波
當(dāng)前,國(guó)家政策支持AI大模型廣泛應(yīng)用,深入實(shí)施“人工智能+”行動(dòng)方案,人工智能迎來(lái)爆發(fā)式發(fā)展階段,AI技術(shù)加速迭代,應(yīng)用加速落地效果涌現(xiàn)。百度持續(xù)自主創(chuàng)新,攻關(guān)人工智能關(guān)鍵核心技術(shù),積累自主知識(shí)產(chǎn)權(quán),以前沿創(chuàng)新引領(lǐng)產(chǎn)業(yè)的發(fā)展趨勢(shì)。
會(huì)上,百度專利事務(wù)部總經(jīng)理崔玲玲發(fā)布“2025百度十大科技前沿發(fā)明”并表示,今年發(fā)布的百度十大科技前沿發(fā)明,涵蓋了人工智能算力、框架、模型、場(chǎng)景應(yīng)用全棧技術(shù)體系。每一項(xiàng)成果,都代表著對(duì)技術(shù)邊界的勇敢突破,彰顯著百度在創(chuàng)新道路上的堅(jiān)定決心與不懈追求。這些前沿技術(shù)正匯聚成澎湃的 AI 勢(shì)能,驅(qū)動(dòng)著生產(chǎn)生活的智能化躍遷。未來(lái),百度將持續(xù)圍繞關(guān)鍵核心技術(shù)攻關(guān),積累自主知識(shí)產(chǎn)權(quán),加快專利的產(chǎn)業(yè)化進(jìn)程,賦能千行百業(yè),支撐高水平科技自立自強(qiáng)和高質(zhì)量發(fā)展。

百度專利事務(wù)部總經(jīng)理崔玲玲
據(jù)介紹,百度發(fā)布的2025十大科技前沿發(fā)明,包括“自回歸統(tǒng)一建模的原生多模態(tài)大模型”、“大模型訓(xùn)練全流程高效容錯(cuò)技術(shù)”、“劇本驅(qū)動(dòng)的高說(shuō)服力數(shù)字人技術(shù)“、“基于多智能體協(xié)同的AI搜索引擎”、“蒸汽機(jī)(文心專精)音視頻一體化生成大模型技術(shù)”、“從芯片到集群的跨層級(jí)訓(xùn)推一體AI基建系統(tǒng)性技術(shù)”、“兼容端到端軌跡方案的自動(dòng)駕駛橫縱聯(lián)合控制技術(shù)”、“信息流端到端內(nèi)容理解與序列生成技術(shù)”、“飛槳科學(xué)計(jì)算高效求解技術(shù)”、“基于智能體的自進(jìn)化應(yīng)用生成技術(shù)”。
這些前沿發(fā)明是AI行業(yè)新技術(shù)趨勢(shì)的重要反映,多模態(tài)、多智能體協(xié)同、大規(guī)模集群訓(xùn)練、高說(shuō)服數(shù)字人等均是今年最前沿的技術(shù)方向。如“大模型訓(xùn)練全流程高效容錯(cuò)技術(shù)”攻克集群訓(xùn)練中故障定位與召回恢復(fù)兩大關(guān)鍵難題,已成功應(yīng)用于文心大模型系列的高效穩(wěn)定訓(xùn)練,萬(wàn)卡集群任務(wù)訓(xùn)練有效率超98%,處于國(guó)際領(lǐng)先水平?!靶畔⒘鞫说蕉藘?nèi)容理解與序列生成技術(shù)”突破現(xiàn)有推薦系統(tǒng)中內(nèi)容理解與分發(fā)模型相互割裂的局限,構(gòu)建了“理解生成-分發(fā)反饋-再理解生成”的自增強(qiáng)閉環(huán),已推動(dòng)Feed業(yè)務(wù)大幅增長(zhǎng),并落地百度地圖、電商等眾多場(chǎng)景。據(jù)悉,該發(fā)明所在“心流”團(tuán)隊(duì)曾于9月獲得今年百度最高獎(jiǎng)。
十大科技前沿發(fā)明中,不少技術(shù)已支撐百度AI應(yīng)用實(shí)現(xiàn)效果涌現(xiàn)。“劇本驅(qū)動(dòng)的高說(shuō)服力數(shù)字人技術(shù)”,推動(dòng)數(shù)字人技術(shù)進(jìn)入高質(zhì)量、低成本、廣應(yīng)用的普惠時(shí)代,使數(shù)字人具備超擬真、高表現(xiàn)力、AI大腦自主決策、劇本智能創(chuàng)作等特性。該技術(shù)曾支撐近期爆火的羅永浩數(shù)字人直播首秀創(chuàng)下GMV5500萬(wàn)元行業(yè)紀(jì)錄;“兼容端到端軌跡方案的自動(dòng)駕駛橫縱聯(lián)合控制技術(shù)”支撐了Apollo領(lǐng)先的控制技術(shù)方案,大幅提升自動(dòng)駕駛車輛的安全性和乘坐舒適性,助力蘿卜快跑全球化落地。蘿卜快跑已累計(jì)提供超1400萬(wàn)次出行服務(wù),安全行駛里程超2億公里;“蒸汽機(jī)(文心專精)音視頻一體化生成大模型技術(shù)”支撐百度蒸汽機(jī)提供分鐘級(jí)優(yōu)質(zhì)畫質(zhì)與大師級(jí)運(yùn)鏡控制能力,同時(shí)大幅降低視頻生成成本,該技術(shù)已在搜索、文小言等業(yè)務(wù)采用,同時(shí)對(duì)外賦能,在影視創(chuàng)作、營(yíng)銷推廣等場(chǎng)景展現(xiàn)應(yīng)用潛力。
得益于十余年技術(shù)投入,百度在AI領(lǐng)域積累了豐碩創(chuàng)新成果。根據(jù)工信部電子知識(shí)產(chǎn)權(quán)中心、國(guó)家工業(yè)信息安全發(fā)展研究中心于2025年3月發(fā)布的《2024生成式人工智能全棧技術(shù)專利分析報(bào)告》,百度以大模型為核心的生成式人工智能專利申請(qǐng)量2950件、授權(quán)量1371件,領(lǐng)跑國(guó)內(nèi)創(chuàng)新主體。百度積極推進(jìn)人工智能的專利產(chǎn)業(yè)化,加速創(chuàng)新成果落地轉(zhuǎn)化,為產(chǎn)業(yè)創(chuàng)造價(jià)值。近期,百度建設(shè)的人工智能(大模型)產(chǎn)業(yè)知識(shí)產(chǎn)權(quán)運(yùn)營(yíng)中心入選國(guó)家知識(shí)產(chǎn)權(quán)局首批產(chǎn)業(yè)知識(shí)產(chǎn)權(quán)運(yùn)營(yíng)中心名單,代表百度AI大模型技術(shù)實(shí)力與知識(shí)產(chǎn)權(quán)能力獲雙重認(rèn)可。
據(jù)悉,以“效果涌現(xiàn)”為主題的百度世界2025將于11月13日在北京召開,百度將公布AI應(yīng)用、大模型、智能云、無(wú)人駕駛等業(yè)務(wù)的最新進(jìn)展。屆時(shí),不少“十大前沿發(fā)明”技術(shù)將在這些新發(fā)布中有更為具體的落地展示,同時(shí)也將見證這些前沿技術(shù)能力持續(xù)外溢后迎來(lái)效果涌現(xiàn)時(shí)刻。
百度2025十大科技前沿發(fā)明,具體如下:
1、自回歸統(tǒng)一建模的原生多模態(tài)大模型
本發(fā)明是新一代文心大模型的核心技術(shù),提出了業(yè)界首個(gè)能夠同時(shí)支持語(yǔ)言、圖像、視頻、音頻統(tǒng)一建模的多模態(tài)大模型技術(shù)框架,實(shí)現(xiàn)了多模態(tài)原生統(tǒng)一的融合建模,可同時(shí)支持任意模態(tài)的理解與生成;在此基礎(chǔ)上構(gòu)建了一種面向大模型的獎(jiǎng)勵(lì)系統(tǒng),為多環(huán)境多任務(wù)場(chǎng)景提供高質(zhì)量的強(qiáng)化學(xué)習(xí)獎(jiǎng)勵(lì)信號(hào)?;诒景l(fā)明的新一代文心大模型,在各模態(tài)任務(wù)上較上一代模型均有顯著提升,可支持更加廣泛的應(yīng)用場(chǎng)景,同時(shí)獎(jiǎng)勵(lì)系統(tǒng)顯著提升了并發(fā)能力并降低響應(yīng)時(shí)間,推動(dòng)大模型能力的持續(xù)快速進(jìn)化。
2、大模型訓(xùn)練全流程高效容錯(cuò)技術(shù)
本發(fā)明提出了大模型訓(xùn)練高效容錯(cuò)技術(shù),構(gòu)建了完備高效的軟硬件故障自動(dòng)召回定位恢復(fù)體系,創(chuàng)新性地提出基于大模型通信行為的全場(chǎng)景故障定位方法和零損失訓(xùn)練快照機(jī)制,攻克了集群訓(xùn)練中故障定位與召回恢復(fù)兩大關(guān)鍵難題。同時(shí),通過(guò)研制層次清晰、架構(gòu)合理的容錯(cuò)接入體系及全流程測(cè)試框架,在大模型訓(xùn)練過(guò)程中實(shí)現(xiàn)了高效部署與驗(yàn)證,顯著提升故障恢復(fù)效率,降低系統(tǒng)故障概率。該發(fā)明已成功應(yīng)用于文心大模型系列的高效穩(wěn)定訓(xùn)練,萬(wàn)卡集群任務(wù)的訓(xùn)練有效率超過(guò)98%,處于國(guó)際領(lǐng)先水平,顯著提升資源利用效率,加速模型訓(xùn)練迭代。
3、劇本驅(qū)動(dòng)的高說(shuō)服力數(shù)字人技術(shù)
本發(fā)明構(gòu)建了高說(shuō)服力數(shù)字人方案,依托數(shù)字人視頻生成大模型基座,設(shè)計(jì)了多模協(xié)同、高表現(xiàn)力、超長(zhǎng)時(shí)長(zhǎng)的數(shù)字人視頻生產(chǎn)方案,涵蓋可控視頻生成技術(shù)、超擬真唇形驅(qū)動(dòng)技術(shù)、劇本智能創(chuàng)作和AI大腦自主決策4個(gè)核心能力,突破大表情/大動(dòng)作、音容話一致、人-物-場(chǎng)復(fù)雜交互等一系列業(yè)界難題?;谠摪l(fā)明的技術(shù)創(chuàng)新,推動(dòng)數(shù)字人技術(shù)進(jìn)入高質(zhì)量、低成本、廣應(yīng)用的普惠時(shí)代,不僅使數(shù)字人表現(xiàn)超擬真,還具備了AI大腦,靈活調(diào)度助播、場(chǎng)控、運(yùn)營(yíng)等角色共同促進(jìn)轉(zhuǎn)化,真正實(shí)現(xiàn)了一個(gè)人就是一個(gè)營(yíng)銷團(tuán)隊(duì)?;谠摷夹g(shù)打造的羅永浩數(shù)字人直播間,成為業(yè)界首個(gè)雙數(shù)字人互動(dòng)的直播,單場(chǎng)GMV超過(guò)5500萬(wàn)元,后驗(yàn)數(shù)據(jù)全面超真人。
4、基于多智能體協(xié)同的AI搜索引擎
該發(fā)明創(chuàng)新性地提出了一種AI搜索引擎技術(shù),其核心框架 DeepSearch 以Master-Planner–Executor-Generator 四層智能體體系為技術(shù)底座,模擬人類信息處理的 “感知–規(guī)劃–執(zhí)行–生成”全流程,動(dòng)態(tài)適配從單輪事實(shí)查詢到復(fù)雜多階段推理的全場(chǎng)景需求。AI搜索引擎,系統(tǒng)地融合顯式任務(wù)規(guī)劃、動(dòng)態(tài)工具調(diào)用與實(shí)時(shí)反思機(jī)制,為新一代智能搜索提供了核心技術(shù)支撐。該發(fā)明已在百度文心助手中全流量落地,支撐文心助手復(fù)雜問(wèn)題拆解、富媒體呈現(xiàn)、MCP調(diào)用、個(gè)性化滿足、深度研究等多項(xiàng)關(guān)鍵能力,顯著提升日活躍用戶和用戶留存;同時(shí),該AI搜索引擎能力已對(duì)外開放賦能廣大合作伙伴。
5、蒸汽機(jī)(文心專精)音視頻一體化生成大模型技術(shù)
本發(fā)明是全球首個(gè)中文音視頻一體化生成模型,通過(guò)多模態(tài)信息的精準(zhǔn)同步與自然交互,支持分鐘級(jí)多人有聲音視頻生成與交互;該發(fā)明由自回歸擴(kuò)散建模、有聲一體化訓(xùn)練、高性能訓(xùn)推優(yōu)化三大技術(shù)核心構(gòu)成;通過(guò)極致的中文場(chǎng)景高質(zhì)量數(shù)據(jù)清洗與結(jié)構(gòu)化描述、訓(xùn)推一致性優(yōu)化,調(diào)教支持長(zhǎng)視頻生成基座;搭載首創(chuàng)的Latent Multi Modal Planner技術(shù)重構(gòu)生成邏輯,實(shí)現(xiàn)視頻的全流程有聲一體化生成;極致工程優(yōu)化突破傳統(tǒng)擴(kuò)散模型限制,壓縮視頻成本,滿足生成實(shí)時(shí)交互。該發(fā)明提供分鐘級(jí)優(yōu)質(zhì)畫質(zhì)與大師級(jí)運(yùn)鏡控制,大幅降低影視創(chuàng)作、營(yíng)銷推廣等場(chǎng)景的制作成本,提升效率。相關(guān)技術(shù)對(duì)內(nèi)賦能商業(yè)內(nèi)容生產(chǎn)、搜索妙筆、內(nèi)容生態(tài)、feed短篇、文小言、AI助手等業(yè)務(wù),推動(dòng)百度AI視頻生態(tài)繁榮;對(duì)外憑借其長(zhǎng)視頻實(shí)時(shí)交互生成能力,將AI視頻從“單向生成”引入“雙向共創(chuàng)”新階段,引領(lǐng)視頻生成領(lǐng)域創(chuàng)新方向。
6、從芯片到集群的跨層級(jí)訓(xùn)推一體AI基建系統(tǒng)性技術(shù)
本發(fā)明提出了從芯片到集群的跨層級(jí)協(xié)同優(yōu)化、訓(xùn)推一體的 AI 基建系統(tǒng)性創(chuàng)新技術(shù),計(jì)算架構(gòu)上,首創(chuàng) UltraServer 柜級(jí)超節(jié)點(diǎn),兼容多卡;自研 XPU Link與PD分離架構(gòu),全棧優(yōu)化軟硬件協(xié)同;存儲(chǔ)系統(tǒng)上,自適應(yīng)元數(shù)據(jù)架構(gòu)突破大規(guī)模管理瓶頸,專屬KV Cache加速方案適配 AI業(yè)務(wù);網(wǎng)絡(luò)技術(shù)上,推理專屬 2 跳可達(dá)架構(gòu)+彈性 eRDMA,構(gòu)建低時(shí)延傳輸通道;云原生能力上,全鏈路智能運(yùn)維(異常自感知/診斷/恢復(fù)),AI網(wǎng)關(guān)增LLM智能路由?;诒景l(fā)明成功構(gòu)建起完備的AI基礎(chǔ)設(shè)施技術(shù)體系,在計(jì)算方面,XPU Link帶寬提升8倍,MoE單節(jié)點(diǎn)性能提升5-10倍;PD分離使 Decode/Prefill階段的整體性能預(yù)計(jì)可分別提升95%和36%;在存儲(chǔ)方面,支持千億級(jí)文件,空間利用率超90%;網(wǎng)絡(luò)時(shí)延壓至4微秒;實(shí)現(xiàn)5000節(jié)點(diǎn)集群分鐘級(jí)故障自愈。
7、兼容端到端軌跡方案的自動(dòng)駕駛橫縱聯(lián)合控制技術(shù)
本發(fā)明提出了一種可兼容端到端軌跡方案的自動(dòng)駕駛橫縱聯(lián)合控制技術(shù),基于車輛的橫縱耦合動(dòng)力學(xué),設(shè)計(jì)線性時(shí)變模型預(yù)測(cè)控制器,實(shí)現(xiàn)車輛運(yùn)動(dòng)的橫、縱向聯(lián)合協(xié)同控制,模型假設(shè)近似更少,對(duì)上游數(shù)據(jù)依賴更少,橫縱向指令更加穩(wěn)定,實(shí)現(xiàn)對(duì)傳統(tǒng)方案的升級(jí)和超越。該發(fā)明可完美適配Apollo ADFM的端到端上游軌跡方案,大幅提升安全性和乘坐舒適性,對(duì)于低速橫向晃動(dòng)幅度可優(yōu)化70%,100%消除彎道橫向抽動(dòng)的控制問(wèn)題,使自動(dòng)駕駛車輛的動(dòng)態(tài)響應(yīng)更加接近經(jīng)驗(yàn)豐富的駕駛員的操作習(xí)慣,實(shí)現(xiàn)了真正意義上的擬人化控制,保證了Apollo控制技術(shù)的領(lǐng)先,有效支撐蘿卜快跑全球化戰(zhàn)略,助力蘿卜快跑駛?cè)胂愀?、迪拜、阿布扎比等全?6座城市,截止8月,蘿卜快跑累計(jì)提供超1400萬(wàn)次服務(wù),安全行駛里程超2億公里。
8、信息流端到端內(nèi)容理解與序列生成技術(shù)
本發(fā)明突破了現(xiàn)有推薦系統(tǒng)中內(nèi)容理解與分發(fā)模型相互割裂的局限,首創(chuàng)端到端多模態(tài)內(nèi)容理解與序列生成技術(shù),構(gòu)建了“理解生成-分發(fā)反饋-再理解生成”的自增強(qiáng)閉環(huán)。通過(guò)全新的多模態(tài)語(yǔ)義對(duì)齊和動(dòng)態(tài)Token統(tǒng)一量化技術(shù),融合用戶快慢反饋,將多模態(tài)知識(shí)對(duì)齊與生成式行為建模深度融合,實(shí)現(xiàn)Feed信息流系統(tǒng)從記憶檢索,邁向深度理解生成推理的新階段。該發(fā)明已應(yīng)用于信息流推薦業(yè)務(wù),完成了生成式信息流系統(tǒng)重構(gòu),全面提升了對(duì)內(nèi)容資源的多模態(tài)理解能力與個(gè)性化生成效果,大幅推動(dòng)Feed業(yè)務(wù)增長(zhǎng);并落地百度地圖、電商、搜索等眾多場(chǎng)景。
9、飛槳科學(xué)計(jì)算高效求解技術(shù)
本發(fā)明基于飛槳的科學(xué)計(jì)算核心技術(shù),通過(guò)組合算子拆分、高階自動(dòng)微分、符號(hào)表達(dá)式的推理和神經(jīng)網(wǎng)絡(luò)編譯器技術(shù),實(shí)現(xiàn)了微分方程的高效求解,解決了科學(xué)計(jì)算場(chǎng)景高階微分方程求解的難題。本發(fā)明的微分方程求解速度較傳統(tǒng)方法提升2到4個(gè)數(shù)量級(jí),比PyTorch提速115%,被國(guó)際知名微分方程求解庫(kù)DeepXDE唯一推薦;已在飛槳框架中實(shí)現(xiàn),集成于PaddleScience、PaddleCFD等產(chǎn)品,并實(shí)現(xiàn)產(chǎn)業(yè)化應(yīng)用。本發(fā)明技術(shù)支持中科院力學(xué)所、大氣物理所、蘇州實(shí)驗(yàn)室等近20所高校與科研機(jī)構(gòu)協(xié)同創(chuàng)新,應(yīng)用于上海交通大學(xué)支撐其“AI for Science”科學(xué)數(shù)據(jù)開源開放平臺(tái)建設(shè);應(yīng)用于中車集團(tuán)“斫輪”大模型,研制出空氣動(dòng)力學(xué)仿真大模型“斫輪·風(fēng)馳”,加速科學(xué)計(jì)算領(lǐng)域的創(chuàng)新發(fā)展。
10、基于智能體的自進(jìn)化應(yīng)用生成技術(shù)
本發(fā)明以大模型與強(qiáng)化學(xué)習(xí)為核心,構(gòu)建了由“需求模型、代碼模型、創(chuàng)意模型”組成的三重自進(jìn)化學(xué)習(xí)架構(gòu),通過(guò)自然語(yǔ)言理解用戶需求,經(jīng)由代碼模型實(shí)現(xiàn)高質(zhì)量代碼生成,并在用戶反饋與強(qiáng)化學(xué)習(xí)機(jī)制下形成持續(xù)優(yōu)化的數(shù)據(jù)飛輪?;谠摪l(fā)明技術(shù)的系統(tǒng)不僅能執(zhí)行代碼生成任務(wù),更能在實(shí)踐中自我學(xué)習(xí)、逐步提升智能水平,真正實(shí)現(xiàn)“越用越聰明”的AI開發(fā)助手;其多模型協(xié)同機(jī)制與端到端軌跡學(xué)習(xí)技術(shù),打破了傳統(tǒng)無(wú)代碼平臺(tái)的靜態(tài)瓶頸,形成可持續(xù)演化的智能體編程體系。單應(yīng)用從開發(fā)到上線,由傳統(tǒng)的大約4人周、2萬(wàn)元縮減到小于1小時(shí)、低于50元,純無(wú)代碼生成應(yīng)用已達(dá)到38萬(wàn)。