5月17日,在騰訊云生成式AI產業(yè)應用峰會上,騰訊云副總裁、騰訊云智能負責人吳運聲發(fā)表了題為《打造大模型時代原生工具鏈,助力客戶低門檻、一站式打造AI原生應用》的主題演講。
吳運聲指出,隨著大模型技術的快速發(fā)展,人工智能已成為企業(yè)數字化轉型的核心動力。Gartner的調研顯示,超過60%的中國企業(yè)計劃在未來12至24個月內部署生成式AI,反映出企業(yè)對大模型技術的迫切需求。
面對企業(yè)在應用大模型技術時所需的降低使用門檻、提高平臺適配性、保障安全合規(guī)等核心訴求。騰訊云正式推出大模型知識引擎、圖像創(chuàng)作引擎、視頻創(chuàng)作引擎三大工具,旨在通過PaaS接入方式,簡化數據工程、模型精調、應用開發(fā)的流程,使企業(yè)能夠更高效、簡單地將大模型能力應用于生產、銷售和服務等場景。
吳運聲特別強調了大模型知識引擎在知識服務場景中的應用,該引擎基于大語言模型,解決了復雜文檔解析、任務規(guī)劃、行業(yè)適配等難題。通過應用模板簡化創(chuàng)建流程,企業(yè)用戶可以在5分鐘內搭建出一款知識應用,并通過一站式流程快速驗證、投產。此外,其還展示了大模型知識引擎在金融、教育、出行、零售等行業(yè)的落地案例,以及在騰訊內部知識管理領域的應用。
在圖像和視頻創(chuàng)作領域,騰訊云推出的圖像創(chuàng)作引擎和視頻創(chuàng)作引擎,基于自研混元模型,提供了文生圖、圖生圖、視頻轉譯、風格化等能力,大幅提高了創(chuàng)作與生產效率。
會上,騰訊混元大模型能力也持續(xù)升級,多個版本模型hunyuan-pro、hunyuan-standard、hunyuan-lite通過騰訊云對外開放,滿足企業(yè)客戶、開發(fā)者在不同場景下的模型需求,落地最優(yōu)性價比模型方案。
吳運聲表示,騰訊致力于開發(fā)更多專業(yè)、易用的工具,以降低大模型應用的門檻,讓更多人能夠享受到大模型技術帶來的便利。他期待這些工具能夠快速普及,為社會創(chuàng)造更大的價值。
?以下為吳運聲演講全文:
尊敬的各位嘉賓、媒體朋友們,大家好!
我是騰訊吳運聲,今天我分享的主題是《打造大模型時代原生工具鏈,助力客戶低門檻、一站式打造AI原生應用》。過去一年,大模型產業(yè)快速發(fā)展,以大模型技術為核心,人工智能成為企業(yè)數字化發(fā)展的關鍵動力。前不久,Gartner發(fā)布一份調研顯示,超過60%的中國企業(yè)計劃在未來12至24個月內部署生成式AI??梢钥吹剑髽I(yè)對應用大模型技術的迫切感。?
那么,如何將想法變?yōu)楝F實,幫助企業(yè)打破大模型技術落地障礙?在過去一年和廣大客戶的共創(chuàng)中,我們發(fā)現,要讓企業(yè)用上大模型,用好大模型,還需要解決三大挑戰(zhàn)。
第一,降低使用門檻。只有進一步降低工具使用門檻,減少對技術人才及專業(yè)技術能力依賴,讓一線生產、經營人員也能“零門檻”用上大模型,才能加速生產經驗與模型技術的融合,用技術為企業(yè)解決實際問題。
第二,提高平臺適配性。未來,企業(yè)生產場景都將建基于AI 能力,企業(yè)的產品設計、運營流程、管理形式都可能圍繞AI 重構。企業(yè)選擇的大模型工具,既要能匹配、適應不斷迭代的大模型技術,也需要滿足不斷擴大的場景需求,滿足可持續(xù)的投入產出比。
第三,保障安全合規(guī)。生成式AI具有強大的歸納、生成、推理能力,但也面臨全新的安全挑戰(zhàn)。只有保障生成結果的安全、準確,才能滿足企業(yè)對穩(wěn)定性的需求,讓企業(yè)管理者放心加大投入建設。
5分鐘搭建企業(yè)級大模型應用
應對上述挑戰(zhàn),需要打造一套大模型時代的原生工具鏈。為此,我們今天正式發(fā)布大模型知識引擎、圖像創(chuàng)作引擎、視頻創(chuàng)作引擎三大工具,通過PaaS接入大模型,實現數據工程、模型精調、應用開發(fā)的流程簡化,助力企業(yè)更高效、簡單地將大模型能力應用于生產、銷售和服務等場景。
首先,我們針對知識服務場景,推出大模型知識引擎。這是一款基于大語言模型的知識應用開發(fā)平臺。他解決了知識服務場景常見的“復雜文檔解析”、“復雜任務規(guī)劃”、“專屬行業(yè)適配”等難題。
在模型層,它集成了騰訊混元大模型、行業(yè)大模型等優(yōu)勢模型能力;在服務層,通過應用模板,簡化創(chuàng)建流程。企業(yè)用戶只需要輸入 模型選擇、角色設定、知識庫管理 等基本信息,5分鐘就可以搭建出一款知識應用。同時,我們還提供了 測試-修正-發(fā)布-反饋增強的一站式流程,助力快速驗證、快速投產,在客服營銷、企業(yè)知識管理等業(yè)務場景落地。
只需三步,企業(yè)客戶就用自然語言開發(fā)出一個知識應用。以API的形式,還可以快速地部署、集成到各類業(yè)務環(huán)境中,最大化放大企業(yè)知識價值和產出。在騰訊內部,與知識管理相關的客服場景,是我們最早投入的領域之一?;诖罅慨a品實踐,我們沉淀出大模型知識問答的核心能力,專注解決產業(yè)場景難題。?
在問答效果上,知識引擎以RAG(檢索增強生成)技術架構為基礎, 整合了OCR文檔解析、向量檢索、大語言模型、多模態(tài)大模型等多項技術。企業(yè)在上載專屬知識庫與行業(yè)專業(yè)文檔后,會先通過向量數據庫,生成大量問答。當用戶提問時,系統先匹配相關文檔片段,再由大模型基于提取內容來推理,這樣會生成準確率遠超通用大模型的回答,更好地滿足to B場景對準確性的要求。?
圍繞問答交互,知識引擎集成了多模態(tài)大模型的能力,依托高分辨率色彩感知增強技術,支持圖文混排、說明書、數據圖標等復雜文檔識別解析,答案生成,進一步提升用戶體驗。??
針對復雜任務規(guī)劃,目前業(yè)界主要基于agent的框架來做效果預研。但在實際情況中,業(yè)務的接口往往非常復雜,為了完成1個業(yè)務辦理,需要調用多個API?。不同業(yè)務場景,調用的接口類型、調用順序都有很大差別。大模型面臨全新任務時,準確率是很低的,距離商用有較大差距。對此,我們采用了更落地的解決方案,由大模型話術自動生成、實體智能抽取、接口缺失追問等能力,結合傳統工作流,簡化業(yè)務流程配置,降低配置成本。
三大AI大模型引擎的多行業(yè)、多場景應用?
目前,騰訊云大模型知識引擎已在政務、金融、教育、出行、零售等多個行業(yè)落地。在金融行業(yè),圓心惠保開發(fā)了保險代理人高效惠民智囊,通過大模型技術輔助,自動生成產品知識問答和安撫話術,實現人均提效50%。浙江萬榕,用大模型知識引擎打造出在線知識服務平臺“榕博士”,實現技術人員提效50%。
在教育行業(yè),河南省數字教育發(fā)展有限公司,用大模型知識引擎進行知識梳理配置,導入河南省百萬級的中小學教材文檔導入,打造出7×24小時在線的教師助理及學生助手。這項應用目前已在鄭州、洛陽、許昌的重點中小學上線。?
除了與外部客戶共建,我們也基于知識引擎升級了多款騰訊應用。我們剛剛提到,用大模型知識引擎可以更好地處理“復雜任務規(guī)劃”。這個能力已被應用于企點客服大模型文本機器人。在面向賬單查詢、退換貨這類復雜任務時,大模型機器人配置成本,相較傳統文本機器人減少50%。?
??
在交互層面,數智人能夠更好地理解和處理自然語言,準確識別用戶意圖,提供更為精準的回答和建議;借助知識引擎“大腦”,數智人將擁有更豐富的知識儲備,為用戶提供更專業(yè)的解答、更個性化的服務。
?
今年,我們?yōu)樵颇想娨暸_打造3D卡通代言人小彩云,結合大模型知識引擎,小彩云升級為智能助手,針對云南文化、服務、美食等信息,為用戶提供個性化交互問答服務。
?
我們還通過大模型,持續(xù)提升數字人的生產效能。在電商場景,小樣本數智人支持一鍵換裝,實現快速、批量化商品動態(tài)更新;在短視頻場景中,真人實景拍攝生成數字人,具有更自然、豐富的表情和肢體語言;面對蓬勃發(fā)展的出海業(yè)務,數字人通過多語種樣本訓練,批量化生成多語言播報視頻,讓海外傳播更便捷。
??
騰訊樂享是服務于企業(yè)內部的知識學習協作平臺,為企業(yè)提供知識管理、學習培訓文化建設等服務,目前已經服務了超過30萬家客戶,用戶超過1億。
?
在結合騰訊自研大模型和知識引擎后,實現了兩大場景的關鍵革新。圍繞“知識生產”,樂享結合大模型知識引擎,為用戶升級“智能寫作”等能力,可以實現寫作前提供思路,寫作中輔助潤色,寫作后輔助修繕,助力企業(yè)員工提升創(chuàng)作效率和質量。
?
圍繞“知識問答”,大模型知識引擎解決信息獲取鏈路長、內容利用率低、權限分配不清晰等難題。在常見的文檔權限場景,一個擁有薪酬權限的員工提問“員工薪酬怎么算”會獲取詳細回答,一個沒有權限的員工問同一個問題,AI則會回答“抱歉,不清楚”。
??
湖南曠真律師事務所,將4萬多份員工編撰的內部知識文檔導入騰訊樂享,構建出專屬AI知識庫,實現AI智能問答。
?
針對圖像、視頻素材生成場景,我們帶來了“圖像創(chuàng)作引擎”、“視頻創(chuàng)作引擎”兩款大模型PaaS工具。圖像創(chuàng)作引擎,基于騰訊混元的自研圖像創(chuàng)作底層模型,具備業(yè)界領先的文生圖、圖生圖能力,為企業(yè)客戶提供AI寫真、線稿生圖等圖像創(chuàng)作能力。
?
今年,我們通過算法升級,進一步提高了文生圖效能,畫面風格擴充至18種。同時,增加了提示詞自動擴寫功能,在輸入提示詞后,系統可以通過自動擴充、補充細節(jié),豐富畫面元素,進一步簡化創(chuàng)作流程。?
?
針對商用場景,推出“線稿生圖”的能力,用戶只需要上傳產品設計線稿,通過提示詞和參數設定,可以快速將 簡單的設計線稿 變?yōu)?精美的實物圖片,大幅縮短創(chuàng)作與生產周期。未來,在產品營銷環(huán)節(jié),我們還可以基于背景生成技術,快速、批量產出營銷素材,大大提高生產效率。
??
針對視頻創(chuàng)作,我們的“視頻創(chuàng)作引擎”,基于多模態(tài)算法技術,實現了視頻轉譯、視頻風格化、畫布拓展等多種功能,助力企業(yè)客戶快速、高性價比輸出各類視頻內容,用于不同群體、不同平臺的廣告投放。
??
今年3月,我們與《人民日報》,用大模型共創(chuàng)《江山如此多嬌》視頻,引發(fā)大量關注和強烈反響。在這個視頻中,我們綜合使用了圖生視頻、視頻風格化、視頻插幀、藝術字視頻等多項視頻創(chuàng)作能力,100%依托大模型能力進行創(chuàng)作。
??
通過圖生視頻的能力,我們上傳一張風景圖片,輸入提示詞“倒影逐漸放大”和相關參數配置,1秒即可生成對應視頻;通過視頻風格化,選擇2D動漫,湖面元素即可實現浮動展現;在這里,我們還采用了視頻插幀功能,通過上傳多張圖片,自動計算圖片之間的畫面,最終輸出一段連貫的創(chuàng)意視頻;藝術字視頻功能,給藝術字圖片輸入提示詞和參數選擇后,即可生成對應內容。
??
大模型知識引擎、圖像創(chuàng)作引擎、視頻創(chuàng)作引擎的技術原理有兩個特點,一個是功能強大,覆蓋了數據處理、模型精調、應用接入等多個流程,二是操作簡單,“模板化”的產品結構,通過自然語言交互,即可完成應用開發(fā),即使是不懂技術的生產、經營人員,也能發(fā)揮創(chuàng)造性,用大模型提升工作效率,改造生產流程。
多款智能應用升級與行業(yè)落地實踐
?
除此之外,我們還帶來多款“開箱即用”的產品應用,他們基于大模型技術提升生產效能,在不同場景實現提質增效。在智能座艙場景,?基于混元大模型,車載語音助手完成智能化升級,可以理解、回復復雜提問,響應完成高階任務,全面提升車主體驗,從而幫助車廠、伙伴構建大模型時代的競爭力。
?
在輸入層,把感知用戶狀態(tài)的各種信號源,用戶畫像特征導入大模型進行訓練,大模型會對車主偏好有更深入的理解。同時,大模型通過agent調用各種API接口,讓車載語音助手化身執(zhí)行任務的小幫手,完成車主在行程中的需求。
?
在應用層,大模型賦能座艙場景,實現三大升級。首先,口語化理解能力提升,與傳統對話可以實現無縫切換;其次,應用能力升級,可以實現行程規(guī)劃,也可以完成車輛知識問答,遇到故障還會主動報告并給出解決方案;第三是交互能力升級,車主可以隨時與大模型進行閑聊,還可以進行AI繪畫創(chuàng)作。
???
在營銷提效的場景,我們推出“企點營銷云AI助手”,為企業(yè)客戶提供專業(yè)、高效、易用、可信的智能分析和營銷服務。通過對話式數據分析、智能歸因、結論提取及報告生成、異常診斷及預警四大智能分析服務,客戶可以實現“輕松提問,秒獲洞察”的全新體驗。
?
目前,AI助手已經在零售、出行、泛互、泛政多個行業(yè)落地,與10多家客戶推進合作共創(chuàng)。但我們也在過程中,發(fā)現了兩大挑戰(zhàn),并對此進行了能力升級。針對復雜分析問題理解,例如同一提問包含多個問題,我們優(yōu)化了模型問題拆解和任務編排能力,升級后可覆蓋90%以上復雜分析場景,問題整體識別率提升至88%以上。
?
針對專業(yè)領域知識理解,例如“流量”在交通行業(yè)特指“車輛ID計數”,在零售行業(yè)又被定義為“用戶ID計數”,我們采用知識融合外掛方案,一方面通過高質量數據構建行業(yè)通用知識,另一方面通過客戶特有知識輸入,提高準確度,實現分析最優(yōu)解。
??
我們?yōu)橐患移放屏闶凵炭蛻?,提供了營銷云以及AI助手的服,實現門店經營管理快速提效。過去,各層級的銷售主管,一線門店店長,往往會面對分析能力短缺、分析需求回應慢等挑戰(zhàn),無法及時通過數據定位經營問題。通過AI助手,現在他們可以隨時隨地提問,高效獲取精準的數據洞察,幫助下一步決策動作。
??
企點營銷云還在持續(xù)通過大模型,升級服務能力。未來AI助手在內容生成、對話式人群生成、營銷策略生成等智能營銷應用上,還會持續(xù)推出新功能,敬請期待!
??
在代碼提效場景,我們推出騰訊云AI代碼助手,針對代碼補全,技術對話,單元測試和代碼診斷4個環(huán)節(jié)進行重點升級。其中,在代碼對話、單元測試場景,基于大模型進行指令對齊和強化學習;在私有化補齊場景,進行專業(yè)模型訓練和推理優(yōu)化。
?
在與行業(yè)客戶共建的過程中,我們挖掘出代碼開發(fā)的四類共性挑戰(zhàn),包括代碼訓練挑戰(zhàn)、代碼評測挑戰(zhàn)、IDE插件開發(fā)工具版本多,兼容難,細節(jié)打磨成本高;以及專業(yè)開發(fā)人員對產品的高要求。
目前,通過集團內外的大規(guī)模實踐與打磨,騰訊云AI代碼助手的代碼生成率達到30%,實現編碼時間縮短40%,研發(fā)提效20%。在騰訊內部,50%開發(fā)人員都在使用AI代碼助手編代碼。未來,我們也期待與更多企業(yè)客戶共創(chuàng),打造更優(yōu)的研發(fā)體驗。
?
以上,就是我為大家?guī)淼拇竽P凸ぞ摺a品進展。作為一家科技公司,我們的責任是開發(fā)出更多專業(yè)、易用的工具,降低大模型應用門檻,讓更多人能用得起、用得好大模型。我們真誠地希望,這些工具能為大家所用,讓大模型技術以更快的速度普及,為我們的生活創(chuàng)造更大價值。