3月20日,聲網亮相2025年中國家電及消費電子博覽會(AWE2025),正式推出對話式 AI 開發(fā)套件,此套件專為智能硬件開發(fā)者量身打造,旨在助力其快速構建 AI 實時語音交互產品,提升人機實時互動體驗。同時,聲網宣布已將對話式 AI 開發(fā)套件軟硬件全面開源。
對話式 AI 開發(fā)套件基于博通集成(Beken)的高性能 AI 芯片 BK7258 ,實現(xiàn)強大的端側音頻處理,同時深度融合了聲網的對話式 AI 引擎,讓智能硬件設備實現(xiàn)自然流暢的實時語音對話、智能停頓及打斷處理、以及超低延時響應,為開發(fā)者提供“對話式 AI + 智能硬件開發(fā)”一站式解決方案。
對話式AI開發(fā)套件方案架構圖
目前,聲網已將對話式 AI 開發(fā)套件的軟件、硬件全面開源。硬件側,將原理圖、位號圖等相關的硬件設計圖全面開放;軟件側,提供一整套面向開發(fā)者的開發(fā)工具箱,包括豐富的示例代碼和最佳實踐。開發(fā)者只需下載開源代碼,即可將對話式 AI 能力集成到自己的智能硬件設備中。1小時即可跑通 Demo,1天完成產品原型送樣,大幅縮短開發(fā)周期,降低開發(fā)門檻。
對話式AI開發(fā)套件
聲網對話式 AI 開發(fā)套件應用場景廣泛,從 AI 玩具到智能家居,可實現(xiàn)全場景適配,讓所有智能硬件開口說話。例如,AI 玩具、AI 教育硬件、AI 陪伴設備、家居語音助手、穿戴設備-個人助手等多種應用場景。
自然流暢、告別機械應答,定義下一代 AI 硬件交互體驗
AI 玩具、AI 機器人等智能硬件產品在實時互動時會面臨諸多技術挑戰(zhàn),如背景噪音干擾語音識別的準確性,導致指令接收偏差;對話延遲破壞交流的流暢性,影響用戶體驗;模型缺乏靈活性,導致交互模式單一,難以根據實際場景做出動態(tài)調整。
針對這些問題,聲網對話式 AI 開發(fā)套件給出了有效的解決方案。其先進的語音活動檢測(VAD)技術,能夠精準識別語音信號,降低背景噪音的影響,確保語音識別的高準確率。實時語音合成功能實現(xiàn)了快速響應,讓交互更加流暢自然。智能打斷處理則賦予了設備靈活的對話能力,可根據用戶的表達實時調整,極大地提升了交互的適應性與流暢度,告別“機械式”應答,助力 AI 玩具和 AI 機器人實現(xiàn)更流暢、更迅速的交互體驗。具體來說聲網對話式 AI 開發(fā)套件具備5大優(yōu)勢:
極致 AI 對話體驗
AI 與用戶的對話延遲最低可達 650ms,打斷響應低至 340ms,擁有近乎真人般的對話響應速度與節(jié)奏,極大提升交互的流暢性。精準的語音識別,能夠屏蔽 95% 的環(huán)境人聲及噪聲干擾,實現(xiàn)對話人聲的精準識別,確保在復雜環(huán)境下也能準確獲取用戶指令。
多模態(tài)交互體驗
提供豐富的接口配置,例如內置麥克風、攝像頭以及傳感器接口,還可提供文本、音頻、視頻和觸控等多種交互功能。通過 “聽、說、看、觸” 全維度交互形態(tài),充分滿足親情陪伴、家居控制等不同場景下的多樣化需求。
主流 AI大模型支持
對話式 AI 開發(fā)套件對大模型實現(xiàn)廣泛兼容,支持通義千問、豆包、DeepSeek 等主流 AI 大模型服務,同時也可靈活接入自研大模型,為開發(fā)者提供豐富的選擇。
極速產品原型送樣
僅需 1 小時即可跑通 Demo,1 天便能完成產品原型送樣,極大地縮短了產品開發(fā)周期,降低開發(fā)門檻。同時,軟硬件開源的特性助力開發(fā)者快速完成從設計到上市的全流程。
低功耗設計
采用低功耗設計方案,支持超長待機,有效解決設備續(xù)航焦慮,為用戶提供更持久穩(wěn)定的使用體驗。
全場景適配,讓所有智能硬件“開口說話”
聲網的對話式 AI 開發(fā)套件應用場景廣泛,從 AI 玩具到智能家居,可實現(xiàn)全場景適配,讓所有智能硬件開口說話。
在?AI 玩具領域,可支持動態(tài)調整游戲難度與劇情,保持趣味性,激發(fā)兒童創(chuàng)造力,還能即時解答兒童提問,將知識學習融入日常互動。
在?AI 教育硬件方面,能夠根據學生水平調整講解深度與節(jié)奏,實現(xiàn)自適應教學與個性化學習,還能進行語言能力訓練,實時糾音糾錯,模擬真實對話環(huán)境,提升口語表達。
對于?AI 陪伴設備,讓 AI 通過自然閑聊與情緒共鳴,成為部分人群的情感寄托,同時記錄用戶習慣,主動提醒用藥、作息,降低健康風險。
在家居語音助手場景中,支持連續(xù)對話與模糊指令,如 “調暗燈光,放點音樂”,還能通過復合指令實現(xiàn)跨設備協(xié)同,像 “觀影模式” 聯(lián)動燈光、投影儀等。
在穿戴設備-個人助手場景,可提供實時翻譯、實時字幕、實時會議紀要功能,并結合日程管理、任務提醒,實現(xiàn)工作流全鏈路智能化 。
賦能 Robopoet AI萌寵,開啟全新陪伴體驗
2024年 AI 玩具市場規(guī)模已達181億美元,權威機構預測,全球 AI 玩具市場將迎來爆發(fā)式增長,預計到2033年,市場規(guī)模將增長至600億美元。AI 玩具的快速發(fā)展為互動娛樂創(chuàng)造了新機遇,通過實時陪伴、沉浸式故事體驗和動態(tài)劇情開辟了全新的人機互動體驗。
專注于 AI 情感陪伴機器人的初創(chuàng)公司珞博 Robopoet,近日發(fā)布了一款口袋 AI 毛絨寵物 Fuzzoo。Fuzzoo 搭載其獨創(chuàng)的 MEM(多模態(tài)情感模型),能傾聽、感知并撫慰人心,具備養(yǎng)成屬性,提供實時個性化的陪伴。
借助聲網的對話式 AI 技術,F(xiàn)uzzoo 大幅優(yōu)化了 AI 交互的實時性和穩(wěn)定性,使得這款 AI 陪伴機器人能夠進行自然流暢的對話,提供實時情感陪伴和個性化交互,從而為用戶帶來全新的陪伴體驗。
Robopoet 聯(lián)合創(chuàng)始人兼 CTO 潘雨楠表示,“聲網的對話式 AI 技術賦予了下一代 AI 玩具和機器人實時感知、思考、反應和交流的能力。憑借超低延遲響應、智能打斷、以及先進的語音處理能力,聲網讓人機互動變的更加自然流暢,并始終為互動體驗的穩(wěn)定性和可靠性保駕護航。”
除此之外,目前已有數(shù)家客戶集成了聲網的對話式 AI 開發(fā)套件,相關智能硬件產品也即將量產發(fā)布。例如集賢科技最近發(fā)布的“靈語靈珠” AI 玩具,同步使用了聲網的對話式 AI 開發(fā)套件,實現(xiàn)了 AI 語音互動能力,助力其打造了更智能、更靈敏、更安全的 AI 玩具。
未來聲網將持續(xù)完善對話式 AI 開發(fā)套件,為更多智能硬件場景賦予實時互動能力,注入數(shù)字靈魂。通過不斷地優(yōu)化實時互動體驗,使 AI 硬件不再是機械工具,而是有情感交互的生活摯友,滿足用戶多樣化需求,適應不同生活場景,推動智能硬件行業(yè)邁向人機互動新時代。