www.亚洲色色,日日草小视频

DoNews > 3C > 聲網(wǎng)對話式 AI 開發(fā)套件全面開源開啟人機(jī)交互新體驗

聲網(wǎng)對話式 AI 開發(fā)套件全面開源開啟人機(jī)交互新體驗

李旭 2025-03-21 10:18:27

573341

分享到

3月20日，聲網(wǎng)亮相2025年中國家電及消費電子博覽會（AWE2025），正式推出對話式 AI 開發(fā)套件，此套件專為智能硬件開發(fā)者量身打造，旨在助力其快速構(gòu)建 AI 實時語音交互產(chǎn)品，提升人機(jī)實時互動體驗。同時，聲網(wǎng)宣布已將對話式 AI 開發(fā)套件軟硬件全面開源。

對話式 AI 開發(fā)套件基于博通集成（Beken）的高性能 AI 芯片 BK7258 ，實現(xiàn)強(qiáng)大的端側(cè)音頻處理，同時深度融合了聲網(wǎng)的對話式 AI 引擎，讓智能硬件設(shè)備實現(xiàn)自然流暢的實時語音對話、智能停頓及打斷處理、以及超低延時響應(yīng)，為開發(fā)者提供“對話式 AI + 智能硬件開發(fā)”一站式解決方案。

對話式AI開發(fā)套件方案架構(gòu)圖

目前，聲網(wǎng)已將對話式 AI 開發(fā)套件的軟件、硬件全面開源。硬件側(cè)，將原理圖、位號圖等相關(guān)的硬件設(shè)計圖全面開放；軟件側(cè)，提供一整套面向開發(fā)者的開發(fā)工具箱，包括豐富的示例代碼和最佳實踐。開發(fā)者只需下載開源代碼，即可將對話式 AI 能力集成到自己的智能硬件設(shè)備中。1小時即可跑通 Demo，1天完成產(chǎn)品原型送樣，大幅縮短開發(fā)周期，降低開發(fā)門檻。

對話式AI開發(fā)套件

聲網(wǎng)對話式 AI 開發(fā)套件應(yīng)用場景廣泛，從 AI 玩具到智能家居，可實現(xiàn)全場景適配，讓所有智能硬件開口說話。例如，AI 玩具、AI 教育硬件、AI 陪伴設(shè)備、家居語音助手、穿戴設(shè)備-個人助手等多種應(yīng)用場景。

自然流暢、告別機(jī)械應(yīng)答，定義下一代 AI 硬件交互體驗

AI 玩具、AI 機(jī)器人等智能硬件產(chǎn)品在實時互動時會面臨諸多技術(shù)挑戰(zhàn)，如背景噪音干擾語音識別的準(zhǔn)確性，導(dǎo)致指令接收偏差；對話延遲破壞交流的流暢性，影響用戶體驗；模型缺乏靈活性，導(dǎo)致交互模式單一，難以根據(jù)實際場景做出動態(tài)調(diào)整。

針對這些問題，聲網(wǎng)對話式 AI 開發(fā)套件給出了有效的解決方案。其先進(jìn)的語音活動檢測（VAD）技術(shù)，能夠精準(zhǔn)識別語音信號，降低背景噪音的影響，確保語音識別的高準(zhǔn)確率。實時語音合成功能實現(xiàn)了快速響應(yīng)，讓交互更加流暢自然。智能打斷處理則賦予了設(shè)備靈活的對話能力，可根據(jù)用戶的表達(dá)實時調(diào)整，極大地提升了交互的適應(yīng)性與流暢度，告別“機(jī)械式”應(yīng)答，助力 AI 玩具和 AI 機(jī)器人實現(xiàn)更流暢、更迅速的交互體驗。具體來說聲網(wǎng)對話式 AI 開發(fā)套件具備5大優(yōu)勢：

極致 AI 對話體驗

AI 與用戶的對話延遲最低可達(dá) 650ms，打斷響應(yīng)低至 340ms，擁有近乎真人般的對話響應(yīng)速度與節(jié)奏，極大提升交互的流暢性。精準(zhǔn)的語音識別，能夠屏蔽 95% 的環(huán)境人聲及噪聲干擾，實現(xiàn)對話人聲的精準(zhǔn)識別，確保在復(fù)雜環(huán)境下也能準(zhǔn)確獲取用戶指令。

多模態(tài)交互體驗

提供豐富的接口配置，例如內(nèi)置麥克風(fēng)、攝像頭以及傳感器接口，還可提供文本、音頻、視頻和觸控等多種交互功能。通過 “聽、說、看、觸” 全維度交互形態(tài)，充分滿足親情陪伴、家居控制等不同場景下的多樣化需求。

主流 AI大模型支持

對話式 AI 開發(fā)套件對大模型實現(xiàn)廣泛兼容，支持通義千問、豆包、DeepSeek 等主流 AI 大模型服務(wù)，同時也可靈活接入自研大模型，為開發(fā)者提供豐富的選擇。

極速產(chǎn)品原型送樣

僅需 1 小時即可跑通 Demo，1 天便能完成產(chǎn)品原型送樣，極大地縮短了產(chǎn)品開發(fā)周期，降低開發(fā)門檻。同時，軟硬件開源的特性助力開發(fā)者快速完成從設(shè)計到上市的全流程。

低功耗設(shè)計

采用低功耗設(shè)計方案，支持超長待機(jī)，有效解決設(shè)備續(xù)航焦慮，為用戶提供更持久穩(wěn)定的使用體驗。

全場景適配，讓所有智能硬件“開口說話”

聲網(wǎng)的對話式 AI 開發(fā)套件應(yīng)用場景廣泛，從 AI 玩具到智能家居，可實現(xiàn)全場景適配，讓所有智能硬件開口說話。

在?AI 玩具領(lǐng)域，可支持動態(tài)調(diào)整游戲難度與劇情，保持趣味性，激發(fā)兒童創(chuàng)造力，還能即時解答兒童提問，將知識學(xué)習(xí)融入日?；印?/p>

在?AI 教育硬件方面，能夠根據(jù)學(xué)生水平調(diào)整講解深度與節(jié)奏，實現(xiàn)自適應(yīng)教學(xué)與個性化學(xué)習(xí)，還能進(jìn)行語言能力訓(xùn)練，實時糾音糾錯，模擬真實對話環(huán)境，提升口語表達(dá)。

對于?AI 陪伴設(shè)備，讓 AI 通過自然閑聊與情緒共鳴，成為部分人群的情感寄托，同時記錄用戶習(xí)慣，主動提醒用藥、作息，降低健康風(fēng)險。

在家居語音助手場景中，支持連續(xù)對話與模糊指令，如 “調(diào)暗燈光，放點音樂”，還能通過復(fù)合指令實現(xiàn)跨設(shè)備協(xié)同，像 “觀影模式” 聯(lián)動燈光、投影儀等。

在穿戴設(shè)備-個人助手場景，可提供實時翻譯、實時字幕、實時會議紀(jì)要功能，并結(jié)合日程管理、任務(wù)提醒，實現(xiàn)工作流全鏈路智能化。

賦能 Robopoet AI萌寵，開啟全新陪伴體驗

2024年 AI 玩具市場規(guī)模已達(dá)181億美元，權(quán)威機(jī)構(gòu)預(yù)測，全球 AI 玩具市場將迎來爆發(fā)式增長，預(yù)計到2033年，市場規(guī)模將增長至600億美元。AI 玩具的快速發(fā)展為互動娛樂創(chuàng)造了新機(jī)遇，通過實時陪伴、沉浸式故事體驗和動態(tài)劇情開辟了全新的人機(jī)互動體驗。

專注于 AI 情感陪伴機(jī)器人的初創(chuàng)公司珞博 Robopoet，近日發(fā)布了一款口袋 AI 毛絨寵物 Fuzzoo。Fuzzoo 搭載其獨創(chuàng)的 MEM（多模態(tài)情感模型），能傾聽、感知并撫慰人心，具備養(yǎng)成屬性，提供實時個性化的陪伴。

借助聲網(wǎng)的對話式 AI 技術(shù)，F(xiàn)uzzoo 大幅優(yōu)化了 AI 交互的實時性和穩(wěn)定性，使得這款 AI 陪伴機(jī)器人能夠進(jìn)行自然流暢的對話，提供實時情感陪伴和個性化交互，從而為用戶帶來全新的陪伴體驗。

Robopoet 聯(lián)合創(chuàng)始人兼 CTO 潘雨楠表示，“聲網(wǎng)的對話式 AI 技術(shù)賦予了下一代 AI 玩具和機(jī)器人實時感知、思考、反應(yīng)和交流的能力。憑借超低延遲響應(yīng)、智能打斷、以及先進(jìn)的語音處理能力，聲網(wǎng)讓人機(jī)互動變的更加自然流暢，并始終為互動體驗的穩(wěn)定性和可靠性保駕護(hù)航。”

除此之外，目前已有數(shù)家客戶集成了聲網(wǎng)的對話式 AI 開發(fā)套件，相關(guān)智能硬件產(chǎn)品也即將量產(chǎn)發(fā)布。例如集賢科技最近發(fā)布的“靈語靈珠” AI 玩具，同步使用了聲網(wǎng)的對話式 AI 開發(fā)套件，實現(xiàn)了 AI 語音互動能力，助力其打造了更智能、更靈敏、更安全的 AI 玩具。

未來聲網(wǎng)將持續(xù)完善對話式 AI 開發(fā)套件，為更多智能硬件場景賦予實時互動能力，注入數(shù)字靈魂。通過不斷地優(yōu)化實時互動體驗，使 AI 硬件不再是機(jī)械工具，而是有情感交互的生活摯友，滿足用戶多樣化需求，適應(yīng)不同生活場景，推動智能硬件行業(yè)邁向人機(jī)互動新時代。