语音交互2.0 | 思必驰离在线模组将为“智能终端”带来哪些自由?

  • 2020-04-02 17:05
  • 科技圈

  从机械式“一问一答”到“打电话”式的全双工交互,我们已进入了语音交互2.0时代,正处在新的技术突破期和应用探索期,“交互自由”成为AI语音行业的力之所向,在此背景下,思必驰推出了基于TH1520芯片的离在线语音模组方案。

  

 

  该离在线模组方案具备低成本、低功耗、高性能优势,模块化封装了思必驰全链路智能对话技术,配套双麦算法模组,提供一站式Turnkey离在线方案,集成鲁棒降噪、回声消除、离在线识别、近远场全双工交互、就近唤醒等能力,且支持自编译功能、多格式解码和OTA升级等等,对接简单便捷,最快三周可完成对接到落地的全过程。

  基于以上优势,该模组能为更多智能终端产品带去更多自由拓展的空间。对于终端用户,离在线识别、近远场全双工交互、就近唤醒等能力,可在各类场景下实现说法自由;对于硬件厂商和开发者,高度适配性、对接便捷性、方案多样性等优势,可在智能产品开发的过程中,实现应用自由。

  

 

  以“芯”为基础,打通全链路语音交互技术

  思必驰离在线模组方案以TH1520芯片为基础,并打通了全链路语音交互技术,为该模组方案提供基础技术保障。

  TH1520芯片由思必驰联合中芯聚源成立的子公司——深聪智能,独立自研,它于2019年1月正式发布,于2019年7月量产,是一款AI专用的双核增强型低功耗DSP芯片,集成思必驰语音算法,大容量片内静态存储,多通道音频解码支持广域采样率,为上层Wi-Fi芯片端的工作减轻压力,为开发者留出更多上层逻辑应用开发的空间。

  经数千小时实测,思必驰离在线模组在待唤醒状态下功耗仅约150mW,而在正常工作模式下功耗也不超过750mW。同时,基于TH1520芯片的自编译平台已就绪:使用思必驰离在线模组方案的开发者们,可根据实际需求在平台上自行配置唤醒词和命令词,1分钟即可出配置文件,极大缩短了个性化定制的技术需求沟通时间。

  

 

  思必驰&深聪智能自研AI芯片TH1520

  该离在线模组方案,集成了思必驰全链路智能对话技术并进行模块化封装,支持双麦阵列设计,针对家居场景下的智能硬件量身定制,具备如下性能优势:

  家居噪音环境下,5米远场唤醒率>95%,识别准确率>92%,误唤醒仅1次/48h(国际认可1次/24h为优秀水平);

  支持唤醒词自定义,可内置本地指令数百条,响应时间<500ms;

  背靠DUI平台,可自选对接天气、音乐、故事、百科、新闻等海量技能,云端服务无限制。

  ……

  

 

  思必驰全链路智能对话技术

  打破桎梏,说法自由

  思必驰离在线模组方案以扎实先进的对话式AI技术为基础,实现了更多技术升级,打破技术桎梏,实现说法自由。

  语音交互中,离线与在线各有其优点和弊端。离线交互实现的功能受限,但好处是无需联网、响应快,且数据本地化处理;云端交互虽然支持的说法自由且更广,但也容易出现数据处理速度慢、同音字词影响成功率等问题。融合离在线的双模式混合交互是大趋势,一方面需要确保离线交互快、多、准,确保在线交互广、灵、优,同时还需要让系统能够智能决策离在线的处理方式。

  目前,在业内能够支持全双工功能的语音模组较为罕见,在中低端芯片上实现全双工更是一种挑战。然而思必驰早期发布的“全双工交互技术”,早已展开了全线方案渗透,已将全双工能力升级至该离在线模组方案中。通过“打电话式”的人机交互,源源不断同时进行的语音上行流和下行流,支持连续交互、动态断句、语义打断、噪声拒识等功能,打造更自然的“类真人助理”。

  

 

  思必驰全双工对话技术

  大势所趋的智能家居风潮,“入口级”硬件终端各展神通,但相近的唤醒词,往往容易出现“一呼百应”的尴尬。思必驰离在线模组方案,通过“就近唤醒”来解决这一难题。不同于业界GPP的实现办法,思必驰离在线模组方案的“就近唤醒”是基于DSP来实现的,处理性能更优秀:哪台设备被唤醒,并非简单的取决于与用户距离的远近,而是依据哪台设备所接收到的正面声能更多。这就避免了用户面对着空调说“太热了”,但沙发边的音箱却抢话“我听不懂”的尴尬情况。

  同时,若同个环境下有多个设备采用本模组,唤醒后的设备可以控制其他硬件的联动功能,实现多模块协同,如“命令客厅的空调控制阳台的晾衣架”。思必驰用语音实现万有交互,帮助厂商打造全屋智能。

  

 

  思必驰离在线模组方案的“就近唤醒”

  对接便捷,应用自由

  深耕AIoT数年,思必驰深刻理解硬件厂商和开发者的需求,该离在线模组方案广适性强,对接门槛低,旨在为更多厂商和开发者提供更便捷多样的语音方案,将AI语音能力赋予至更多产品中。

  多格式解码:配备多通道音频编解码器,在DSP芯片上能够处理支持广域的采样率范围,内置EQ调节,且支持MP3、ACC、M4A、M3U8等主流高清音频格式解码。

  OTA升级:背靠DUI平台,在线技能可不断扩充,设备控制、影音视听、信息搜索、儿童读物等内容可自由选择对接。多版本管理增量云端热更新,助力应用快速成型,减轻开发压力的同时,给予用户最顺滑的智能体验。

  落地速度快:硬件厂商及开发者只需列出本地词条和通信协议,集成完后进行测试即可,从项目开始到落地,通用方案对接可实现最快2周完成验证发布。

  方案多样化:针对品牌白电厂商、小家电方案商、运营商、行业客户、海外厂商、中小型开发者的不同需求,思必驰推出多种离在线模组方案版本选择,包括SDK、算法系统方案、芯片方案、模组方案、整机方案、Amazon AVS定制版、运营商定制版、行业场景定制版等。

  品类应用广:离在线模组仅65mm*50mm,低功耗、低发热,可以轻松嵌入各类家用电器之中,包括白电厨卫(如空调、冰箱、洗衣机)、卫浴设备(如魔镜、马桶、晾衣架)、客卧小家电(如扫地机器人、净化器、台灯)等。

  

 

  拥抱多品类家居硬件,协助打造全屋智能

  在语音交互2.0时代下,思必驰作为AI背后的赋能者,不仅致力于打造更“自由”的人机交互方式,也更期冀有更多产品可“自由”地获取对话式AI能力,该款离在线语音模组方案承载着思必驰各项成熟先进的AI语音技术,将协助厂商/开发者创造出更多“Powered by Aispeech”产品,让“沟通万物、打理万事”走入大众生活。

  附:思必驰离在线模组方案规格说明书

  

头条推荐
图文推荐