智能语音框架
介绍
随着语音识别的技术的飞速发展,各种各样的智能设备把越来越多的便利与创新功能融入到我们的生活中。消费者开始不满足于原来通过“鼠标”和“触控”操作的操作系统。解放双手,通过语音对话直接与智能设备交互已成新一代人工交互的手段。特别是芯片技术的发展,通过 DSP 实现了语音识别的硬件化,进一步降低了芯片的成本。
YoC 平台提供全栈式智能语音解决方案。不仅从软件框架上提供一套极简的开发方案,还充分发挥平头哥自主 CPU的优势。同时结合阿里巴巴达摩院算法及阿里云的产品优势,形成一系列的技术栈,主要包括:
- 云音语音识别芯片平台
- 达摩院语音算法
- YoC 软件平台
- 阿里云智能
语音交互框架
语音交互框架提供应用场景中常用的应用功能,包含了“多媒体服务”、“麦克风服务”、“灯效/按键”、“电源管理”、“离线唤醒”、“云端SDK对接”等模块组成。
语音服务
- 适用于多核soc,ap侧负责采集及搬送数据,cp侧负责离线语音识别及抛出各类事件
- 提供多种录音数据,方便对接云端语音处理及查找本地算法问题
- 提供LPM接口,方便增加低功耗管理
- 接入方式简单,最小只需实现数据采集及语音识别部分算法等接口
NLP服务
- 提供科大讯飞、百度语音等云平台基本技能NLP解析
- 提供用户NLP解析接口,方便增加、删减NLP解析
多媒体服务
- 支持多种类型播放、暂停、恢复、停止等操作
- 支持音乐播放后自动恢复
- 支持音量调节及渐入渐出效果
- 支持最低音量播放
灯效/按键
- 支持按键单击、松开、双击、长按等事件
电源管理
- 提供板级低功耗管理接口
升级服务
- 支持差分、全量升级
- 支持数字签名、完整性校验
- 支持有线、无线升级
- 支持断电保护、断点续传
云端SDK对接
- 接入方式简单
- 支持多NLP解析
- 支持多云端AI引擎接入