科胜讯(conexant)2MIC/4MIC方案分析-0写在最前面

随着人工智能技术的日益成熟,智能硬件这个“古老”的领域也慢慢焕发生机,最典型的是各大互联网公司推出的智能音箱产品。亚马逊集成Alex的Echo,谷歌集成GoogleAssistant的GoogleHome已在市场上占据先机。苹果集成Siri的智能音箱以及国内百度集成DuerOS的智能音箱已在路上。相信微软集成Cortana的智能音箱也会不久面世。

亚马逊Echo智能音箱

各大互联网巨头的终极目标是推广自己的智能操作系统,而音箱这个入口就变得至关重要。和传统的手机类语音助手不同,智能音箱能够实现远场识别,在3~5米的范围内响应用户的语言命令。这样的能力大大扩展了语音的使用场景,甚至音箱可以作为家庭智能中枢,以音箱为中心控制家中的空调、电视、灯具等智能终端。

从用户角度,智能音箱的组成包括:

  • 音箱本身
  • 手机端APP
  • 音箱控制的智能外设,如空调、电视、灯光等

从技术组成角度,智能音箱包括:

  • 麦克风前端阵列
  • 唤醒识别
  • 语音识别
  • 自然语言处理
  • 语言合成
  • 移动APP及外设控制

相比于手机类的语音助手,智能音箱最大的区别是麦克风前端阵列。

麦克风前端阵列的核心技术包括:

  • 回声抵消(AEC)
  • 混响消除
  • 角度识别
  • 波束合成(BeamForming)

目前麦克风阵列比较成熟的是科胜讯(Conexant)的双MIC和四MIC方案,国内也有麦克风阵列厂商比如声智科技(SoundAI)但真实效果不好评估。

选择对科胜讯的方案进行分析,主要出于两方面的考虑:

  • 科胜讯的方案相对成熟,技术文档相对完善;
  • 科胜讯的方案不但提供麦克风阵列,同时,搭建了包括语音唤醒、识别、自然语言处理、手机与音响互联等功能的整体实现方案,并将实现源码在GitHub上分享。

后续的文章将会从硬件、驱动、软件、互联等多个角度对科胜讯的麦克风阵列方案进行全面的分析,敬请期待~

参考阅读:

智能音箱技术概览: blog.csdn.net/jackytintin/article/details/62040823