思必驰车联网总监雷雄国：车载语音交互的难点、核心与方向

语音交互的技术进步，将进一步提升车联网的用户体验。

7月22日上午，由车云网携手雅森联合主办的车联·新纪元——2016中国（广州）车联网创新发展论坛隆重召开，现场汇聚多位行业重量级嘉宾。他们围绕车联网、UBI、智能交通等细分领域做了精彩分享，揭示车联网的深度价值。思必驰的车联网事业部总监雷雄国先生就车联网中的人机交互分享了他的见解。

思必驰车联网事业部总监雷雄国先生

车联网的交互方式，目前在整个业内越来越受到重视。在汽车交互领域，语音已经成为第一的交互方式。从整个中国的车载调研情况来看，大部分的汽车厂商包括前装后装都对语音做了深度的集成，在整个互联网市场正在成为标配的交互方式。

语音交互分为两个大的形态，第一个是嵌入类，把车上的屏作为扩展实现。一些主机厂商倾向于提供类似的交互方案。另外一种更加强调交互，将交互方案放在手机车机的连接当中。目前的互联网造车厂商，基本上是这一类的方案。

在车载的应用场景下，非常多的硬件能够使用这一些语音交互的方式，最常见的是包括智能车机，后视镜，HUD的产品形态。语音交互存在已达半个多世纪，但语音交互并不是那么真正好用、用户体验不好。推广语音交互，真正的难点在哪几个方面？

第一，不能纠错，高识别率没用。实际交互过程中，语音识别准确率不可能达到100%。在前两年，有一个视频，就是一个山东大汉高速开车过程中使用安吉星语音系统。他在识别电话号码时只错了一位，准确率很高，然而这个情况下却始终得不到正常的交互。真正体验好的语音交互，一定是能够让用户完成他的目标。
第二，现有系统是命令控制，机械式交互。这种语音交互是用户需按照指定命令去做，机器不具备语义理解能力。因此，整个系统功能单一，命令词单一，交互乏味。传统车厂商有些前端语音交互的功能，大部分也是命令式的。
第三，操作比较复杂。目前很多方案实现的操作是触屏+部分语音这种方式来做的。不同应用中可能内置不同的语音方案，操作麻烦，缺乏语音唤醒，不能真正解放双手。

回顾车载的前装和后装。前装非常重视稳定性，导致一个结果，在引进新的个性化需求时更加慎重。后装市场，因为更新比较快，更多的是强调个性化、娱乐性、提案好的交互。这导致在后装市场语音交互这一块的体验更优于前端市场。

从整个交互的情况看，语音交互核心有三点：