思必驰车联网总监雷雄国:车载语音交互的难点、核心与方向

语音交互的技术进步,将进一步提升车联网的用户体验。

车云按:

7月22日上午,由车云网携手雅森联合主办的车联·新纪元——2016中国(广州)车联网创新发展论坛隆重召开,现场汇聚多位行业重量级嘉宾。他们围绕车联网、UBI、智能交通等细分领域做了精彩分享,揭示车联网的深度价值。思必驰的车联网事业部总监雷雄国先生就车联网中的人机交互分享了他的见解。

思必驰车联网事业部总监雷雄国先生思必驰车联网事业部总监雷雄国先生

车联网的交互方式,目前在整个业内越来越受到重视。在汽车交互领域,语音已经成为第一的交互方式。从整个中国的车载调研情况来看,大部分的汽车厂商包括前装后装都对语音做了深度的集成,在整个互联网市场正在成为标配的交互方式。

14693703993506.jpg

语音交互分为两个大的形态,第一个是嵌入类,把车上的屏作为扩展实现。一些主机厂商倾向于提供类似的交互方案。另外一种更加强调交互,将交互方案放在手机车机的连接当中。目前的互联网造车厂商,基本上是这一类的方案。

14693704458138.jpg

在车载的应用场景下,非常多的硬件能够使用这一些语音交互的方式,最常见的是包括智能车机,后视镜,HUD的产品形态。语音交互存在已达半个多世纪,但语音交互并不是那么真正好用、用户体验不好。推广语音交互,真正的难点在哪几个方面?

  • 第一,不能纠错,高识别率没用。实际交互过程中,语音识别准确率不可能达到100%。在前两年,有一个视频,就是一个山东大汉高速开车过程中使用安吉星语音系统。他在识别电话号码时只错了一位,准确率很高,然而这个情况下却始终得不到正常的交互。真正体验好的语音交互,一定是能够让用户完成他的目标。

  • 第二,现有系统是命令控制,机械式交互。这种语音交互是用户需按照指定命令去做,机器不具备语义理解能力。因此,整个系统功能单一,命令词单一,交互乏味。传统车厂商有些前端语音交互的功能,大部分也是命令式的。

  • 第三,操作比较复杂。目前很多方案实现的操作是触屏+部分语音这种方式来做的。不同应用中可能内置不同的语音方案,操作麻烦,缺乏语音唤醒,不能真正解放双手。

回顾车载的前装和后装。前装非常重视稳定性,导致一个结果,在引进新的个性化需求时更加慎重。后装市场,因为更新比较快,更多的是强调个性化、娱乐性、提案好的交互。这导致在后装市场语音交互这一块的体验更优于前端市场。

从整个交互的情况看,语音交互核心有三点:

  • 一,为了解决汽车开车安全的问题,这是最本质的问题。

  • 二,核心刚需,例如音乐电台部分的本地控制的功能。目前亟需把这些核心的功能做到稳定。

  • 三,在前两个痛点的需求基础上打造一些体验乐趣,随着车联网的普及,汽车联网,个人的社交以及媒体的娱乐等等功能的引用,会让开车的过程中有更好的操作体验。

除了上述困难,在驾车的环境下,语音系统化会受各种噪声的影响,特别大,包括车噪,空调,背景音乐等等,甚至副驾或者后排乘客打电话、聊天,在这样恶劣的场景下,语音交互怎么做到比较好的体验?这是非常需要投入解决的困难。

尽管目前语音交互充满各种技术难题,语音交互系统的发展应该做到这几点:

真正的口语式交互。单纯的语音控制,依然要结合手动操作,用户交互仍然不方便,造成交互死结。全自然语言的交互,可以完全解放双手,是用户的核心诉求,也是车载生态蓬勃的根本。

14693712093300.jpg

场景化的应用才是发展方向。语音交互只是手段,不是目的。交互的目的是为了机器更好地完成任务。因此,后端的第三方服务显得更为重要。

车联网系统的发展必然会对现有人机交互提出更高要求,语音交互将成为一种重要的路径,一旦解决的上述的技术难题,将迎来人机交互的新时代。

更多评论 收起评论

我要说

欢迎您!

退出