在今年1月举行的国际消费性电子展(CES)上,当媒体看到高通(Qualcomm)展示了在其车内Smart Audio平台上的Amazon Alexa语音识别功能,就对未来发展有了一些想象。高通的展示预示,车内虚拟助理将会使得语音成为驾驶人与车辆之间的自然沟通接口。
高通的展示中最令人印象深刻的一幕,是Alexa在高通的某个高层说话时打断他,说:“不对!这不是真的。”欧喔…在展示中发生这种小“突槌”事件在所难免;而且另一方面,目前的商用语音处理系统也会发生这种语音处理失误。
语音识别系统通常辨识度不佳,特别是在吵杂的环境中;车内就是一个非常吵杂的环境。来自以色列的新创公司Hi Auto执行长暨共同创办人Roy Baharav在接受EE Times访问时就指出:“你可以想象坐后座的小孩们在吵闹、救护车从旁边呼啸而过,还有大雨打在车顶上…”
为了消除噪音以及改善车内语音识别的可靠度,Hi Auto开发了一种视觉语音(audio-visual)解决方案,利用了面对驾驶人的摄影机以及单个麦克风,以深度学习算法追踪嘴唇运动,这种整合式的“视觉语音”解决方案会锁定驾驶人,同时清除其他麦克风与噪音。
而预期的输出则是“干净的音讯”,Hi Auto声称如此能实现更准确的语音识别以及清晰的对话;该公司的计划是提供“只有软件”、不搭配特定硬件的系统。
语音输入可望成为终极语音接口,但也只是“可望”;今日的语音输入技术相对较新,对很多人来说,跟一个没有生命的物体交谈还是感觉很怪。所以如何养成人们在车内使用语音控制接口的习惯?毕竟Hi Auto的成功取决于语音控制普及性,特别是在汽车产业。
对此Baharav表示:“在很多高阶车款中,语音控制已经被广泛采用,而且这种技术也渐渐渗透到大众车款;”这种趋势得益于支持语音控制接口的车用资通讯娱乐系统越来越受欢迎。而且他认为,车内资通讯娱乐系统的语音助理不只有娱乐功能,“将负责关键任务。”
Baharav进一步解释,首先透过可视接口控制的各种车内装置功能,已经变成驾驶人分心的原因之一;其次,汽车产业正面临越来越严格的安全法规;第三,已经习惯在家里使用Amazon Echo或是Google Home等语音助理的消费者,也在寻求车用的类似方案。
根据市场分析机构voicebot.ai的2019年最新调查,美国有60%消费者在购车时会将语音助理系统做为考虑条件之一。(来源:Voicebot.ai)
而且Hi Auto也不是唯一看好“会说话的车子”的公司;Baharav估计,目前该市场上约有5亿美元规模,成长也非常快速。他举例指出,已经在该市场上经营一段时间的、从语音识别业者Nuance独立而出的Cerence,就被认为一年的营收达到3亿美元;还有一家公司SoundHound在市场上的版图也持续扩张。
分析师预期,透过语音助理衍生的商业与广告收入将在2025年达到200亿美元,而且车用将会是主要的贡献者之一。而根据Baharav观察,对汽车产业来说更重要的是,车厂将车用资通讯娱乐系统的差异化视为打品牌的关键,因此这是一个可利用的好机会。
Baharav解释:“随着语音控制变得越来越重要(Google预期2020年有五成的在线搜寻是透过语音),车厂也觉得他们必须要支持这种接口;”如果有人忽略了快速成长的语音搜寻市场发展趋势,会有被淘汰的危险。
语音控制最立即性的应用是车用资通讯装置接口,驾驶人能以语音指令完成打电话、发简讯、播放多媒体,或是导航等等功能。还有什么其他需要跟车子说话的理由吗?
Baharav表示:“想象一下共乘车还有家庭用车;”当车内有不只一个的资通讯娱乐系统需要控制,而且要一次处理好几个语音指令,高质量的车内语音技术会变得非常重要。此外随着先进驾驶辅助系统(ADAS)功能越来越多样化,他预见未来驾驶人可以出声指挥车子变换车道、超车,或者是停进某个停车格,而且其可靠度以及抗噪音的能力会让人惊艳。
推动创新的基本力量,来自于车厂对于牢牢掌握数字体验方案的渴望;但并非让驾驶人习惯CarPlay、Android Auto,而是希望消费者使用车厂自家的车用资通讯娱乐系统(IVI)。Baharav指出,在这种情况下,车厂们将会提供原厂内建、使用者友善的IVI,而且支持热门的音乐串流、数字广播或实时通讯应用程序。
他补充指出,对车厂来说,更重要的是“将IVI与自家开发的地图软件、广播、通话/简讯支持、车身控制、ADAS互动,还有涉及其他车身硬件的软件程序结合;”随着这些车内应用程序不断增生,车厂必须要具备至少能与Google Assistant与Siri媲美的语音控制技术。
很遗憾的是,“目前个别解决方案在语音助理质量方面仍嫌不足,特别是在吵杂的环境中;”Hi Auto期望能藉由针对车内环境永恒存在的瞬间吵杂问题、还有人们习惯在车内交谈的情况提出解决方案来让自己与众不同:“我们必须确保车子听清楚驾驶人说什么。”
Hi Auto的明确目标是,藉由改善语音分离(speaker separation)以及强化语音识别,在车用语音控制市场占据一席之地。我们询问了Baharav目前的智能型手机或智慧扬声器在噪音消除能力上不足的几个应用场景。
例如一个爸爸驾驶休旅车载女儿们还有她们的朋友们一起去练足球,他注意到汽油快没了,不过他们在高速公路上,需要改变导航的方向。他不想花太多时间滑触控屏幕去找加油站,但是车子里的噪音太大了(很多小孩在叽叽喳喳),车子听不清楚爸爸的指令。
Baharav表示:“这种情况无法以最先进的指向性麦克风来解决,因为孩子们坐在爸爸后面;而噪音消除也无法解决这个噪音,因为并非静态的,无法学习并消除。”
另一个例子是,一位女性驾驶在大雷雨中开车上高速公路要去上班;在雷鸣闪电中,车子的报器响了,暖气的风扇已经开到最大。她想告诉同事她上班会迟到,但发简讯太危险,所以她对着车内系统用讲的,但系统的反应却一直是:“抱歉,请说大声点…”
Baharav表示,这个情况也无法用最先进的指向麦克风来解决,因为噪音来自四面八方。噪音消除也无法解决噪音,因为这同样非静态,无法学习并消除(瞬间噪音)。
Hi Auto近日解除了隐身模式,完成450万美元的种子轮募资,由一家以色列汽车进口商Delek Motors以及其现任董事长Zohar Zisapel主导。其他投资人还包括运输业者Allied Holdings、Goldbell Group与Plug & Play。
这家新创公司预计用种子资金完成第一款产品的开发,并展开销售与扩充团队;Hi Auto表示,已经汽车业界领导厂商安排在2020年初测试其技术。在2020年的CES展之后,Hi Auto打算以软件开发工具包(SDK)的形式推出车内语音解决方案,透过简单的授权方式,或是以软件即服务(SaaS)的模式提供云端API。
(原文发表于ASPENCORE旗下EDN姐妹媒体EETimes,参考链接:'Be quiet for a sec? I'm trying to talk to the car.',编译:Judith Cheng)
『本文转载自网络,版权归原作者所有,如有侵权请联系删除』