×

AI在音频产业链中找到了自己的声音

发布时间:2021-06-15 发布时间:
|

翻译自——embedded

硅基麦克风的出现重塑了音频领域。市场研究公司Yole Development相信,在未来几年,人工智能将引领市场演变和转型。

语音交互是自然的,这就是为什么它正在成为人机交互的主要接口。基于语音的个人助理(VPA)在智能手机、智能音箱、智能手表、无线耳机、汽车、智能电视及其遥控器中越来越受欢迎。现在甚至垃圾桶都集成了语音识别。而真正的价值在于高音频质量和对麦克风周围环境的理解。

对于Yole development来说,音频是下一个被人工智能(AI)渗透的领域。

人工智能如何发声

基于语音的虚拟个人语音助理(VPA)是当今音频行业的主要驱动力。基于音频系统的传统组件,如音频编解码器、麦克风、扬声器和音频放大器,他们都在使用人工智能来计算和分析语音数据。例如计算支持复杂的音频功能,如语音识别和源定位。它可以在云中执行,也可以在消费设备的边缘处执行。这些分析在云中执行需要很高的处理能力和访问大量数据,。

Yole光电和传感部门的技术和市场分析师Dimitrios Damianos表示:“人工智能的附加价值是用于自然语言处理,声音是与机器互动的一种更自然的方式。你不需要使用键盘和双手,你只需要发声即可。然而,为了理解用户在说什么,他们的语言以及他们的意思需要进行大量的处理。“人工智能正在增加解码的价值,并帮助我们与设备沟通。”

当被问及VPA的快速渗透时,Damianos将其归因于其便捷性和效率。当然,“我们相信和看到的是,像谷歌、苹果、Facebook、亚马逊和微软(统称为GAFAM)这样的大型科技公司试图推动这些VPA,因为它们提取的数据有真正的价值。”

Yole公司MEMS和传感器部门的技术和市场分析师Alexis Debray:对于用户来说,音频比图像更容易被接受。他们认为音频“不那么具有侵入性,所以这是GAFAM从人们那里收集数据的好方法,GAFAM的主要业务就是数据。一些公司利用数据做生意,而另一些公司利用隐私和设置技术来确保用户的隐私。例如,苹果公司就宣扬隐私,并使之成为强大的营销资产。

Damianos说到:对大型科技公司来说,它们的实际价值是尽可能多地从环境中提取信息,这意味着VPA不仅会倾听用户的声音,还会倾听他们周围的环境,并了解他们的环境。例如,“如果你在厨房里,麦克风可以听到刀架在柜台上的声音,立刻就知道你在厨房里,并给出一个菜谱。”这就是情景人工智能。

人工智能对话之后的下一个阶段很可能是完全感知,虚拟助手,无论是智能扬声器还是智能手表,都可以像人类一样与用户交流。Damianos介绍,完全的意识是概念性的,并带有问号。“我们还不知道时间轴,但可能会在人工智能对话之后的5到6年。这将取决于人工智能的发展和该领域公司的发展。

虽然这些一直监听的系统可以在汽车人机界面中挽救生命,但它们也引起了人们对用户隐私保护的担忧。为了防止可能的误用,Debray强调,数据处理应该尽可能快地进行,并尽可能靠近麦克风。“离麦克风越近,隐私泄露的可能性就越小。”

隐私包含多个维度,因为用户可能希望隐藏自己的性别、年龄或情绪。展望未来,Debray表示,他有信心麦克风、ASIC或应用处理器领域的参与者将开发出确保用户隐私的技术。麦克风可以消除声音中的情绪,只呈现音频数据。

Yole分析师预计,GAFAM将继续占据主导地位,因为目前它们对分析的作用至关重要,但传感器制造商显然渴望在边缘加入人工智能,并将音频分析业务从云端分流出去。Damianos:“传感器制造商希望增加他们的收入,并从音频市场中分一杯羹。这不是一场来自大公司一方的战斗。这是传感器公司的一场战斗。”

Alexis Debray:“传感器公司确实在追求多样化的战略,“试图向价值链移动,变得更加一体化。”

在最近的一次采访中,Vesper Technologies Inc.首席执行长Matt Crowley曾表示,Vesper正在寻求提高其压电MEMS麦克风的智能化程度。“我们相信,在未来,我们将在传感器中嵌入一些与人工智能配对的传感器。它将能够学习人类和动物如何使用他们的感官——不仅仅是视觉、听觉、味觉、嗅觉和触觉,还有动作或温度——来了解他们的环境。我们的长期愿景是,这些物体将使用多种仿生传感器来了解它们的环境,并尽可能做出最佳反应。”

此外,英飞凌(Infineon AG)也改变了自己的商业模式,从销售麦克风模类产品转向销售Goertek和AAC等公司的产品,再到销售成套的MEMS麦克风。从一个MEMS麦克风制造商到一个做制造、封装、测试和销售的综合播放器。“这是战略上的变化……这可能意味着,他们看到了VPA的动向,希望在这个市场上找到自己的定位。”

同样,美国楼氏电子Knowles,今天的领导者,拥有MEMS麦克风市场39%的份额,最近从Ams AG收购了MEMS麦克风ASIC设计部门。这是引入混合信号电路设计知识产权的一种方式,同时也是应对来自中国公司如Goertek和AAC日益激烈的竞争的一种方式。

MEMS麦克风为音质提供有力支持

全球音频市场继续其增长轨迹。基于语音的VPA需要更好的信噪比(SNR),以便在嘈杂的环境中准确地捕捉人的声音,因此MEMS麦克风面临着新的市场机遇。

据Yole称,全球麦克风、麦克风和音频芯片消费市场的年化增长率将达到6.6%,从2018年的141亿美元增长到2024年的208亿美元。便宜,小巧,易于集成,麦克风被广泛采用,并达到很高的音量。Damianos:“我们使用了大约60亿个麦克风,”目前麦克风市场规模为17亿美元,预计到2024年,其复合年增长率将达到3%,达到20亿美元。

MEMS麦克风市场目前约占总市场的70%,将从2018年的12亿美元增长到2024年的16亿美元。主要的驱动市场包括智能手机、智能音箱以及可听设备(如无线耳机)。Damianos介绍:“在过去的几年里,智能音箱和可听设备的市场经历了爆炸性的增长。到2024年,智能音箱中的MEMS麦克风的复合年增长率将达到13%,达到12亿只。到2024年,无线耳机的复合年增长率将达到29%,达到13亿部。

2019年智能手机用户20%的人机互动将使用语音助理

各大手机平台也在积极投入,让虚拟个人语音助理(VPA)的功能日益强大,甚至连苹果Siri都会唱PPAP,研究机构Gartner表示,相关技术进展将促使用户更常使用VPA,预计到2019年,智能型手机用户20%的人机互动,都将使用VPA。

Gartner还公布了2016年第四季的行动应用调查,在中国、英国与美国调查了3021名手机用户,发现美国有42%、英国有32%用户在过去三个月内使用过VPA功能,英美平均每天至少使用一次的用户达37%。

有54%受访的英美用户过去三个月使用过苹果的Siri,Google Now的过去三个月使用率在美国则为48%、英国41%。Gartner表示,随着更多新功能的出现、更多语系支持,以及越来越多机种支持VPA,这类接口的使用率将会逐步成长。

Gartner表示,VPA的成长,会和同时间快速发展的「会话商务(conversaTIonal commerce)」相互加持,且不仅是语音识别为中心,通讯软件语对话功能亦将扮演重要角色,例如Facebook Messenger的新商务功能便可让用户透过对话订购商品、呼叫Uber等,此外,腾讯的微信发展出的支付功能也已经成为该通讯服务的重要功能。

Gartner表示,中国是目前全球会话商务最成熟的市场,以通讯平台为核心的市场发展状况已经促使传统商业进行变革。微软的Cortana也正整合入Skype,Cortana则负责扮演第三方服务提供商与消费者之间、以对话呈现的互动平台,协助用户进行机票、饭店预订等商务活动。

除了语音,Gartner亦预测现在是移动电话主流互动接口的触控功能,将不再是消费者唯一仰赖的接口,语音语动作(gesture)的重要性将会在消费性装置上大增,预期到2020年将有70亿台个人设备、13亿个穿戴式装置与57亿个其他类消费性物联网终端装置,将会仅有基本,或完全没有触控设计(Zero-Touch UI),使用传感器针对周边环境进行情境信息搜集,如语音、环境、生物特征、移动与动作等信息,将会成为新型态UI的重要设计依据。

与此同时,据Yole称,目前价值91亿美元的微型扬声器市场,预计在2024年将以3%的复合年增长率达到109亿美元。

Damianos:“这似乎是一个适度的增长,但在2018年和2019年,智能手机市场放缓,可能是因为智能手机越来越贵,用户在升级之前等待的时间更长。以前你每1.5年换一次手机,现在是每2.5年换一次,而且还在增加,“我们预计麦克风和微型扬声器市场将会下滑。事实上,“可听设备和智能音箱的爆炸式增长抵消了这种差异。VPA正在推动所有这些设备中麦克风和扬声器的集成化。”

Damianos总结道,时间在变化。



『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

热门文章 更多
国民技术积极推进智能门锁标准 打造智能家居生态链