×
半导体制造 > 材料技术 > 详情

看国内外语音交互厂商如何定位人工智能

发布时间:2020-05-15 发布时间:
|

  今天要讨论的这个话题应该不少关注人工智能的朋友们都挺感兴趣的,作为人体感官的重要一部分,以及输出思想的主要渠道,它被冠以新一代的交互方式,它就是——语音交互。搜狗、四维图形、百度、出门问问、云知声给霸屏了(虽然没有AR VR刷的那么厉害,但是眼尖的我还是注意到了!)

  怎么大家突然扎推搞起了语音交互?而且做的都还是智能驾驶应用?看来这里面一定有什么!所以编者决定今天给大家详细讲讲——“语音交互”。

  一、语音交互是什么

  语音交互其实可以分成两块:语音识别和语义识别。所谓语音识别,就是把人说的语音转化成计算机可读的输入,比如微信中的语音转文字功能。而语义识别,则要求更高。它要求机器可以听懂你说的语音,比如你问Siri今天天气怎么样,它需要听懂你说的意思,并完成相应的回答。语音识别和语义识别二者合一,就构成了语音交互,它将是未来的新一代交互模式。

  二、语音交互公司

  搞清楚一个行业最好的方式就是去看这个行业里有哪些公司,所以小编先扒了扒他们都在做什么。

  1、国外语音交互的大佬们

  Nuance

  全球最大的语音技术公司,超1000项专利技术 ,一度雄霸天下。当然现在依然很牛啦。在中国,有9%的语音识别应用是采用Nuance的核心技术。它和电信、移动、联通、网通都有合作,cctv春晚的呼叫中心也应用此技术。简直不可撼动。。。

  微软

  提到微软在语音交互的布局,不得不说起微软两姐妹,小冰和小娜。小娜Cortana是微软发布的全球第一款个人智能助理。能够了解用户的喜好和习惯,帮助用户进行日程安排、问题回答等。小冰目前已发布第三代,听说读写技能都已解锁,从最初只能单纯的文字对话跨越至纯语音的互动聊天。

  谷歌

  Google一直致力于投资语音技术,此前收购多家语音识别技术公司及专利。2011年,收购语音通信技术公司 SayNow 和语音合成技术 Phonetic Arts。 2014年收购SR Tech Group的多项语音识别相关的专利,其中包括 “ 搜索引擎语音界面” 和 “ 修改、更新语音识别项目系统” 的专利。

  今年4月份Google还开放了自己的语音识别API,即Google 语音搜索和语音输入的支持技术。Google Cloud SPeech API包括了80多种语言,适用于各种实时语音识别与翻译应用。

  苹果

  苹果收购过Siri、Novauris、VocalIQ等语音技术公司,且请了不少牛B的人组建基于神经网络算法的语音识别团队。最近苹果正依靠语音助手Siri构建更大的生态系统,在最新的HomeKit的合作伙伴名单中,除了国内厂商海尔,还有照明厂商飞利浦、科锐 (CREE),以及Marvell(美满电子)、Honeywell(霍尼韦尔)等全球顶级制造商。

  2、国内语音交互公司

  讲完国外的我们来重点讲讲国内的。据了解,目前我国语音技术厂商基本分为三类:一类是,包括像科大讯飞、捷通华声等传统语音技术厂商;第二类是互联网厂商,包括百度、腾讯、搜狗等,通过自主建设团队或者收购,掌握智能语音技术,推广语音服务;第三类是创业企业,像云知声、思必驰等,它们专注于某些行业领域,比如汽车、家电,来推广自己的语音技术和产品。

  科大讯飞

  成立于1999年底,依靠中科大的语音处理技术以及国家的大力扶持,很快就走上了正轨,是目前国内最有影响力的语音技术公司,08年的时候就已经挂牌上市了,目前市值接近500亿。根据2014年语音产业联盟的数据调查显示,科大讯飞占据了超过60%的市场份额,绝对是语音技术的龙头企业。

  百度

  语音交互其实很早就被百度确立为战略方向,2010年的时候百度就与中科院声学所合作研发语音识别技术,但是没搞好。直到14年,百度请来了人工智能领域的泰斗级大师吴恩达,正式组建了语音团队,专门研究语音相关技术,才得以咸鱼翻身。到目前为止,已斩获了近13%的市场份额,技术实力可与科大讯飞相提并论。

  除了技术外,我们还看到百度积极地布局应用端,CarLife、MyCar以及在上个月CES上推出的CoDriver都是百度在车联网语音交互的生态布局。还有百度之前推出的度秘,之前也在KFC中实现了语音点餐这一功能。

  搜狗

  搜狗在今年的CES ASIA上有惊艳到我,现场模拟车内的交互,无论是拨打电话、发短消息各种信息查询都不在话下。并且语义理解做的挺棒,可以进行多轮式对话,小编现场试了一下。

  搜狗输入法在语义理解方面的大数据积累、搜狗本身就在做的地图,再加上目前由搜狗自主开发的语音交互技术,这3者深度结合,在车联网应用领域的确是很具优势的。

  思必驰

  思必驰初创于07年,由剑桥大学团队创立于英国剑桥高新区,2008年回国创业。同科大讯飞一样,思必驰是国内为数不多的拥有全套语音类知识产权的公司。在语音识别、语音合成、语义理解、声纹识别、对话管理、音频分析等方面均有深厚技术积累。目前思必驰把语音相关技术整合成 AI OS 人机对话操作系统,作为安卓系统之上的一层标准接口,提供给硬件合作伙伴。针对不同场景,AIOS 又分成了 For Car,For Home,For Robot 等版本,针对车载、家居、机器人等产品做垂直领域下的对话式交互。在15年年底,思必驰还获得了新一轮近2亿人民币的投资,不清楚投资方。

  出门问问

  2012年成立,至今已累计融资7500万美金。现有投资方包括红杉资本、真格基金,SIG海纳亚洲、圆美光电、及歌尔声学,最近还拿了Google投资的C轮融资。

  出门问问基于语音识别、语义识别、垂直搜索引擎、语音合成以及智能推送几项自主研发的核心技术,已推出了不少产品。有Ticwear(语音操控的可穿戴设备)、魔法小问(语音操控,提供各类生活服务)、开车问问(智能语音车载APP)以及出门问问智能语音助手,语音识别比较红火的几个应用场景基本都有铺路。至于为什么谷歌找了他们投资,我想是因为出门问问应该是除了科大讯飞和百度以外,唯一一家有全套语音交互核心技术的创业型公司了吧。技术好,效率高,而且出门问问的创始人兼CEO李志飞以及CTO雷欣,都是Google的科学家,所以就这么被相中了。。。

  云知声

  云知声成立于2012年,主要团队来自于盛大研究院。语音识别技术更多源自于中科院自动化所。其语音识别技术有一定的独到之处,有一小段时期内语音识别率甚至超越科大讯飞。因此也受到了资本的热捧,B轮融资达到3亿人民币,主要瞄准智能家居市场,现在也有智能车载解决方案。

  哦啦语音

  哦啦语音于2013年初成立,是威盛电子内部孵化的创业项目。拥有在中文自然语言理解、语音识别、语音控制和语音交互系统等方面的 20 多项自主专利。目前已应用在智能家居、智能车载、可穿戴设备、语义和交互API服务、智能会议系统、手机语音助手几个方面。他们家最大的特色,是对于中文语义的理解,针对用户各种问题可以给出生动、活泼、幽默、精确的回答。

  三、国内语音交互情况

  看完目前的国内外公司情况,我们不难发现大家非常统一在智能驾驶领域布了局,相信未来hand-free&eye-free的日子应该不远。相比国外大公司靠着收购组全语音交互的生态链,国内大公司的发展则比较曲折。刚开始巨头们都安然地使用着科大讯飞、云知声等公司的引擎,后突然幡然悔悟,开始了自主研发的漫漫长路,不过目前除了百度砸重金组建团队获得了一些效果以外,其他都还处于未经市场检验的阶段。

  同时,我们也很欣慰地看到不少国内的语音交互创业公司正在慢慢崛起,像出门问问,哦啦语音等都拥有核心技术的一批,开始在市场站稳脚跟。虽然这种交互方式还有很长的路要走,但语音交互的产业正在形成一种趋势,这对于正在发展中的物联网行业来说,又将是一片待开发的新蓝海,值得各位关注。


『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

热门文章 更多
PCB中via与pad有什么区别