嵌入式 > 技术百科 > 详情

华为力推自研AI芯片 寒武纪又该何去何从?

发布时间:2020-06-15 发布时间:
|

在10月10日开幕的华为2018全联接大会上,华为轮值董事长徐直军代表华为发布了AI发展战略与全栈全场景AI解决方案,华为这样的重磅玩家All in AI让本来就热闹的AI赛道的竞争变得更加激烈,不过在芯片层面最先受伤的可能是华为海思如今的AI合作伙伴寒武纪。

对于华为的全栈全场景AI解决方案,徐直军这样解释:“我们提出的全场景,是指包括公有云、私有云、各种边缘计算、物联网行业终端以及消费类终端等部署环境。我们说的全栈是技术功能视角,是指包括芯片、芯片使能、训练和推理框架和应用使能在内的全堆栈方案。”

两款AI芯片——Ascend 910和Ascend 310

在华为的全栈全场景AI解决方案中,最底层可能也是此次最受关注的就是华为最新发布的两款AI芯片——Ascend 910和Ascend 310。Ascend是华为全新的芯片产品线,中文名为昇腾,相比不久前引发热议的阿里巴巴“平头哥”,虽然在命名上华为没有夺人眼球,但昇腾系列有针对不同场景的最优TOPS/W的不同产品。

徐直军现场展示了一款已经商用的昇腾310 mini,而针对智能手机、智能附件、智能手表的Ascend-Lite、Ascend-Tiny、Ascend-Nano将在2019年第二季度商用。

会后,徐直军接受媒体采访时表示:“昇腾310更多是用在边缘计算产品上,但也可以用在云端,昇腾910更多是用在云端,提供强大的AI训练算力。昇腾310的Lite、Tiny、Nano主要是用于物联网、行业终端和智能手机、智能穿戴等消费终端,以IP方式跟其他芯片结合在一起服务于各个产品。”也就是说,华为并不会单独销售这两款AI芯片,而是以芯片为基础开发AI加速模组,AI加速卡,AI服务器,AI一体机,以及面向自动驾驶和智能驾驶的MDC(Mobile-DC)进行销售。

当然,徐直军也表示:“一个企业不可能拥有一个完整供应链,华为两款AI芯片也不可能完全自己研发,不可能不依赖于第三方和合作伙伴。”对于一款芯片的研发,由于工艺制程已经到了7nm,设计的复杂性往往会让设计厂商自主研发核心的IP,同时也采购第三方的IP,保证自主研发可控的前提下也能够更快效率推出芯片。

受伤的寒武纪?

处于议论另一端的寒武纪,一直致力于提供终端AI处理器IP和云端智能芯片,这与华为如今发布的AI战略想要瞄准的市场有一定程度的重合,华为建立在完全自制的AI计算架构上的昇腾方案,同样采用云+端的策略。而寒武纪此前也为华为麒麟970芯片提供NPU(神经网络单元)当中的AI核心架构,与华为是合作关系。

外界好奇,力推AI战略的华为今后是否还需要寒武纪?华为与寒武纪是否真如外界所说,会从合作关系变为竞争对手,以及AI独角兽寒武纪的商业化落地究竟做的如何?

寒武纪把自己定位成一家独立的芯片公司,为下游厂商提供不同尺寸、面向不同应用场景的终端AI处理器IP以及覆盖inference(推断)和training(训练)的不同处理能力的云端智能芯片。

2017年9月初,华为在IFA 2017柏林消费电子展上发布了传闻已久的”人工智能芯片“——Kirin 970(麒麟970)。这是“全球首款第一枚手机AI芯片”。这款芯片就集成了寒武纪1A处理器的IP作为其核心人工智能处理单元(NPU——Neural Network Processing Unit)。

不过,市场上关于华为自己做AI的说法就没断过,华为的AI架构“达芬奇” (Da Vinci)也传闻已久。在日前的全连接大会上,徐直军首次公开回应,他称, “(达芬奇)是基于我们对人工智能的理解和我们的需求自然而然产生的。寒武纪的也很好,但是没法支持我们所需要的全场景”。

徐直军表示,华为需要的是从云到边缘、到端、到各种物联网终端,全场景的支持,因此必须要开创一个全新的架构,要能实现极致的功耗需求、极致的算力需求全覆盖。

实际上,在麒麟970芯片发布时,对于与寒武纪的合作,华为对外就显得轻描淡写;寒武纪在自家官网则大方写到,集成寒武纪1A处理器的世界首款人工智能手机芯片华为麒麟970正式发布并在华为Mate 10手机中投入大规模商用。

今年8月底,华为发布的新一代旗舰处理器麒麟980搭双核NPU,搭载了寒武纪1A的优化版本,但具体采用了哪个优化版本,华为未做出说明。对此,麒麟980芯片相关负责人曾对媒体表示,华为原本是不打算做宣传的,而是靠口碑营销,因为“消费者只要用了就知道有多好”。

对此,有接近华为的人士表示,寒武纪只是华为的其中一个供应商,华为的做法应该是符合双方合作规定的,不然寒武纪是可以状告华为的。

业界也有声音认为,随着华为昇腾系列IP以及达芬奇架构的正式发布,麒麟900系列处理器很快将集成自家的昇腾IP而非寒武纪的NPU,实现与寒武纪彻底切割,甚至成为寒武纪的直接竞争对手。寒武纪的AI架构看起来更像是华为AI过渡时期的救急产品,这或许也是华为对与寒武纪合作态度相对低调,不愿宣传的一个原因。

“这件事(达芬奇架构)在意料之中”,寒武纪创始人兼CEO陈天石近日公开回应称,“如果华为这样的有能力、有平台的巨头都不打算自研AI芯片,只能说明AI芯片还不够重要。”

不过,陈天石否认寒武纪与华为的竞争关系,他称,目前与华为的合作仍在继续,而华为发布的峰值性能16T的昇腾310和寒武纪今年5月发布的128T峰值的MLU100没有竞争,因为两者场景不同——前者主要是边缘端,而后者是云端,峰值性能也不同。

一向低调的寒武纪在一级资本市场备受追捧,成立至今吸引了一众知名投资机构和互联网巨头的投资。在2017年A轮融资后,它就第一个迈进了全球AI芯片领域的独角兽大门,一时风头无两。2018年5月,寒武纪科技宣布完成数亿美元B轮融资。其投后整体估值达25亿美元。

AI投资热潮后的今天,人工智能公司已经到了用业绩证明实力,对投资方有所交代的时候。

外界关于华为将与寒武纪切割、直接竞争的讨论让寒武纪的商业化落地备受关注。

寒武纪终端处理器IP产品已衍生出1A、1H、1M等多个型号,适用范围可覆盖智能手机、安防监控、可穿戴设备、无人机和智能驾驶等各类终端设备的芯片中。

寒武纪告诉全天候科技,其终端客户主要以SOC厂商为主,目前客户包含华为海思、紫光展锐、晨星(MStar)/星宸半导体等中国最顶尖SoC芯片公司。寒武纪的IP客户晨星(MStar)/星宸半导体的智能摄像头也已量产并发货,其它客户的产品也将陆续发货。 晨星(MStar)总部位于中国台湾,是全球知名的家电嵌入式IC芯片厂商。

而寒武纪MLU100和MLU200则主要服务于云端服务器端的智能处理需求,偏重于推理和训练两个用途。在此方面,寒武纪和中科院系的公司——中科曙光、中科创达的合作紧密。中科曙光利用寒武纪架构打造出针对推理应用优化的服务器。此外,联想和浪潮也发布了搭载寒武纪云端芯片的AI服务器产品。

不过,寒武纪面对的竞争也十分激烈。

在智能手机领域, 除了华为拥有了自己的AI战略,小米也在自研芯片,拥有自己的“澎湃”系列处理器;其它如VIVO、OPPO等手机厂商,则选择了高通骁龙系列或联发科等老牌巨头产品。苹果和三星则早已步入封闭式自我研发的阶段。寒武纪想要继续扩大市场份额,或许有些困难。

在安防监控领域,寒武纪与华为海思、深鉴科技、北京君正、国科微等抢夺同一块蛋糕,厮杀已久。后起之秀也源源不断,竞争非常激烈。

而在无人机领域,高通、英特尔、英伟达、联芯、华为海思、三星等巨头早已瓜分大部分市场。

除了华为,阿里、百度,格力等都在做自有的AI芯片,随着巨头纷纷入局,寒武纪作为独立的芯片公司如何找到自己的生存空间,这或许的当下更具挑战的问题。

不过,华为具备AI功能的首款芯片是2017年发布的麒麟970,也被华为称为首款人工智能移动计算平台。余承东提及970主打的AI模块用词说的是"华为NPU",PPT中也写的是"Kirin NPU"。发布会后中国科学院计算技术研究所给华为发去贺信,贺信写到麒麟970芯片集成寒武纪1A处理器作为其核心人工智能处理单元(即余承东总在发布会中所述NPU),实现了手机上本地、实时、高效的智能处理。

对此,华为回应称华为和寒武纪团队共同面向终端,在 AI 方面进行了联合开发与优化,NPU是麒麟970异构计算的一部分,华为对麒麟970异构系统中的每个处理器都非常重视,在CPU、GPU、ISP、DSP上都投入了重要力量进行技术开发和探索,投入大量力量进行优化,力求带来最好的效果。可见华为海思并不愿多谈与寒武纪的合作,与华为海思不同,寒武纪倒是在其官网上明确写出2017年集成寒武纪1A处理器的世界首款人工智能手机芯片华为麒麟970正式发布并在华为Mate 10手机中投入大规模商用。

今年八月底,余成东发布了麒麟系列的新一代旗舰处理器麒麟980,搭双核NPU。有报道称,麒麟980并未搭载此前谣传的寒武纪最新一代1M IP,而是采用麒麟970搭载的1A优化版本1H,加上双核,图像识别速度提升了220%。麒麟980芯片相关负责人表示原本他们是不打算做宣传的,而是靠口碑营销,因为“消费者只要用了就知道有多好”。

当然,华为海思确实也是这么做的,华为麒麟公众号推送的文章在麒麟980 AI能力时更多的是从AI性能提升及应用的角度去介绍,并未对双核NPU多做介绍。

大胆推测,麒麟900系列处理器集成寒武纪IP只是一个过渡方案,随着昇腾系列IP以及达芬奇架构(Da Vinci)的正式发布,麒麟900系列处理器很快将集成自家的昇腾IP而非寒武纪的NPU,这或许也是华为为何一直不太愿意多说麒麟970和麒麟980里的寒武纪NPU。

在接受采访的时候,徐直军表示:“构建新的达芬奇架构来支持我们的人工智能芯片是基于我们对人工智能的理解自然产生。我们开创性的达芬奇架构支持从云端到边缘端,不同物联网终端场景的人工智能需求,从极致的低功耗需求到极致的大算力需求全覆盖。现在我们还没有看到市场上有其它架构能够做到这一点。”

华为首席网络架构师党文栓也表示:“我们设计这个芯片的时候从开始就考虑到要全场景辐射,这是我们不二选择。”

在昇腾310芯片系列里,Ascend-Lite就是针对智能手机的IP,因此无论从成本还是昇腾处理器发展的角度来看,寒武纪NPU被麒麟900系列处理器弃用应该只是迟早的事情。但对于寒武纪这家中国大名鼎鼎的独角兽来说,华为是其目前已知的最重要的终端客户,如果遭到华为的弃用,结果将如何?

合作伙伴终变竞争对手

在10月10日的华为全联接大会上徐直军指出:“昇腾910是计算密度最大的单芯片,采用7nm工艺制程,最大功耗为350W,半精度为(FP 16)256 Tera FLOPS,比Nvidia V100的125 Tera FLOPS还要高出近1倍。若集齐1024个昇腾910,将会出现迄今为止全球最大的AI计算集群,性能也将达到256个P,不管多复杂的模型都能轻松训练。”

昇腾910或许会是寒武纪更为感到不安的产品,为什么这么说?今年5月,寒武纪发布首款云端智能芯片 Cambricon MLU100 和板卡产品,实现了AI IP从终端到云端的布局。MLU100采用MLUv01架构,基于16nm工艺,平衡模式下等效理论峰值速度达每秒128万亿次定点运算,高性能模式下等效理论峰值速度达每秒166.4万亿次定点运算,典型板级功耗为80瓦,峰值功耗不超过110瓦。

可见,无论是在制造工艺还是性能上,寒武纪的产品都没有优势,要知道在对算力渴望程度极高的AI领域,高算力低功耗的芯片更加受到追捧。更为严峻的是,寒武纪能提供的是AI板卡,华为也能提供,同时还有全栈解决方案。党文栓在回答媒体AI投资回报的问题时就表示:“全栈解决方案更能进一步加速投资回报周期,全栈解决方案意味拥有的完整能力支撑企业级关键任务应用场景,而且全栈的开放性、互动性的可以更好服务企业,未来也能提供更好的选择。

我们知道,AI的发展让更多的公司意识到芯片与算法更加紧密结合的重要性,因此AI时代,芯片与其上层相关的工具、框架、应用都将会有更紧密的结合。从这个角度来看,像华为这样的全栈解决方案提供商相比寒武纪具有明显地优势。虽然微软并未开始大规模采购华为的AI芯片或者AI服务器,但华为确实和微软有接触。当然,寒武纪和中科曙光也有着合作相当紧密,二者利用寒武纪架构打造出针对推理应用优化的服务器。

至此不难发现,麒麟900系列处理器弃用寒武纪NPU应该是迟早的事情,并且无论是偏向终端的昇腾310还是云端的昇腾910,华为和寒武纪都会成为竞争关系。当然,这并不意味着在AI市场只能容得下华为或寒武纪,AI是伴随物联网发展的一个技术,因此AI也将被应用到非常丰富的应用当中,有实力的AI企业相信最终都能找到合适的生存空间。

只不过,华为与寒武纪,恰好代表了AI市场里两类典型的玩家,一个规模巨大具有生态优势的大玩家,另一个因AI浪潮而生有自己的技术优势新势力,他们的发展都代表了一类AI企业。那么,最终结果会如何?


『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

热门文章 更多
如何解决PCB传输线之SI反射问题