深度学习框架发展的新阶段，“名实陷阱”需保持警惕-EDA365

嵌入式 > 技术百科 > 详情

深度学习框架发展的新阶段，“名实陷阱”需保持警惕

发布时间：

最近，美国推动的一系列科技封锁政策让人瞠目结舌。我们习以为常的世界科技秩序，毫无疑问正在以肉眼可见的速度被改变甚至重构。

在这样的话语氛围下，底层技术自主可控开始成为社会各界的共识与推动方向。而在科技产业进程里，半导体与计算机操作系统代表着过去有亏欠、今天急于填补的技术门类，也就是我们在今天能够清晰感受到被“卡脖子”的那些技术。而另一类则是中美大体处在齐头并进阶段，需要积极发展的“未来技术”。所谓昨日因今日果，如果我们不希望未来再次被卡脖子，那么今天这类技术也必须保持独立可控，甚至高速发展反超欧美——AI 技术就是这个领域的代表。

（去年 GitHub 就突然限制克里米亚、古巴、朝鲜、伊朗和叙利亚等国家用户访问）

在发展 AI 技术的进程里，最关键的开发底座相信读者已经很熟悉，那就是深度学习框架。在几年前，我们就专门讨论过深度学习框架独立自主的战略意义，今天来看已经一一应验。而国产深度学习框架发展到今天这个阶段，又出现了很多新的动向。在这个阶段我们需要的可能就不仅是简单的中美框架对标与扶持，而是更具有智慧、有策略，有合理产业节奏的方式去推动技术底座良性发展。

在此过程中，盲目执行平均主义的资源分配和产业推动，可能是最大的问题。进入深度学习框架发展新阶段，合适的产业策略应该是既期待和推动百花齐放，又能找到成为栋梁之材的佳木。

皆木皆花不是景。只有内在系统完善，发展机制合理的生态系统，才能培育起茁壮的中国 AI 丛林。

名实陷阱：深度学习框架发展新阶段，需要警惕什么？

在产业 AI 不断发展的今天，AI 底层技术工具和平台受到了社会各界，乃至世界各国的普遍重视。但在相关产业成果不断涌现的过程里，也势必因为 AI 技术是全新事物，缺乏产业通行的判断标准，导致政府、资本、媒体、产业，各领域的话语表达方式不一致，彼此理解差异很大，这导致后续行动的依据也不同。

举个例子，众多技术平台和工具进入大众视野，基本都会冠以首个、独家、突破这类的字眼。搭配上看似强大的资本与团队背景，很容易让行业外人士产生过高的心理预期。无论在芯片、操作系统，还是 AI、大数据领域，我们已经见过太多类似的问题，甚至闹剧。这类现象可以称之为自主科技产业上的“名实陷阱”。

这就像铁和金都是金属，但价值显然不同。但由于大众层面缺乏对科技产业的专业认知，就很难辨别名称相近平台的实际差异。

这一点在深度学习框架的发展中，也已经开始体现。今年以来，不仅谷歌 TensorFlow、Facebook 的 PyTorch、亚马逊的 MXNet 三大美国框架不断更新，国内很多深度学习框架也宣布向业界开源开放。比如一流科技自研的 Oneflow 深度学习框架、旷视科技的深度学习框架天元（MegEngine）等等。当然，每个框架背后都充斥着开发者的梦想和心血，也会在一些训练任务上展现出独特的优势。但如果我们横向对比这些新框架，会发现它们在核心技术、工具完整性、生态布局上有些参差不齐的缺失，甚至达不到国内老大哥“飞桨”的标准。那么如果从政策、资本、产业合作等层面都给予同样的赋能，显然会造成无差别大水漫灌的问题。

（飞桨全景图体现了全面的核心技术与完整的工具集）

事实上，到底如何定义什么是完整的深度学习框架，是一个非常专业化的产业问题。比如早在 2018 年，阿里开源了旗下的 X-Deep Learning，称其为“业内首个面向高维稀疏数据场景的深度学习开源框架”。而事实上 XDL 只能面向高维稀疏数据场景这一种需求，能力范围狭小，很快也就在开发者中不见了踪影。

同样的窘境在新近开源的深度学习框架中体现的尤为明显，像 Oneflow 这类技术轻骑兵，往往只针对单一的产业需求，会出现能力范围和工具性、生态性、产业特性的欠缺。而深度学习框架作为 AI 时代的操作系统，又恰恰是需要聚少成多、长期积累的领域。如果引导产业和开发者无差别入驻，那么显然会造成内部凝聚力失衡，无法形成有效生态的问题。

那么是否有办法，在产业周期中建立一个关于深度学习框架的判断机制呢？

三维模型：如何建立 AI 产业的价值判断机制？

我们当然不会认为深度学习框架一定就是老的好、新的差，或者强者恒强，大者通吃。也不认为新型深度学习框架就没有出现的必要，或者缺乏产业机遇。恰恰相反，百花齐放的产业形态是业界开始兴旺的表现。只是我们认为无论在产业政策、资本扶持，抑或产业合作上，都应该建立标准化、多元化的价值评判机制，引领深度学习框架向合理性、高效率发展。避免平均主义造成资源浪费，也避免大众听到创新和独立字样都等而视之，造成公共情绪的错误引导。

回归到深度学习框架领域，一个健康的价值判断模型，需要检测多个维度来审视一款产品或者平台的发展：

首先，在当前的科研大环境下，核心技术自主权和底层技术自主可控的价值已经非常明显。政策制定者、产业各界与媒体，应该坚定支持国产框架发展，甚至推动 AI 产业生态从美国框架向国产框架迁移，毕竟在目前的局势下，谁也无法判断下一个断供的是不是 TensorFlow。

然而，仅仅下载使用来支持是不够的，就像操作系统一样，深度学习框架本身难度很大，但更具挑战性的是生态的发展和汇集。相关政策与产业标准，也应该更加关注 AI 开发者生态，围绕生态需求制定针对性推动策略。在这方面，一个显著的指标就是开发者的数目，这能直观地体现生态繁荣程度，就拿飞桨举例，它已经凝聚超过 210 万开发者，而且正在通过自己的生态化规模将 AI 能力拓展到各行业，在产业阶段，理应得到更高的重视。

最重要的是，深度学习框架要体现出对国家经济转型升级的推动力，按现在的政策，就是深度学习框架是否能够负载今天新基建周期中，产业智能化带给深度学习框架的工业级承载需求。这个标准又包含几个部分，比如核心技术的完整、领先，能够负载大规模深度学习；另一方面是平台体系与技术能力对于工业化大生产领域的支撑能力。但大部分的深度学习框架交出来的成绩单都还没达到要求，要么是覆盖面狭窄，要么是企业不满意。如果向飞桨看齐，它已经覆盖通信、电力、城市管理、民生、工业、农业、林业、公益等众多行业和领域，在疫情期间也落地大显身手，目前已有 9 万家企业通过飞桨创建了超过 29.5 万个模型，这些产业指标，显然是深度学习框架价值的最好判断标准，也是后来者亟需突破的方向。

在深度学习框架走向百花齐放的当口，我们希望能够避免眉毛胡子一把抓，达成重点分明、产业逻辑清晰的扶持策略与产业引导行为。

产业策略：推动 AI 底座整体发展的当务之急

对于 AI 基础设施来说，百花齐放的产业形态，甚至开发者纯粹兴趣式的创造都非常具有价值。但如果我们的目标是发展符合社会经济需求的工业化 AI 底座，通过新基建推动产业智能整体发展，那么就需要制定详实、完整的产业策略，推动深度学习框架与众多 AI 基础设施一道，向 AI 工业化大生产发展。在这样的目标下，有几件当务之急值得多加重视：

首当其冲的是，重点发展一个体系，有策略进行平台、数据、开发生态的打通。最佳方案是以发展度最好的深度学习框架为依托，有效整合再创新，与产业沟通，避免重复发明轮子，防止政策扶植、资本、社会舆论的资源错置或浪费。同时积极推动国产化、自主可控的深度学习框架发展。当然不是说要刻意规避美国优秀技术成果，但在目前阶段和国际形势下，积极推动甚至政策推动深度学习框架国产化、自主化，似乎已经是题中应有之义。

（国务院印发的《新一代人工智能发展规划》也提到了扶持深度学习框架的目标）

其次，技术评判标准的建立，是细化核心技术发展目标的关键一步。将深度学习框架拆解为更为详细的产业维度，厘清各平台的优劣势与发展所处阶段，是目前政府和业界需要共同完成的任务。例如深度学习框架能否保持高频升级迭代节奏，来解决产业不断涌现的新问题？核心框架的开发能否变得越来越便捷，让开发者和企业更容易上手？更别说需要大量具有突破性的新技术，来满足产业智能化转型过程中面临的门槛与痛点。在这些问题上，飞桨做的比较好，他们具备突出优势，核心技术发展方向也很明确，可以有效帮助产业快速发展，让社会资源对平台的价值判定更具标准化方案。

而且从另一个方向上看，不同的框架处在不同的发展周期，自然也需要不同的发展推动力。比如飞桨在产业核心能力上的特性、开发生态与产业应用上的积累，目前是其他框架所不具备的。建立关键技术的

『本文转载自网络,版权归原作者所有,如有侵权请联系删除』