最近,美国推动的一系列科技封锁政策让人瞠目结舌。我们习以为常的世界科技秩序,毫无疑问正在以肉眼可见的速度被改变甚至重构。
在这样的话语氛围下,底层技术自主可控开始成为社会各界的共识与推动方向。而在科技产业进程里,半导体与计算机操作系统代表着过去有亏欠、今天急于填补的技术门类,也就是我们在今天能够清晰感受到被“卡脖子”的那些技术。而另一类则是中美大体处在齐头并进阶段,需要积极发展的“未来技术”。所谓昨日因今日果,如果我们不希望未来再次被卡脖子,那么今天这类技术也必须保持独立可控,甚至高速发展反超欧美——AI 技术就是这个领域的代表。
(去年 GitHub 就突然限制克里米亚、古巴、朝鲜、伊朗和叙利亚等国家用户访问)
在发展 AI 技术的进程里,最关键的开发底座相信读者已经很熟悉,那就是深度学习框架。在几年前,我们就专门讨论过深度学习框架独立自主的战略意义,今天来看已经一一应验。而国产深度学习框架发展到今天这个阶段,又出现了很多新的动向。在这个阶段我们需要的可能就不仅是简单的中美框架对标与扶持,而是更具有智慧、有策略,有合理产业节奏的方式去推动技术底座良性发展。
在此过程中,盲目执行平均主义的资源分配和产业推动,可能是最大的问题。进入深度学习框架发展新阶段,合适的产业策略应该是既期待和推动百花齐放,又能找到成为栋梁之材的佳木。
皆木皆花不是景。只有内在系统完善,发展机制合理的生态系统,才能培育起茁壮的中国 AI 丛林。
名实陷阱:深度学习框架发展新阶段,需要警惕什么?
在产业 AI 不断发展的今天,AI 底层技术工具和平台受到了社会各界,乃至世界各国的普遍重视。但在相关产业成果不断涌现的过程里,也势必因为 AI 技术是全新事物,缺乏产业通行的判断标准,导致政府、资本、媒体、产业,各领域的话语表达方式不一致,彼此理解差异很大,这导致后续行动的依据也不同。
举个例子,众多技术平台和工具进入大众视野,基本都会冠以首个、独家、突破这类的字眼。搭配上看似强大的资本与团队背景,很容易让行业外人士产生过高的心理预期。无论在芯片、操作系统,还是 AI、大数据领域,我们已经见过太多类似的问题,甚至闹剧。这类现象可以称之为自主科技产业上的“名实陷阱”。
这就像铁和金都是金属,但价值显然不同。但由于大众层面缺乏对科技产业的专业认知,就很难辨别名称相近平台的实际差异。
这一点在深度学习框架的发展中,也已经开始体现。今年以来,不仅谷歌 TensorFlow、Facebook 的 PyTorch、亚马逊的 MXNet 三大美国框架不断更新,国内很多深度学习框架也宣布向业界开源开放。比如一流科技自研的 Oneflow 深度学习框架、旷视科技的深度学习框架天元(MegEngine)等等。当然,每个框架背后都充斥着开发者的梦想和心血,也会在一些训练任务上展现出独特的优势。但如果我们横向对比这些新框架,会发现它们在核心技术、工具完整性、生态布局上有些参差不齐的缺失,甚至达不到国内老大哥“飞桨”的标准。那么如果从政策、资本、产业合作等层面都给予同样的赋能,显然会造成无差别大水漫灌的问题。
(飞桨全景图体现了全面的核心技术与完整的工具集)
事实上,到底如何定义什么是完整的深度学习框架,是一个非常专业化的产业问题。比如早在 2018 年,阿里开源了旗下的 X-Deep Learning,称其为“业内首个面向高维稀疏数据场景的深度学习开源框架”。而事实上 XDL 只能面向高维稀疏数据场景这一种需求,能力范围狭小,很快也就在开发者中不见了踪影。
同样的窘境在新近开源的深度学习框架中体现的尤为明显,像 Oneflow 这类技术轻骑兵,往往只针对单一的产业需求,会出现能力范围和工具性、生态性、产业特性的欠缺。而深度学习框架作为 AI 时代的操作系统,又恰恰是需要聚少成多、长期积累的领域。如果引导产业和开发者无差别入驻,那么显然会造成内部凝聚力失衡,无法形成有效生态的问题。
那么是否有办法,在产业周期中建立一个关于深度学习框架的判断机制呢?
三维模型:如何建立 AI 产业的价值判断机制?
我们当然不会认为深度学习框架一定就是老的好、新的差,或者强者恒强,大者通吃。也不认为新型深度学习框架就没有出现的必要,或者缺乏产业机遇。恰恰相反,百花齐放的产业形态是业界开始兴旺的表现。只是我们认为无论在产业政策、资本扶持,抑或产业合作上,都应该建立标准化、多元化的价值评判机制,引领深度学习框架向合理性、高效率发展。避免平均主义造成资源浪费,也避免大众听到创新和独立字样都等而视之,造成公共情绪的错误引导。
回归到深度学习框架领域,一个健康的价值判断模型,需要检测多个维度来审视一款产品或者平台的发展:
首先,在当前的科研大环境下,核心技术自主权和底层技术自主可控的价值已经非常明显。政策制定者、产业各界与媒体,应该坚定支持国产框架发展,甚至推动 AI 产业生态从美国框架向国产框架迁移,毕竟在目前的局势下,谁也无法判断下一个断供的是不是 TensorFlow。
然而,仅仅下载使用来支持是不够的,就像操作系统一样,深度学习框架本身难度很大,但更具挑战性的是生态的发展和汇集。相关政策与产业标准,也应该更加关注 AI 开发者生态,围绕生态需求制定针对性推动策略。在这方面,一个显著的指标就是开发者的数目,这能直观地体现生态繁荣程度,就拿飞桨举例,它已经凝聚超过 210 万开发者,而且正在通过自己的生态化规模将 AI 能力拓展到各行业,在产业阶段,理应得到更高的重视。
最重要的是,深度学习框架要体现出对国家经济转型升级的推动力,按现在的政策,就是深度学习框架是否能够负载今天新基建周期中,产业智能化带给深度学习框架的工业级承载需求。这个标准又包含几个部分,比如核心技术的完整、领先,能够负载大规模深度学习;另一方面是平台体系与技术能力对于工业化大生产领域的支撑能力。但大部分的深度学习框架交出来的成绩单都还没达到要求,要么是覆盖面狭窄,要么是企业不满意。如果向飞桨看齐,它已经覆盖通信、电力、城市管理、民生、工业、农业、林业、公益等众多行业和领域,在疫情期间也落地大显身手,目前已有 9 万家企业通过飞桨创建了超过 29.5 万个模型, 这些产业指标,显然是深度学习框架价值的最好判断标准,也是后来者亟需突破的方向。
在深度学习框架走向百花齐放的当口,我们希望能够避免眉毛胡子一把抓,达成重点分明、产业逻辑清晰的扶持策略与产业引导行为。
产业策略:推动 AI 底座整体发展的当务之急
对于 AI 基础设施来说,百花齐放的产业形态,甚至开发者纯粹兴趣式的创造都非常具有价值。但如果我们的目标是发展符合社会经济需求的工业化 AI 底座,通过新基建推动产业智能整体发展,那么就需要制定详实、完整的产业策略,推动深度学习框架与众多 AI 基础设施一道,向 AI 工业化大生产发展。在这样的目标下,有几件当务之急值得多加重视:
首当其冲的是,重点发展一个体系,有策略进行平台、数据、开发生态的打通。最佳方案是以发展度最好的深度学习框架为依托,有效整合再创新,与产业沟通,避免重复发明轮子,防止政策扶植、资本、社会舆论的资源错置或浪费。同时积极推动国产化、自主可控的深度学习框架发展。当然不是说要刻意规避美国优秀技术成果,但在目前阶段和国际形势下,积极推动甚至政策推动深度学习框架国产化、自主化,似乎已经是题中应有之义。
(国务院印发的《新一代人工智能发展规划》也提到了扶持深度学习框架的目标)
其次,技术评判标准的建立,是细化核心技术发展目标的关键一步。将深度学习框架拆解为更为详细的产业维度,厘清各平台的优劣势与发展所处阶段,是目前政府和业界需要共同完成的任务。例如深度学习框架能否保持高频升级迭代节奏,来解决产业不断涌现的新问题?核心框架的开发能否变得越来越便捷,让开发者和企业更容易上手?更别说需要大量具有突破性的新技术,来满足产业智能化转型过程中面临的门槛与痛点。在这些问题上,飞桨做的比较好,他们具备突出优势,核心技术发展方向也很明确,可以有效帮助产业快速发展,让社会资源对平台的价值判定更具标准化方案。
而且从另一个方向上看,不同的框架处在不同的发展周期,自然也需要不同的发展推动力。比如飞桨在产业核心能力上的特性、开发生态与产业应用上的积累,目前是其他框架所不具备的。建立关键技术的
『本文转载自网络,版权归原作者所有,如有侵权请联系删除』