工业控制 > 工业自动化 > 详情

机器学习最后拼的到底是什么?不是算法,而是数据!

发布时间:2023-09-01 发布时间:
|

算法、数据、算力对于人工智能学习的重要性早已被行业所认可,但是近来国外知名的人工智能学习的公司发现:实施某些特定算法使机器变得对某一数据或问题更加智能化,其实并不困难。简单的说就是算法让机器学习简化了!其实这一点都不难理解,因为近年来好用又便捷的算法解决方案真的是——用满天飞来形容一点都不为过!

 

 

So.机器学习的关键区分节点是什么呢?Yes,没错,就是我们所熟知的数据。海量数据易求,但是真正有价值的数据却不常见。对于科技公司而已,数据作为他们的核心资产,都是绝密一般的存在,各大企业之间的信息不对称与不平衡现象再常见不过。

 

而普通的企业如果想通过人工智能发展自身的业务则只能去寻求外部数据源或者自行采集,但这对于普通企业的运营成本来讲无疑是大大增加了,所以这并不是很现实。


真正有用的数据更具价值但是很稀少

因为绝大部分的企业几乎甚至根本没有他们所必须的数据,所以数据就成了彼此之间的竞争点。譬如,在过去我们习惯于使用通用会计准则来评估我们自身,但是这种方法更加针对的是实体资产与金融资产,以至于2013年诺奖直接颁给了资产定价理论?!但是在今天,也就仅仅过去了6年的时间,企业最有价值的贸易对象已经不仅仅是实体资产与金融资产了,更是软件和网络!

 

要知道在1975年的时候,有形资产占据市场份额高达80%多,但是到了2005年,无形资产就已经占据80%多的市场份额了。40年的时间,市场变化可谓是改天换地,资产类型重心也是从头到尾倒了个儿。如今科技公司已经早已不再热衷于卖空调搞饮料销售了,他们转而从事第三方的应用程序和软件服务等等,致力于更有价值的数据挖掘采集。

 

 

尽管数据采集的规模很大,但是有用的数据却是稀少的,这也就直接导致了市面价值和账面价值产别越来越大,为了改善这一区别,各大企业正努力尝试使用机器来学习辅助重要的商业决策。

 

经过不断的优化与完善结合科学的数据分析,机器给出的意见往往要优于昂贵的咨询顾问(又一个即将被干掉的岗位)尽管看起来很厉害的样子,但实际上我们可以悄悄告诉你:那些算法所需的核心的数据企业压根没有,所以看似花里胡哨的各种AI系统,实际上应用的还是那些陈旧的数据,由此可见,真正有价值的数据是多么的罕见。

 

人类学习知识还需要老师,更何况机器进行学习呢!无师自通?对于机器来讲,目前来看可以说是天方夜谭。尽管机器需要更大的信息源来进行学习,但是他们处理数据的规模和速度却是人类的所不能相比的。所以,从面上来看,企业间对于机器学习程序员以及AI项目启动时间的竞争实则就是对于数据新鲜度和广泛程度的竞争。

 


认真思考:你到底想知道什么

数据分析远不是简单的机器数据叠加,指望碰运气能找出自己所关心的信息区间显然是不现实的,但这却是很多企业的信息分析常态。有一点我们必须要明白:机器学习真正的优越性在于可以基于人类的经验甚至是不被理解的相关性,来建设一种更快、更准、更便于理解、犯错率更低的方法。

 

有意义的机器学习源自于不同的数据

如果你希望搭建有影响力有价值的机器学习应用,下面的三点意见知得参考:

 

1、专注于与众不同的真正有价值的数据。尽管机器学习需要大量数据,但是在前文当中我们已经说明了,真正能起到技术革新的是那些有价值的数据。

 

2、那么多的数据,真的有用么?在这点上我们想说明的是:数据有意义远大于数据全面!如果在决策的过程中那些大量的数据根本没有多少参考价值的话,那这些数据对于机器学习来讲基本上也就是废的。

 

3、从已有的信息数据出发。最善于利用机器学习的公司往往可以坚持一个独特的发展方向,从而找出那些做出重要决策的相关影响因素,反过来同样可以指导你去搜集何种数据以及应用何种技术。

 

 

2019年很明显处于软件时代,市场看起来很饱和嘛?显然不是,我们还需要更多真正有意义和有价值的数据,从而持续创造价值,由此看来,数据竞争才是机器竞争的核心所在。


 

『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

热门文章 更多
基于可拓控制算法的改进与仿真研究