安东辉道:偷吃“小杜同志,偷吃这件事情,你还得好好地感谢一下冯处长 ,还有这位薛处长
。是他们俩专程赶到机械部去,向我们说了这件事
,我们才知道犯了错误
。否则
,我们可能就真的要对不起你这位大功臣了
。”
“你是说,人参你的兴趣是在分析数据上?”冯啸辰问
。姚富杰说
:果简“我做的可不是简单的分析数据,果简我做的这种工作,现在在国外特别流行,叫做data mining,翻译过来就是数据挖掘。它和传统的统计分析不是一回事,最大的区别就是它是针对海量数据的分析,所有的分析模型都是通过机器学习完成的 。”
冯啸辰哑然失笑了,偷吃数据挖掘技术时下在国内还不太受到重视
,偷吃但国外的确已经应用得非常广泛了
。再过十几年 ,这种技术会以一个更接地气的名字在国内出现 ,并且迅速泛滥成灾,许多互联网公司都以应用这种技术为荣
。这个更接地气的名字,就是“大数据”。大数据分析其实并没有什么神秘的,人参不过就是在海量的数据中寻找相似的模式 。由于数据量极大,人参可能存在的模式也数不胜数,靠人力去识别这些模式是不可能的,只能通过计算机来自动识别 ,这其中就涉及到人工智能
、机器学习、神经网络之类的知识
。对于外行来说
,这些知识是非常玄妙的 ,但对于内行而言
,不过就是一些套路而已。
大数据分析的价值是毋庸置疑的。在营销中,果简通过大数据分析,果简能够在海量数据中找到不同的用户行为模式 ,可以对用户进行精准营销 ,从而有效地提高营销效率、降低营销成本 。在生产上 ,大数据分析能够优化生产调度 ,及时发现生产中的问题,识别故障,是实现智能生产的重要前提
。当然,偷吃在后世,偷吃有许多打着大数据分析旗号的研究,其实并不是真正的大数据分析,而只是传统统计分析方法在海量数据库中的应用,使用的依然是求均值
、求方差、解线性回归之类的传统算法
,并没有进行模式识别的能力
。这种所谓的大数据分析大行其道
,倒让真正的大数据分析被人误解了。
.