三生三世之 数据挖掘

数据挖掘随着大数据的火爆,如今被大家所吹捧,企业的决策者想把它应用到整个业务流程中,想进入相关行业的小白们,恨不得明天就开始数据挖掘的工作,迈向事业的一个新高度……

在这里不妨和大家谈谈数据挖掘的三生三世

要想更多学习和交流关于数据分析、数据挖掘、spss、R语言、Python等的内容,欢迎加入交流群283296032

近些年随着计算机的飞速发展,一方面数据库技术使得企业产出了海量的数据,诞生了大批新的数据需求,但是其数据量的巨大使得传统的分析方法没办法满足需要。同时,人工智能和计算能力的发展也催生了一批全新的分析方法,如 Bootstrap(自助法)、Bayes(贝叶斯)方法与 MCMC(马氏链蒙特卡罗)方法、神经网络、遗传算法、树模型与随机森林等等。

在这些因素的相互作用下,一种新的分析方法论——数据挖掘方法论就应用而生了。

借用张老师的一句话:数据挖掘方法体系,一部分是新的,一部分是旧的,一部分是借的。

与传统的分析方法的区别就是,传统的方法对模型的适用条件有很高的要求,有严格的方法体系,要求慢工出细活;而数据挖掘方法,对理论的严谨性没有很高的要求,算法的细节可以是灰箱或者黑箱,其结果只要得到符合商业的要求就可。

比如消费者在上网时,往往会出现一些相关的购买推荐,这些推荐往往是基于你上次查询或购买的记录来推荐的,那么这些推荐商品大部分就是利用快速的数据挖掘算法筛选出来的,虽然准确率不高,很是简单粗暴,但网站还是更愿意使用这种2秒钟就能反馈给浏览者的弱关联算法,而不愿意采用10分钟才能计算出的准确结果的强关联算法,因为10分钟之后,买家早已不止干嘛去了。

要想更多学习和交流关于数据分析、数据挖掘、spss、R语言、Python等的内容,欢迎加入交流群283296032



你可能感兴趣的:(数据分析,数据挖掘,大数据,机器学习,人工智能)