今天给大家分享下数据分析与数据挖掘之间的关系是怎么样的?本篇内容来源于书籍《数据分析与挖掘算法》,文末会免费送大家几本。
是不是有了数据分析基础以后更容易上手数据挖掘?在学习路径方面又需要注意些什么呢?
数据分析是指用适当的统计方法对收集的海量数据进行分析、提取有用的信息和形成结论,然后对数据加以详细研究和概括总结的过程。
有些人将数据分析划分为描述性数据分析、探索性数据分析和验证性数据分析。
其中,探索性数据分析侧重于在数据之中发现新的特征,而验证性数据分 析则侧重于对已有假设的证实或证伪。
数据挖掘一般是指从海量的数据中通过相应的算法,挖掘其中有价值(未知的、有规律的)的信息的复杂过程。
许多人把数据挖掘看作另一个常用的术语“KDD (Knowledge Discovery in Database)”的同义词,而还有一些人只是把数据挖掘看作KDD 过程中的一个基本步骤。
KDD 可直译为“基于数据库的知识发现”(简称“知识发现”),是指从海量的数据中提取有效的、新颖的、 潜在有用的、最终可被理解的模式的过程,如下图所示为KDD 过程。
数据挖掘是深层次的数据分析,数据分析是浅层次的数据挖掘,数据挖掘更偏重于探索性数据分析,因为数据挖掘的重点是从数据中发现知识规律。
它们的具体区别如下:
(1)数据分析处理的数据量可能不大;而数据挖掘处理的数据量极大, 并且特别擅长处理大数据,尤其是几十万行、几百万行,甚至更多的数据。
(2)数据分析往往是从一个假设出发,需要自行建立方程或模型来与假设吻合;而数据挖掘不需要假设,可以自动建立方程,比如关联规则和聚类分析。
(3)数据分析往往处理数值型数据;而数据挖掘能够处理不同类型的数据,比如声音、文本等。
(4)数据分析主要侧重于通过观察数据来对历史数据进行统计学分析;而数据挖掘通过从数据中发现“知识规律”来对未来的某些可能性做出预测分析,其更注重分析数据间的内在联系。
(5)数据分析与数据挖掘的区别更多地体现在职业方向上。相对数据挖掘工程师,数据分析师与业务方的工作衔接更多,理解与梳理业务诉求、 明确业务目的和指导模型搭建是数据分析师的主要工作;而模型搭建与参数调优则是数据挖掘工程师的工作。
其实,在很多情况下,数据分析与数据挖掘是“同源同根”的。也就是说,数据分析与数据挖掘没有明确的界限。
如果想从数据中提取一定的规律(即认知),则往往需要将数据分析和数据挖掘结合使用。因为在计算机中,数据都是以0和1的形式进行存储的,从这个层面上讲,数据分析的范畴更大一些。
而在以上区别(5)中所说的两者不同的分工也是在大公司中会分得比较明确,如果是在中小公司中,(5)中所说的工作都是由一个人完成的。
所以,想要学习数据挖掘肯定还是需要有相关的数据分析基础。
那么,怎样可以高效快速地掌握数据分析和数据挖掘呢?
大家在搜索学习方法时,肯定会发现要学习的东西很多,不仅要掌握分析工具、分析语言,还要学习统计学、机器学习算法等等。
虽然这些确实是需要掌握的内容,但也都只是实现某种业务目的的工具。想要真正做好数据分析和数据挖掘,使其真正赋能实际业务,具备良好的数据思维才是关键。
《数据分析与挖掘算法:Python实战》一书便深刻阐述了数据思维的重要性,并将数据思维上升到哲学高度。
此外,本书也对从数据处理到数据分析进行了全流程说明,对经典的数据挖掘算法从理论到Python实践逐步深入讲解,使读者不仅知其然知其所以然,也使读者可以联系生活中的例子进行实操。
一本书,讲明了数据分析与挖掘的重点,帮你从底层扎实地建立起知识框架,带你快速体验实践数据分析与挖掘的乐趣,非常值得想要学习数据分析与挖掘的读者入手!
(京东满100减50,快快扫码抢购吧!)
老规矩,还是免费送大家几本,给本篇文章点赞或点在看,然后在公众号后台回复“已点在看”,附上截图,会随机抽取4名,各送《数据分析与挖掘算法》新书一本。周三(12.1)晚9:00开奖。