这些分析工具都分不清?别说你懂数据分析!

举一个例子,铅笔、钢笔、圆珠笔、水彩笔、中性笔,它们的区别是什么?

同理,spss、sas、excel 、python、powerbi ,这些常见的数据分析工具有什么区别?

很显然,这两个问题是有共性的。这些都是数据处理类工具,但在功能侧重点是各有不同的:

Python - 通用编程语言,其中包含的数据处理类库可用于数据科学类分析

excel - 一般数据量处理的办公软件

SAS - 金融投资数据建模常用工具之一

SPSS - 经典统计学数学工具

Power BI - 以数据模型以及语义层为核心的商业智能工具

让我们具体来看看,它们的使用场景是怎样,方便大家能够最简单高效选择适合自己的分析工具。

这些分析工具都分不清?别说你懂数据分析!_第1张图片

python

关键词: 编程语言

频次: 高频工具技能要求之一

特点: 语言简单,具有数据结构化优势

场景: 编程类数据分析

难度: 一般

严格意义来说,python和其他几类不属于同一类,它是是编程语言,编程界有句至理名言,“人生苦短,我用Python”,没有python不能编地东西,有种“万物皆可盘”的意味。

主要优点:

1、简单:Python是一种代表简单主义思想的语言。阅读一个良好的Python程序就感觉像是在读英语一样。它使你能够专注于解决问题而不是去搞明白语言本身。

2、易学:Python极其容易上手,因为Python有极其简单的说明文档 。

3、速度快:Python 的底层是用 C 语言写的,很多标准库和第三方库也都是用 C 写的,运行速度非常快。

3、免费、开源:Python是FLOSS(自由/开放源码软件)之一。使用者可以自由地发布这个软件的拷贝、阅读它的源代码、对它做改动、把它的一部分用于新的自由软件中。FLOSS是基于一个团体分享知识的概念。

4、高层语言:用Python语言编写程序的时候无需考虑诸如如何管理你的程序使用的内存一类的底层细节。

5、可移植性:由于它的开源本质,Python已经被移植在许多平台上(经过改动使它能够工作在不同平台上)。

如何学习: 1、基本语法。包括数据类型和结构、变量、函数、逻辑语句(判断、循环)、匿名函数、错误处理、遍历和迭代、进程和线程、库的使用。

2、一定的代码训练量。网上找一些代码训练题目,大量刷题熟练基本语法。

3、基于Python语法的数据分析工具。包括scipy/numpy、pandas、matplotlib、scikit-learn。

补充:

scipy/numpy:它是一个由多维数组对象和用于处理数组的例程集合组成的库。

pandas:是基于NumPy 的一种工具,具备强大的数据展示功能。

matplotlib:可以生成各种硬拷贝格式和跨平台交互式环境的出版物质量数据。

scikit-learn:机器学习库,可以对数据进行分类,回归,无监督,数据降维,数据预处理等等

推荐书目:《利用python进行数据分析》

这些分析工具都分不清?别说你懂数据分析!_第2张图片

《python编程 从入门到编程》

这些分析工具都分不清?别说你懂数据分析!_第3张图片

Excel

关键词: 办公软件

频次: 数据分析普通技能

特点: 满足日常数据分析需求

场景: 一般数据量处理需求

难度: 简单

Excel是我们生活中最为常见的数据处理工具,功能太多,出版的书都够好几本新华字典了。但我们也没有必要完全学习所有的功能,有需则取即可。

这些分析工具都分不清?别说你懂数据分析!_第4张图片

主要优点:

1、数据透视功能:一个数据透视表演变出10几种报表,只需吹灰之力。

2、统计分析:其实包含在数据透视功能之中,但是非常独特,常用的检验方式一键搞定。

3、图表功能:这几乎是Excel的独门武功,其他程序望其项背而自杀。

4、高级筛选:这是Excel提供的高级查询功能,而操作之简单。非常超值享受。

5、自动汇总功能:这个功能其他程序都有,但是Excel简便灵活。

6、高级数学计算:只要一两个函数轻松搞定

如何学习:1、基本操作。作为数据分析最常用的分析工具,需要掌握基本功能,比如透视表 ,刷选, 多列排序,数据导入分隔符设置等。

2、数据可视化。数据可视化能够让我们的数据更为直观展现出来,excel中 折线图,直方图,双坐标图,甘特图等都需要熟练。

3、基本函数。函数的使用能大大提高我们的工作效率,尤其是在数据量相对较大时候。其中基本函数包括:IF、Round函数、INT函数、Vlookup函数等。

推荐书目:《为什么精英都是excel控》

这些分析工具都分不清?别说你懂数据分析!_第5张图片
这些分析工具都分不清?别说你懂数据分析!_第6张图片

SPSS

关键词: 统计分析工具

频次: 特定领域使用较多

特点:侧重于统计分析类模型

场景:在预测、建模、机器学习有很多包

难度: 一般

spss是学科数据定量分析的工具,所以在社会科学(如经济分析,市场调研分析)和自然科学等林林总总,几乎只要你想要稍微复杂点地看出一大串数据和各种表格之间的逻辑关系,都可以用spss做。不过对学习者的统计学能力要求较高。

这些分析工具都分不清?别说你懂数据分析!_第7张图片

主要优点:

1、操作简便:界面非常友好,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。

2、编程方便:只要了解统计分析的原理,无需通晓统计方法的各种算法,即可得到需要的统计分析结果。

3、功能强大:具有完整的数据输入、编辑、统计分析、报表、图形制作等功能

4、数据接口:能够读取及输出多种格式的文件。文本编辑器软件生成的ASCⅡ数据文件,Excel的*.xls文件等均可转换成可供分析的SPSS数据文件。

5、模块组合:SPSS for Windows软件分为若干功能模块。

6、针对性强:SPSS针对初学者、熟练者及精通者都比较适用。

如何学习:1、学好统计学基础。spsss作为学科定量分析工具,有一定的建模能力要求,所以学好统计学是根本。

2、熟悉spss界面。有了统计学基础后,利用spss工具可“傻瓜式”导入导出数据进行相关的线性分析等。

3、掌握建模分析思维。多了解相关分析模型,平时多积累理论知识点,丰富自己的知识架构。

推荐书目:《SPSS统计分析基础教程》

这些分析工具都分不清?别说你懂数据分析!_第8张图片
这些分析工具都分不清?别说你懂数据分析!_第9张图片

SAS

关键词: 统计分析工具

频次: 金融投资数据建模常用工具之一

特点: 金融大数据分析

场景: 金融风控建模较多

难度:较高

SAS大多应用于金融、保险、调研、研究所等领域,也是制药行业为开发和评估药物提供统计分析的商用软件。不过sas对学习者的专业性要求较高,需要具备一定的编程语言能力,和较深的统计学基础,可能不太适用于刚入门的小白学习。

这些分析工具都分不清?别说你懂数据分析!_第10张图片

主要优点:1、功能强大,统计方法齐。SAS提供了从基本统计数的计算到各种试验设计的方差分析,相关回归分析以及多变数分析的多种统计分析过程。

2、使用简便,操作灵活。SAS以一个通用的数据(DATA)步产生数据集,尔后以不同的过程调用完成各种数据分析。

3、提供联机帮助功能。使用过程中按下功能键F1,可随时获得帮助信息,得到简明的操作指导。

如何学习:

SAS包含了多个工具模块,其模块按功能主要掌握四类:1、数据库部分:BASE, FSP, ACCESS,..

2、分析核心:STAT, ETS, QC, OR, INSIGHT

3、开发呈现工具:AF, EIS, GRAPH,...

4、分布处理与数据仓库:CONNECT, WA,...

这些分析工具都分不清?别说你懂数据分析!_第11张图片

Power BI

关键词: 商业工具

频次:使用频次较高

特点: 开源,强调个性化与定制化

场景: 满足大量数据定制化分析需求

难度: 较高

Power BI是微软最新的商业智能(BI)概念,它包含了一系列的组件和工具。一提到它,很多人会拿tableau进行比较,我们可以简单来看一下。

与tableau比较:

1、tableau:操作简单,可视化;如果要在一个大企业内推广,tableau更容易,因为入门简单。但很多报表做不了。软件设计的太傻瓜,由几个大模块组成,导致了你想把大模块再细化,做不了。而且和ios一样,生态封闭。

2、powerbi:可以做复杂报表,筛选、计算逻辑清晰,可自定义,但很多功能要用DAX编小程序,托拉拽能实现的功能很有限,不易入门。和Android一样,生态开放。

推荐书目:《power BI商业数据分析项目实战》

这些分析工具都分不清?别说你懂数据分析!_第12张图片

总之,谈区别的时候,可以从目的和你的角色入手:你的目的是什么?你的角色是什么?

也许用哪一支笔都可以完成一篇文章,只不过是跟不跟手,费多大力的问题。

当搞清楚了自己的目的,选对角色,再谈具体的使用工具,这样也许工作效率会提高很多。

你可能感兴趣的:(这些分析工具都分不清?别说你懂数据分析!)