数据分析知识介绍,数据分析模型选择和数据分析流程的介绍

相比于数据挖掘,数据分析更多在于利用一定的工具和一定的专业知识分析数据。最初的数据分析来源于统计学家和经济学家的一些理论,进而结合一定的实际应用场景解决问题。数据分析更多的是偏重于业务层次的,对于大多数非计算机相关专业人士来说,掌握一般的数据分析方法是十分有用的,入门上手也相对简单。

1 数学和专业的预备知识

概率论:数据分析的重要数学基础,要熟悉常见的一些概率分布。

统计学:数据分析最早的依赖基础,通常和概率论一起应用,数据分析要掌握常见的均值、方差、协方差等。

心理学:数据分析往往要结合不同的学科知识进行分析,在数据分析的过程中,分析人员往往要结合用户的心理进行结果的调整和分析。

专业知识:一般来说,数据分析人员是对某一特定领域进行分析,这就要求分析人员具备一定的行业的专业知识。

2 使用数据分析软件

SPSS:功能非常强大非常专业的数据统计软件,界面友好,输出结果美观漂亮。SPSS软件具有信息的采集、处理、分析进行全面评估和预测等功能。包含广义线性混合模型、自动线性模型、一个统计网页入口portal和直复营销direct marketing功能。

SAS: 是一个模块化、集成化的大型应用软件系统,由数十个专用模块构成,功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等等。

Excel:办公套件中最能胜任数据分析的软件,简单实用。

Sql:非计算机专业的数据分析人员要操作数据必备的数据库语言。

R: 近年兴起的数据分析编程语言,数据可视化做的比较好,语法简单,学习成本很低,很多非程序设计人员都可以数量掌握。

3 数据分析模型选取

数据分析人员可以借助一些现场的分析软件进行分析,这些软件集成了一些良好的分析模型,分析人员可以根据自己的实际应用场景进行合适的模型选择。基本的分析方法有:对比分析法、分组分析法、交叉分析法、结构分析法、漏斗图分析法、综合评价分析法、因素分析法、矩阵关联分析法等。高级的分析方法有:相关分析法、回归分析法、聚类分析法、判别分析法、主成分分析法、因子分析法、对应分析法、时间序列等。

4 分析结果展示

数据分析的结果通过一些可视化图形或者报表形式进行展示能够增强对分析结果的理解。常用的的分析结果展示方法有:

图表展示:用一些柱状图、饼图、盒图等进行展示。

曲线展示:运用走势曲线或者ROC曲线进行展示。

文字展示:通过语言文字描述进行结果的分析展示,但是不够直观。

5 数据分析的流程

5.1 数据获取

5.2 数据清洗

5.3 分析工具选取

5.4 数据分析模型选择

5.5 数据处理

5.6 处理结果展示

5.7 结果数据分析

6 数据分析的实例

6.1 使用SPSS做回归分析

6.2 使用分位数回归进行金融风险预测

人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:
1.大数据分析的4个核心概念
2.大数据时代,为大家推荐几款数据分析工具
3.网站数据分析的基本流程

你可能感兴趣的:(大数据,数据分析,数据可视化)