2018-12-15 数据分析简介

前言

作为一名优秀的光荣的生在新中国长在红旗下的菜鸟级别的不怎么牛掰的数据分析师,思考良久,我决定把自己学习的分享给出来,为学习数据分析的同学带来一些的思考,同时如果有什么不对的地方,还请潜水的大鸟指正,谢谢^_^~!从今天开始,我将不定期(如果不去钓鱼、采风、打豆豆的话)更新我对数据分析的理解!

1、为什么要数据分析?

人类的历史漫长而又悠远。从拎着棒子和石头打野兔的远古人类学会使用语言开始、到文字的创造、印刷术的发明、电话电报的普及应用再到如今的互联网信息时代。人类一路跌跌撞撞走来,信息从无到有,从少到多,经历了5次革命。21世纪被称为“信息化时代”,各种信息爆炸增长,人类面对浩如烟海的数据就如同在大海迷途的船只,找不到回家的路……数据分析应运而生!

2、什么是数据分析?

在学习数据分析之前,我们先得知道什么是数据分析(科学),数据分析能够做什么,我们应该以什么路线学习?


2018-12-15 数据分析简介_第1张图片
数据分析的三条腿

首先我们来看一下数据分析的组成数据分析由统计学(基础)、计算机科学(工具)、项目相关知识(业务)组成,三个部分唇亡齿寒、相辅相成!统计学是数据分析的理论基础,要学好数据分析,这个是重点;计算机科学是分析工具,常用的有mysql、excel、SPSS、R、Python、SAS等;项目相关知识即业务知识,是你进入某个行业后需要学习了解的东西。如果把数据分析比作做菜的话,那么统计学就是菜谱,指导我们怎么做;计算机科学就是锅碗瓢盆,谁都少不了;项目相关知识就是你要知道你的食客是哪里人,爱吃川菜还是粤菜,爱吃甜豆腐脑还是咸豆腐脑!

在贾俊平统计学第六版上对统计学的定义是:统计学(statistics)是一门收集、处理、分析、解释数据并从中得出结论的科学。

根据数据分析的组成以及统计学的定义,我个人对数据分析理解的定义是:数据分析(data analysis)是一门结合相关业务知识,利用计算机软件来收集、处理、分析、解释数据并从中得出结论的科学。个人愚见,望诸君酌之!

3、能够做什么?

明确问题,解决问题!详细点就是根据业务需求,通过分析各种数据,找到有用信息,来为公司战略发展和重要决策提供建议和支持。比如我之前做过一个电影推荐系统的项目,通过分析历史用户评分数据,对用户对某部电影的评分进行预测,将预测评分高于某个阈值的电影推荐给该用户!

4、数据分析(大致)流程是什么?

同样吧数据分析比作做菜,诸君且看!

    数据分析             做菜           介绍

    0)明确需求        今晚吃啥      业务部门给我们特定需求,我们整理分析思路

    1)数据收集        市场买菜      根据需求收集相关数据

    2)数据处理        洗净切块      将收集的数据整理成需要的格式,处理异常值缺失值等

    3)数据分析        埋锅造饭       进行分析

    4)数据展示        起锅摆盘      获得分析结果、可视化等

    5)数据报告        大快朵颐      根据分析结果,得出结论,应用于业务

以上就是数据分析大致流程,而我们的三大组成部分(统计、计算机、项目)涉及的知识贯穿整个流程!

好啦,这就是数据分析的简介,大家有任何的意见或指正都可以在下方留言哦,谢谢大家的观看!

你可能感兴趣的:(2018-12-15 数据分析简介)