数据分析与可视化概述

                                                                                                                

目录

一、数据分析

二、数据可视化

三、数据分析与可视化常用工具

四、为什么用python进行数据分析与可视化

爬取数据需要  Python 

数据分析需要 Python

Python 语言简单高效

五、Python 数据分析与可视化常用库

1、Numpy   

2、Pandas

3、Matplotlib

4、SciPy

5、Seaborn

6、Scikit-learn

六、Juypter Notebook 工具


笔记:           

一、数据分析

        数据分析是数学与计算机科学相结合的产物,是指使用适当的统计分析方法对搜集来的大量数据进行分析,提取有用信息并形成结论,从而对数据加以详细研究和概述总结的过程。

数据分析有狭义与广义之分。狭义的数据分析是根据分析目的,采用对比分析、分组分析、交叉分析和回归分析等分析方法,对搜集来的数据进行处理与分析,提取有价值的信息,发挥数据的作用,并得到一个特征统计量结果的过程。一般常说的数据分析就是指狭义的数据分析。而广义的数据分析是指对搜集来的数据运用基础探索、统计分析、深层挖掘等方法。发现数据中有用的信息和未知的规律与模式,进而为下一步的业务决策提供理论与实践依据。可以认为:广义包括狭义与数据挖掘

二、数据可视化

简单来说,数据可视化就是将数据或信息编码为图形或图像, 以图形化方式表示数据,让决策者可以通过图形直接地看到数据分析结果,从而更容易理解业务变化趋势或发现新的业务模式。

三、数据分析与可视化常用工具

  • Excel

  • R 语言

  • Python 语言

  • JavaScript 

  • PHP

四、为什么用python进行数据分析与可视化

  1. 爬取数据需要  Python 

     Python 是目前最流行的数据爬虫语言
  2. 数据分析需要 Python

    数据获取后,需要对数据进行清洗和预处理,清洗完成后还要进行数据分析和可视化。而Python提供了大量的第三方数据分析库,例如:Numpy。Pandas、Matplotlib......

  3. Python 语言简单高效

    Python语言简单高效,易学易用,让数据分析师摆脱了程序本身语法规则的”泥潭“

五、Python 数据分析与可视化常用库

1、Numpy   

NumPy最重要的一个特点就是其N维数组对象(即ndarray),该对象是一个快速而灵活的大数据集容器。可以利用这种数组对整块数据执行一些数学运算,比python自带的数组以及元组效率更高,其语法跟变量元素之间的运算一样,无需进行循环操作。极大地简化了向量和矩阵的操作处理方式。

2、Pandas

它是基于NumPy的一种工具,提供了大量便捷处理数据的函数和方法。Pandas主要的数据结构有:Series、DataFrame、Panel。

3、Matplotlib

Matplotlib 是 Python 的绘图库

4、SciPy

SciPy 是基于 NumPy 开发的高级模块,提供了许多数学算法和函数的实现。例如:处理插值、最优化、图像处理、数值积分和微分方程的求解、信号处理等问题。

5、Seaborn

Seaborn 是在 Matplotlib 的基础上提供了一个绘制统计图形的高级接口,Matplotlib 最大的困扰是其默认的各种参数,而 seaborn 则完全避免了这一问题,一般来说 seaborn 能满足数据分析90%的绘图需求。

6、Scikit-learn

Scikit-learn 是专门面向机器学习的 Python 开源框架,它的基本功能有:分类、回归、聚类、数据降维、模型选择、数据预处理六大部分

六、Juypter Notebook 工具

安装:jupyter notebook安装及修改其文件保存路径_抄代码抄错的小牛马的博客-CSDN博客_怎么查看jupyter的安装路径目录下载安装jupyter notebook官网下载pip 下载启动与修改文件保存路径学习记录~~~下载安装jupyter notebook官网下载Project Jupyter | Home这个我试了下,很慢的。pip 下载首先,pip下载的话,我们要进入到 python 的Scripts,pip 这个就是我们下载的依赖:cmd命令下进入Scripts路径:win + r 后输入 cmd 2.c...https://yuanxinghua.blog.csdn.net/article/details/123672978?spm=1001.2014.3001.5502

快捷键:jupyter notebook常用快捷键_u013250861的博客-CSDN博客_jupyter notebook快捷键使用前需要进行安装:pip install jupyter (前提是你已经安装好Python,并将python添加到环境解释器中)安装完成之后,因为python已经添加至环境变量中,所以直接使用 jupyter notebook即可启动,如果你想要打开ipynb结尾的文件,直接在cmd控制台将用cd切换到ipynb结尾的文件所在的目录即可!Jupyter Notebook 有两种键盘输入模式。编辑模式,允许你往单元中键入代码或文本;这时的单元框线是绿色的。命令模式,键盘输入运行程序命令;这时的单元https://blog.csdn.net/u013250861/article/details/122987372

你可能感兴趣的:(数据分析与可视化,数据分析,数据挖掘)