Python数据分析_Pandas从入门到放弃(一)

Python数据分析_Pandas从入门到放弃(一)

为什么使用Python进行数据分析?

在进行数据分析的学习之前,我们先简单说一下为什么我们要选择Python进行数据分析。我们知道,进行数据的统计分析有很多种方法途径,像Excel、Tableau这些数据处理工具不仅能够快速处理数据,还拥有可视化的图形操作界面,用起来也是挺顺的。

有那么好的工具放着不用,那为什么我们还要使用纯代码的Python进行数据分析呢?

首先,Python这门语言容易学习并使用,代码比较人性化。(目前美国计算机科学十大顶级项目计划中有8个选择Python语言
其次,Python不仅是统计语言,它还具有数据采集、清理、数据库、高性能计算等全部功能。
再者,Python科学的生态系统。它的标准库中已经足够强大了,还能够安装第三方的库,进而实现更多功能。

学习使用Pandas的工具

很多编辑器都能够支持Python的运行,我们熟悉的pycharm、vscode等等都能够运行Python,但是在这里我们选择使用Jupyter Notebook进行Pandas的学习。

在使用Pandas处理数据时,我们都是一步一步“分进合击”地去进行对数据表格的处理。因此,jupyter notebook以代码块的形式运行更适合我们去一步一步处理数据,能够直接输出检查我们的代码呈现的结果是否为我们所想要的。

Pandas“熊猫”数据角力

Pandas能够处理大数据的高版本Excel+Tableau+更多(ML,AI,云端)
Pandas在处理数据ETL活:抽取(extract)、转换(transform)、加载(load)有优异的性能。

Pandas的备忘( Cheatsheet)

Syntax- Creating Data Frames -创建矩阵的数据表
Tidy Data-basic wrangling -数据清理(数据整理变量观察
Reshaping Data-change data layout -数据重塑
Subset Observations(rows& columns) -子数据集观察(指定行、列)
Summarize Data -数据描述摘要汇总( describe)
Group Data -数据分组
Handling Missing Data(NA/ null data) -处理丢失数据(NA/nul)
Make New Columns -新建列
Combine Data Sets -数据连结( join c,数据库)
Windows Plotting -窗口和可视化


收尾

关于Pandas的简单介绍就到这里,接下来会有对Pandas的基础操作、进阶操作以及实践训练使用pandas的各种函数的操作示例。

附上一张Pandas全功能的简介图。(些许模糊,原图svg 点击下载Python数据分析_Pandas从入门到放弃(一)_第1张图片

你可能感兴趣的:(Python数据分析)