python数据分析 | 重新认识数据分析中的三剑客?

数据分析三剑客

数据分析就是让数据数据产生价值,通过数据的筛选、汇总等等操作从而分析或预测出事件的变化规律。python语言在数据分析领域同样扮演者比较强大的角色,其中被树枝的主要有三个扩展库用来做数据分析,分别是:pandas、numpy、matplotlib,其中,pandas主要是用作提炼数据使用、numpy则提供强大的科学计算、matplotlib负责数据可视化的操作,三者并成为python数据分析界的三大剑客。
前往 >> 【阅读原文】

pandas数据提炼库

在之前操作excel数据时已经接触过了pandas进行数据提炼的使用,它可以直接将excel文档中的数据读取过来并转换成python中的dataframe对象。直接对dataframe对象进行操作便可以完成对数据的操作,同时他也支持除excel之外的一些文件格式的数据读取、提炼的操作等,比如csv文件格式的数据提炼。提取符合条件的数据供后续的分析使用。

numpy科学计算库

numpy是一个处理数组模块、更是数据分析过程的核心,并且可以支持二维数组、实现矩阵等。
1)数组的创建
2)有关数组的属性和函数
3)数组元素的获取--普通索引、切片、布尔索引和花式索引
4)统计函数与线性代数运算
5)随机数的生成

matplotlib数据可视化库

matplotlib是数据可视化重要的工具,将分析的数据通过折线图、直方图、散点图等可视化的方式直接将数据的变化展示在用户的面前,给用来带来更直观的感受。
图片

总结

对数据分析三剑客有一个简单的认识,后续将逐步在编程实例中引入pandas,numpy,matplotlib的使用。

你可能感兴趣的:(python数据分析 | 重新认识数据分析中的三剑客?)