重要的Python库--《利用Python进行数据分析》的学习笔记

学习《利用Python进行数据分析》第2版,一些笔记将在后续更新

内容引用于《利用Python进行数据分析》第2版,Wes McKinney著,徐敬一译

重要的python库

1. NumPy

http://numpy.org
提供多种数据结构、算法以及大部分涉及python数值计算所需的接口。

2. pandas

提供了高级数据结构和函数。
书中主要使用的pandas对象是DataFrame,主要实现表格化、面向列、使用行列标签的数据结构;Series一种一维标签数组对象。

3. matplotlib

流行用于制图及其他二维数据可视化的python库。

4. SciPy

科学计算领域针对不同标准问题域的包集合。

5. scikit-learn

机器学习工具包,专注于预测。

  1. 分类:SVM、最邻近、随机森林、逻辑回归等
  2. 回归:Lasso、岭回归等
  3. 聚类:k-means、谱聚类等
  4. 降维:PCA、特征选择、矩阵分解等
  5. 模型选择:网格搜索、交叉验证、指标矩阵
  6. 预处理:特征提取、正态化

6. statsmodels

统计分析包,专注于统计推理,提供不确定性评价和p值参数。

附:

安装Anaconda,使用pycharm开发环境

NumPy基础学习笔记–使用方法及代码示例

matplotlib学习笔记(一)几种绘图方法,颜色,标签,图例等

pandas入门笔记 Series和DataFrame的基础学习

如有错误,请多指教
谢谢大家!

你可能感兴趣的:(python数据分析,python,数据分析)