python高级数据分析基础知识:numpy与pandas及其基本应用总结整理

本文整理了用python数据分析(基于numpy和pandas)的基本知识和应用实例,每个知识点都给出了各自博文的超级链接,便于读者查阅。

一、numpy及其基本应用总结整理

1.1 创建ndarray数组
1.1.1 python中使用np.array(list)方法来创建ndarray数组
1.1.2 python中创建二维的ndarray数组
1.1.3 python用np.ones和np.zeros创建全一和全零数组
1.1.4 python中用arange方法对ndarray数组进行连续序列赋值

1.2 读取ndarray数组中的数据
1.2.1 python中ndarray数组的索引和切片

1.3 获取ndarray数组的参数
1.3.1 python中使用ndim和shape属性获取ndarray数据的维度、长度、形状等参数

1.4 对ndarray数组数据进行操作
1.4.1 python中ndarray数组的转置和改造(reshape)
1.4.2 python中使用data.sort()方法对ndarray数据进行排序操作

1.5 对ndarray数组数据进行运算
1.5.1 python中对ndarray数组中每个元素进行一元运算:np.operator(data)
1.5.2 python中对一对ndarray数组进行对应元素的二元运算:np.operator(data1,data2)
1.5.3 python中对ndarray数组元素进行统计学运算:np.method(data)

1.6 numpy文件读取
1.6.1 python中使用np.genfromtxt()方法读取.txt文件中的数据

1.7 numpy应用实例
1.7.1 使用numpy中的方法从500万条数据中统计10000本书的平均得分
1.7.2.numpy中对随机数据矩阵进行归一化处理

二、Pandas及其基本应用总结整理
Series篇
2.1 创建Series数据
2.1.1 Series数据的基本概念、结构与新变量的创建
2.1.2 python使用字典数据生成Series数组并用isnull/notnull方法检测是否为空
2.1.3 通过name属性给Series对象和索引命名
2.2 读取Series数据
2.2.1 python中获取Series数组中的值(单个元素或者切片元素)
2.3 Series数组的操作
2.3.1 使用data.value_counts()方法对Series数组中的重复元素进行统计
2.3.2 python用in关键词判断某个数是否存在于Series的索引(index)中
2.3.3 对Series数组进行一元及二元数学运算
DataFrame篇
2.4 创建DataFrame
2.4.1 创建DataFrame:python中用字典初始化DF数据帧
2.4.2 python中使用columns参数指定DataFrame数据帧的列(字段)顺序
2.4.3 python使用index参数设置每一行的索引名
2.5 DataFrame的增删改查
2.5.1 python中用columns参数获取DataFrame各列的表头名
2.5.2 python中DataFrame的“增删改查”之“查”:用columns参数获取DF数据中的某一列数据
2.5.3 DataFrame的“增删改查”之“查”:用iloc()/loc()方法获取DF数据中的某一行数据
2.5.4 DataFrame的“增删改查”之“查”:用index和column参数定位的组合查询具体某个坐标的元素
2.5.5 python中DataFrame的切片:用.copy获取DF数据的某一列数据副本
2.5.6 DataFrame数据帧的多级索引
2.5.7 DataFrame的“增删改查”之“改”:修改DF数据帧中的某一列数据
2.5.8 DataFrame的“增删改查”之“删”:用del指令删除DF数据中的某一列数据
2.5.9 DataFrame的“增删改查”之“删”:用drop()方法删除DF数据中的某一行数据

2.6 DataFrame的数据操作
2.6.1 redindex()方法:对DataFrame数据帧的行进行重新排列
2.6.2 用dropna()/fillna()来清洗(删除或者填充)DataFrame中的Na数据
2.6.3 python中DataFrame数据帧的筛选:使用布尔表达式返回是否引用序列
2.6.4 python中用gourpby()方法DataFrame数据帧进行分组
2.6.5 DataFrame中的groupby分组对象是个什么东东
2.6.6 .sort_index()方法对DataFrame数据帧进行排序
2.6.7 .sort_values()方法对DataFrame数据帧进行排序
2.6.8 python中DataFrame数据帧的统计方法
2.6.9 python中用merge方法对两个DataFrame进行合并

2.7 Pandas的文件操作
2.7.1 python用pd.read_csv()方法来读取csv文件
2.7.2 python中用.to_csv(“filename”)方法将DataFrame数据帧存储为.csv文件
2.7.3 python用pandas库读取excel中的文件存入DataFrame数据帧中
2.7.4 pd.read_csv方法读csv文件时使用index_col参数设置第一列作为index

2.8 DataFrame应用实例
2.8.1 全脑拆记单词小工具:英文单词伪意生成器项目
2.8.2 用pandas在海量数据中找出最热的50本书和最热的10个标签
2.8.3 整理今日A股涨跌幅排行榜前10信息

你可能感兴趣的:(python高级数据处理方法)