python 数据分析笔记

这里讲到的都是平时和sql,以及数据透视表十分类似的功能。数据分析会经常用到。

1.去重函数  .unique()

Input:


output:


python 数据分析笔记_第1张图片

2.计数函数  .value_counts()

input

Series 版


output


python 数据分析笔记_第2张图片

Data Frame 版


python 数据分析笔记_第3张图片

统计一个frame中的所有元素在每个数列 QUE中 的个数


python 数据分析笔记_第4张图片

3.条件判断函数 .isin(['b','c'])


output:


python 数据分析笔记_第5张图片
python 数据分析笔记_第6张图片

处理空值

1.判断空值的函数 .isnull() NAN, None 都适用


output


python 数据分析笔记_第7张图片
python 数据分析笔记_第8张图片

.dropna() 对存在缺失值进行过滤,等同于.notnull()

Series 版


python 数据分析笔记_第9张图片

output


python 数据分析笔记_第10张图片

DataFrame 版


python 数据分析笔记_第11张图片

(1)只要存在NA就会给DROP 掉,如果改成 how='all' 只drop掉全部都是NA的


python 数据分析笔记_第12张图片

(2)按照列进行drop AXIS=1 .dropna(axis =1 ,how='all')


output


python 数据分析笔记_第13张图片

(3) 设置对缺失值的容忍度,  thresh


python 数据分析笔记_第14张图片
python 数据分析笔记_第15张图片

填充数据

(1).fillna({1:0.5}) ,可以按照columns 选择填充在哪一列

df.fillna(0) =  _.=df.fillna(0,inplace=True)



python 数据分析笔记_第16张图片

(2)顺延填充 method = 'ffill',limit 限制阈值


python 数据分析笔记_第17张图片

output


python 数据分析笔记_第18张图片

或者填充某个统计函数值 .fillna(data.mean())


output


python 数据分析笔记_第19张图片


python 数据分析笔记_第20张图片

层次化索引

(1)存在多个INDEX


output


(2)多种的定位方式

input


output


python 数据分析笔记_第21张图片

(3)数据透视表模式 .unstack()      解开数据透视表模式 .stack()


output


python 数据分析笔记_第22张图片

(4) 复合index 和 复合columns 的情况,给 index 和 column 命名


output


python 数据分析笔记_第23张图片

(5) 多重index变换位置


out put


python 数据分析笔记_第24张图片

(6) sort_index(level=1) 按照那个level 进行排序


python 数据分析笔记_第25张图片

(7)跟数据透视表一样进行横排和纵排的sum


python 数据分析笔记_第26张图片

(8) 将frame的两列作为index进行计算,同样类似于数据透视表


output


python 数据分析笔记_第27张图片

(9) 将columns 作为index,且仍然保持作为数据列 ,drop=false


output


python 数据分析笔记_第28张图片

(10)  .reset_index 将层次性index释放


output


python 数据分析笔记_第29张图片

你可能感兴趣的:(python 数据分析笔记)