Python pandas数据分析

Python pandas数据分析:

2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开
测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业、安全机构啥的,他们必须要用oracle数据库
这oracle比sql安全,强大多了,所以你需要学习,最重要的,你要是考网络警察公务员,这玩意你不会就别去报名了,耽误时间!
与此同时,既然要考网警之数据分析应用岗,那必然要考数据挖掘基础知识,今天开始咱们就对数据挖掘方面的东西好生讲讲 最最最重要的就是大数据,什么行测和面试都是小问题,最难最最重要的就是大数据技术相关的知识笔试


文章目录

  • Python pandas数据分析:
    • @[TOC](文章目录)
  • Python pandas数据分析:
  • 总结

Python pandas数据分析:

在这里插入图片描述
Python pandas数据分析_第1张图片
Python pandas数据分析_第2张图片
语言这行
df[内部控制字段的条件]
Python pandas数据分析_第3张图片
大小写有问题
Python pandas数据分析_第4张图片
Python pandas数据分析_第5张图片
包含Python的哪些列揪出来

简单方法多好啊,搞那么多锤子作甚

直接输出columns
在这里插入图片描述
修改列名字
rename
把字段score改为这个population
Python pandas数据分析_第6张图片
value_counts()
Python pandas数据分析_第7张图片

在这里插入图片描述
Python pandas数据分析_第8张图片
中间是控制条件
去重
drop_diplicates
Python pandas数据分析_第9张图片
Python pandas数据分析_第10张图片
list转呗
.tolist()

在这里插入图片描述
数据.to_excel(路径)
在这里插入图片描述
在这里插入图片描述

Python pandas数据分析_第11张图片
交换两个列的位置
在这里插入图片描述
max
在这里插入图片描述
拿最大行
Python pandas数据分析_第12张图片
删除最后那个位置
Python pandas数据分析_第13张图片
增加一行
写个字典
然后append吧
Python pandas数据分析_第14张图片
sort_values()
Python pandas数据分析_第15张图片
Python pandas数据分析_第16张图片
lambda的目的是定义x
然后f(x)处理返回值,放到新的字段中

读取数据
Python pandas数据分析_第17张图片
查看数据的前几行
head()
在这里插入图片描述
中间可以加参数
切割split
转数字为int
把字符去掉strip(‘k’)
最大最小值拿到后,求取平均

apply是合并,用函数func去合并了,但是func是一条一条去处理
Python pandas数据分析_第18张图片
这个合并的用法,相当于单独处理那一列,懂???

这些应该学学
根据学历分组
算平均薪资
分组聚合
groupby关键字
mean求均值
Python pandas数据分析_第19张图片
把月日格式输出
.format?
一个个循环
for i in range(len(df)):
ix是啥?底i行?第0列
转为pydatetime
.strftime(“%m-%d”)月日
Python pandas数据分析_第20张图片
查看索引,数据类型和内存信息
info
Python pandas数据分析_第21张图片
数值型列的汇总
Python pandas数据分析_第22张图片
新增一列,将薪水分为三组
bins搞三个区间
然后分组仨名字,用啥函数来搞可能
新启动一列,cut切割,谁?薪水,按bins切割,然后名字的labels挂上

Python pandas数据分析_第23张图片
sort_values(字段,ascending=False),降序
True是升序
Python pandas数据分析_第24张图片
按照salary来排序

取出行
loc
Python pandas数据分析_第25张图片
中位数
np能,
np.median(df中salary数据)
pandas也能
在这里插入图片描述
绘制薪资的频率分布直方图
有matplotlib.pyplot

plt
df.salary.plot(kind=‘hist’)
直接用它自带的属性
Python pandas数据分析_第26张图片

df.salary.plot(kind=‘kde’, xlim=(0,8000))水平密度线
Python pandas数据分析_第27张图片
水平的密度
薪资有多人?

删除列
drop
在这里插入图片描述
合并两列
Python pandas数据分析_第28张图片
Python pandas数据分析_第29张图片
最值只差
apply:
lambda x:x.max()-x.min()
Python pandas数据分析_第30张图片
中间多了[]这个是啥意思

总之就似乎它的最大小之差
Python pandas数据分析_第31张图片
第8行加到末尾
append
Python pandas数据分析_第32张图片
好像loc和iloc都能获取行
Python pandas数据分析_第33张图片
数据的类型
dtypes

设置索引
setindex
Python pandas数据分析_第34张图片
Python pandas数据分析_第35张图片
Python pandas数据分析_第36张图片
减法,继续增加一列
直接干字段,后面跟着数据
Python pandas数据分析_第37张图片

Python pandas数据分析_第38张图片
包含缺失值吗

在这里插入图片描述
Python pandas数据分析_第39张图片
大于10000的次数
在这里插入图片描述
Python pandas数据分析_第40张图片
调取
Python pandas数据分析_第41张图片
Python pandas数据分析_第42张图片
Python pandas数据分析_第43张图片Python pandas数据分析_第44张图片
Python pandas数据分析_第45张图片
df[里面是条件]

遍历每个字段,如果有缺失,则统计一波
然后照这个列,如果有null,就给他的values设定为True,把index弄出来,变tolist
Python pandas数据分析_第46张图片
Python pandas数据分析_第47张图片
Python pandas数据分析_第48张图片
收盘价
折现图
matplotlib
用seaborn-darkgrid画质
rc设置字体大小
fig出一个句柄画布

Python pandas数据分析_第49张图片
直接plot也行
你需要时间轴
Python pandas数据分析_第50张图片
俩都画
把数据整俩
Python pandas数据分析_第51张图片
Python pandas数据分析_第52张图片
hist
在这里插入图片描述
Python pandas数据分析_第53张图片
Python pandas数据分析_第54张图片
在这里插入图片描述
Python pandas数据分析_第55张图片
换手率
每行换手率
iloc行列
Python pandas数据分析_第56张图片
Python pandas数据分析_第57张图片
删除所有
非数字的行
for循环

定位i行13列
如果不是数字,做成列表
挨个去drop或者删除
labels=那个列表
Python pandas数据分析_第58张图片
在这里插入图片描述
Python pandas数据分析_第59张图片
Python pandas数据分析_第60张图片
收取平均
骚啊rolling
Python pandas数据分析_第61张图片
Python pandas数据分析_第62张图片在这里插入图片描述
Python pandas数据分析_第63张图片
连着plot就是一个图

Python pandas数据分析_第64张图片
Python pandas数据分析_第65张图片
Python pandas数据分析_第66张图片
向后移动
向前移动

Python pandas数据分析_第67张图片
Python pandas数据分析_第68张图片
Python pandas数据分析_第69张图片
Python pandas数据分析_第70张图片
Python pandas数据分析_第71张图片
在这里插入图片描述
在这里插入图片描述

Python pandas数据分析_第72张图片
pandas和numpy经常混合使用

np.version
pd.version

Python pandas数据分析_第73张图片
搞一个np.random.randint(1,100,20)1–100,20个数据
然后搞一个dataframe
Python pandas数据分析_第74张图片
Python pandas数据分析_第75张图片
np.arrange(0,100,5)
这个是步长为5,固定的
在这里插入图片描述
在这里插入图片描述
正态分布也行
Python pandas数据分析_第76张图片
合并仨行
axis=0就是行
concat方法就是合并
Python pandas数据分析_第77张图片
Python pandas数据分析_第78张图片

往下拼接
我们看看axis=1列
在这里插入图片描述
Python pandas数据分析_第79张图片
Python pandas数据分析_第80张图片
牛逼
percentile(df,q=[0,25,75,100])%
本质是
精准Python pandas数据分析_第81张图片
修改列名
在这里插入图片描述
输出看看
Python pandas数据分析_第82张图片
第一列中不在第二列
是否存在?
Python pandas数据分析_第83张图片
df[][这里输出真假]
控制
频率,统计,排序
values_count自然是降序呗
Python pandas数据分析_第84张图片
找位置
np.argwhere
df%5==0
整除
Python pandas数据分析_第85张图片
前后差
diff().to_list
Python pandas数据分析_第86张图片
顺序颠倒
Python pandas数据分析_第87张图片
拿数据take
Python pandas数据分析_第88张图片
每一行均值
Python pandas数据分析_第89张图片
第三列升序排序,整体要带动吗
Python pandas数据分析_第90张图片
在这里插入图片描述
Python pandas数据分析_第91张图片
Python pandas数据分析_第92张图片
2norm
Python pandas数据分析_第93张图片
单独列出别的呢
在这里插入图片描述

Python pandas数据分析_第94张图片
Python pandas数据分析_第95张图片
converter
转换
Python pandas数据分析_第96张图片Python pandas数据分析_第97张图片
在这里插入图片描述
Python pandas数据分析_第98张图片
Python pandas数据分析_第99张图片
round直接取%

在这里插入图片描述
data直接0:2%前面对其,后面2个小数点

Python pandas数据分析_第100张图片
Python pandas数据分析_第101张图片
翻转行
Python pandas数据分析_第102张图片
Python pandas数据分析_第103张图片
Python pandas数据分析_第104张图片
CD字段也过来了
多列
Python pandas数据分析_第105张图片Python pandas数据分析_第106张图片
左右是看key1,还是2


总结

提示:重要经验:

1)
2)学好oracle,即使经济寒冬,整个测开offer绝对不是问题!同时也是你考公网络警察的必经之路。
3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。

你可能感兴趣的:(国考,数据挖掘,python,pandas,数据分析,国考,网警)