pandas试题

#1. 将下面的字典创建为DataFrame

 


#2.提取含有字符串"Python"的行

 


#3.输出df的所有列名

#4.统计grammer列中每种编程语言出现的次数

#5.修改第二列列名为'popularity'

#6.将空值用上下值的平均值填充


#7.提取popularity列中值大于3的行

#8.按照grammer列进行去重

#9.计算popularity列平均值


#10.将grammer列转换为list


#11.将DataFrame保存为EXCEL

#12.查看数据行列数

#13.提取popularity列值大于3小于7的行

#14.交换两列位置

#15.提取popularity列最大值所在行

#16.查看最后5行数据

#17.删除最后一行数据

#18.添加一行数据['Perl',6.6]

#19.对数据按照"popularity"列值的大小进行排序

#20.统计grammer列每个字符串的长度

#21.读取本地EXCEL数据

#22.查看df数据前5行

#23.将salary列数据转换为最大值与最小值的平均值

#24.将数据根据学历进行分组并计算平均薪资

#25. 将createTime列时间转换为月-日

#26.查看索引、数据类型和内存信息

#27.查看数值型列的汇总统计

#难题28.新增一列根据salary将数据分为三组¶

#29.按照salary列对数据降序排列

#30.取出第33行数据

#31.计算salary列的中位数

#32.绘制薪资水平频率分布直方图

#33.绘制薪资水平密度曲线

#34.删除最后一列categories

#35.将df的第一列与第二列合并为新的一列

#36.将education列与salary列合并为新的一列

#37.计算salary最大值与最小值之差

#38.将第一行与最后一行拼接

#39.将第八行数据添加至末尾

#40.查看每列的数据类型

#41.将createTime列设置为索引

#41.生成一个和df长度相同的随机数dataframe

#42.这个dataframe和df合并

#43.生成新的一列new 为salary列减去之前生成的随机数列

#45.检查数据中是否含有缺失值

#46.将salary列类型转换为浮点数

#47.计算salary大于10000的次数

#48.查看每种学历出现的次数

#49.查看education列一共有几种学历

#50.提取salary与new列的和大于60000的最后3行

#51.使用绝对路径读取本地Excel数据

#52.查看前三行

#53.查看每列数据缺失值情况

#54.提取日期列含有空值的行

#55.输出每列缺失值具体行数

#56.删除所有存在缺失值的行

#57.绘制收盘价的折线图

#58.同时绘制开盘价与收盘价

#59.绘制涨跌幅的直方图

#60.更细致

#61.以data的列名创建一个dataframe

#62.打印所有换手率不是数字的行

#63.打印所有换手率为--的行

#64.重置data的行号

#65.删除所有换手率为非数字的行

#66.绘制换手率的密度曲线

#67.计算前一天与后一天收盘价的差值

#68.收盘价变化率

#69.设置日期为索引

#70.以5个数据作为一个数据滑动窗口,在这个5个数据上取均值(收盘价)

#71.以5个数据作为一个数据滑动窗口,在这个5个数据上取总和

#72.将收盘价5日均线、20日均线与原始数据绘制在同一个图上

#73.按周为采样规则,取一周收盘价最大值
#注意!必须以日期为索引,才能实现重采样!


#74.绘制重采样数据与原始数据

#75.将数据往后移动五天

#76.将数据向前移动五天

#77.使用expanding函数计算开盘价的移动窗口均值

#78.绘制上一题的移动均值与原始数据折线图

#79.计算布林指标

#80.绘制布林指标

#81.导入并查看pandas与numpy版本

#82.numpy创建df
#备注 使用numpy生成20个0-100随机数

#备注 使用numpy生成20个0-100固定步长的数

#备注 使用numpy生成20个指定分布(如标准正态分布)的数

#85.df1 df2 df3按行合并

#86.按列合并
#如果两个表的index都没有实际含义,使用ignore_index参数,置true

#87.查看df所有数据的最小值、25%分位数、中位数、75%分位数、最大值

#88.修改列名

#89.提取第一列中不在第二列出现的数字

#90.提取第一列和第二列出现频率最高的三个数字

#91.提取第一列中可以整除5的数字位置

#92.计算第一列数字前一个与后一个的差值

#93.三列顺序颠倒

#94.提取第一列位置在1,10,15的数字

#95.查找第一列的局部最大值位置

#96.按行计算df的每一行均值

#97.对第二列计算移动平均值

#98.将数据按照第三列值的大小升序排列

#99.将第一列大于50的数字修改为'高'

#100.计算第二列与第三列之间的欧式距离

#101.读取csv

#102.从数据2中读取数据并在读取数据时将薪资大于10000的为改为高

#104.将数据取消使用科学计数法
#输入

#105.转换为百分数

#106.查找上一题数据中第3大值的行号

#107.反转df的行

#108.按照多列对数据进行合并

#输入


#110.再次读取数据1并显示所有的列


#111.查找secondType与thirdType值相等的行号

#112.查找薪资大于平均薪资的第三个数据所在的行

#113.将上一题数据的salary列开根号

#114.将上一题数据的linestaion列按_拆分

#115.多少列

#116.提取industryField列以'数据'开头的行

#117.按列制作数据透视表

#118.同时对salary、score两列进行计算

#119.对salary求平均,对score列求和
#需要对部分数据进行不同的聚合操作,可以通过字典来构建

#120.计算并提取平均薪资最高的区

你可能感兴趣的:(pandas试题)