Pandas常用操作命令(四)——数据切片、筛选

文章目录

  • ️‍ 4. 数据切片、筛选
    • 4.1 输出城市为上海的行
    • 4.2 输出城市为上海或广州的行
    • 4.3 输出城市名称中含有‘海’字的行
    • 4.4 输出城市名称以‘海’字开头的行
    • 4.5 输出城市名称以‘海’字结尾的行
    • 4.6 输出所有姓名,缺失值用Null填充
    • 4.7 重置索引
    • 4.8 前两行
    • 4.9 后两行
    • 4.10 2-8行
    • 4.11 每隔3行读取
    • 4.12 2-8行,步长为2,即第2/4/6行
    • 4.13 选取'语文','数学','英语'列
    • 4.14 学号为'001'的行,所有列
    • 4.15 学号为'001'或'003'的行,所有列
    • 4.16 学号为'001'至'009'的行,所有列
    • 4.17 列索引为'姓名',所有行
    • 4.18 列索引为'姓名'至‘城市’,所有行
    • 4.19 语文成绩大于80的行
    • 4.20 语文成绩大于80的人的姓名和城市
    • 4.21 输出'赵四'和'周七'的各科成绩
    • 4.22 iloc选取第2行
    • 4.23 iloc选取前3行
    • 4.24 选取第2行、第4行、第6行
    • 4.25 选取第2列
    • 4.26 选取前3列
    • 4.27 选取第3行的第3列
    • 4.28 选取第1列、第3列和第4列
    • 4.29 选取第2行的第1列、第3列、第4列
    • 4.30 选取前3行的前3列
  • 推荐阅读

大家好,我是 【Python当打之年(点击跳转)】

本期为大家带来 《 Pandas常用操作命令》第四篇 ,主要介绍在数据处理可视化过程中经常用到的一些指令,本系列在后期会不断进行补充更新,希望对你有所帮助,如有疑问或者需要改进的地方可以私信小编。


️‍ 4. 数据切片、筛选

示例数据:
Pandas常用操作命令(四)——数据切片、筛选_第1张图片

4.1 输出城市为上海的行

df[df['城市']=='上海']

在这里插入图片描述

4.2 输出城市为上海或广州的行

df[df['城市'].isin(['上海','广州'])]

Pandas常用操作命令(四)——数据切片、筛选_第2张图片

4.3 输出城市名称中含有‘海’字的行

df[df['城市'].str.contains("海", na=False)]

Pandas常用操作命令(四)——数据切片、筛选_第3张图片

4.4 输出城市名称以‘海’字开头的行

df[df['城市'].str.startswith("海", na=False)]

在这里插入图片描述

4.5 输出城市名称以‘海’字结尾的行

df[df['城市'].str.endswith("海", na=False)]

在这里插入图片描述

4.6 输出所有姓名,缺失值用Null填充

df['姓名'].str.cat(sep='、',na_rep='Null')

‘001-张三、002-李四、003-赵四、004-王五、005-陈六、006-孙五、007-周七、Null、009-王二、010-刘八、011-郑九、012-赵十、013-郭一’

4.7 重置索引

df2 = df1.set_index('学号')
df2

Pandas常用操作命令(四)——数据切片、筛选_第4张图片

4.8 前两行

df2[:2]

Pandas常用操作命令(四)——数据切片、筛选_第5张图片

4.9 后两行

df2[-2:]

Pandas常用操作命令(四)——数据切片、筛选_第6张图片

4.10 2-8行

df2[2:8]

Pandas常用操作命令(四)——数据切片、筛选_第7张图片

4.11 每隔3行读取

df2[::3]

Pandas常用操作命令(四)——数据切片、筛选_第8张图片

4.12 2-8行,步长为2,即第2/4/6行

df2[2:8:2]

Pandas常用操作命令(四)——数据切片、筛选_第9张图片

4.13 选取’语文’,‘数学’,'英语’列

df2[['语文','数学','英语']]

Pandas常用操作命令(四)——数据切片、筛选_第10张图片

4.14 学号为’001’的行,所有列

df.loc只能使用标签索引,不能使用整数索引,通过便签索引切边进行筛选时,前闭后闭.

df2.loc['001', :]

Pandas常用操作命令(四)——数据切片、筛选_第11张图片

4.15 学号为’001’或’003’的行,所有列

df2.loc[['001','003'], :]

Pandas常用操作命令(四)——数据切片、筛选_第12张图片

4.16 学号为’001’至’009’的行,所有列

df2.loc['001':'009', :]

Pandas常用操作命令(四)——数据切片、筛选_第13张图片

4.17 列索引为’姓名’,所有行

df2.loc[:, '姓名']

Pandas常用操作命令(四)——数据切片、筛选_第14张图片

4.18 列索引为’姓名’至‘城市’,所有行

df2.loc[:, '姓名':'城市']

Pandas常用操作命令(四)——数据切片、筛选_第15张图片

4.19 语文成绩大于80的行

# 方法一
df2.loc[df2['语文']>80,:]

# 方法二
df2.loc[df2.loc[:,'语文']>80, :]

# 方法三
df2.loc[lambda df2:df2['语文'] > 80, :]

Pandas常用操作命令(四)——数据切片、筛选_第16张图片

4.20 语文成绩大于80的人的姓名和城市

df2.loc[df2['语文']>80,['姓名','城市']]

Pandas常用操作命令(四)——数据切片、筛选_第17张图片

4.21 输出’赵四’和’周七’的各科成绩

df2.loc[df2['姓名'].isin(['赵四','周七']),['姓名','语文','数学','英语']]

Pandas常用操作命令(四)——数据切片、筛选_第18张图片

df.iloc[]只能使用整数索引,不能使用标签索引,通过整数索引切边进行筛选时,前闭后开

4.22 iloc选取第2行

df2.iloc[1, :]

Pandas常用操作命令(四)——数据切片、筛选_第19张图片

4.23 iloc选取前3行

df2.iloc[:3, :]

Pandas常用操作命令(四)——数据切片、筛选_第20张图片

4.24 选取第2行、第4行、第6行

df2.iloc[[1,3,5],:]

Pandas常用操作命令(四)——数据切片、筛选_第21张图片

4.25 选取第2列

df2.iloc[:, 1]

Pandas常用操作命令(四)——数据切片、筛选_第22张图片

4.26 选取前3列

df2.iloc[:, :3]

Pandas常用操作命令(四)——数据切片、筛选_第23张图片

4.27 选取第3行的第3列

df2.iloc[3, 3]

4.28 选取第1列、第3列和第4列

df2.iloc[:, [0,2,3]]

Pandas常用操作命令(四)——数据切片、筛选_第24张图片

4.29 选取第2行的第1列、第3列、第4列

df2.iloc[1, [0,2,3]]

在这里插入图片描述

4.30 选取前3行的前3列

df2.iloc[:3, :3]

Pandas常用操作命令(四)——数据切片、筛选_第25张图片

未完待续。。。


文章首发:微信公众号 Python当打之年,Python编程技巧推送,希望大家可以喜欢。

以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享注明出处)让更多人知道。

推荐阅读

  • 【Pandas+Pyecharts | 山东省高考考生数据分析可视化】
  • 【Pandas+Pyecharts | 40000+汽车之家数据分析可视化】
  • 【Pandas+Pyecharts | 20000+天猫订单数据可视化】
  • 【Pandas+Pyecharts | 广州市已成交房源信息数据可视化】
  • 【Pandas+Pyecharts | 考研信息数据可视化】
  • 【Pandas+Pyecharts | 某平台招聘信息数据可视化】
  • 【Pandas+Pyecharts | 医院药品销售数据可视化】
  • 【Pyecharts | 比特币每日价格动态可视化】
  • 【可视化 | Python中秋月饼销量分析,这些口味才是yyds!】
  • 【Pyecharts | 《白蛇2:青蛇劫起》20000+数据分析可视化】
  • 【Pyecharts | 历年全国各地民政局登记数据分析+可视化】
  • 【Pandas+Pyecharts | 全国热门旅游景点数据分析+可视化】
  • 【Pandas+Pyecharts | 2020东京奥运会奖牌数据可视化】
  • 【Pandas常用基础操作指令汇总 】
  • 【pandas + pyecharts | ADX游戏广告投放渠道综合分析】
  • 【Schedule + Pyecharts | 时间序列图(动态轮播图)】
  • 【Pandas+Pyecharts | 北京某平台二手房数据分析+可视化】
  • 【Pandas+Pyecharts | 2021中国大学综合排名分析+可视化】
  • 【爬虫 | Python爬取豆瓣电影Top250 + 数据可视化】
  • 【技巧 | Python创建自己的高匿代理IP池】

你可能感兴趣的:(Pandas技巧系列,pandas,python,开发语言)