【数据处理】在python中按不同的条件在列表list、字典dict和集合set中筛选想要的数据(以实际案例进行详细解析)

本文用python的实例来介绍如何在python中按不同的条件在列表list、字典dict和集合set中筛选想要的数据

一、过滤列表中的负数

案例: 过滤列表[3, 5, -19, -3, 48, 22, -19, -33, 42, -4, -18]中的负数。

1. 方案一:使用for循环实现列表过滤

最简单的实现方法:使用for循环实现,代码如下所示。

list_data = [3, 5, -19, -3, 48, 22, -19, -33, 42, -4, -18]
# (1) 创建空列表用于存储过滤结果:
list_data_filter_result = []

# (2) 下面使用for循环实现过滤列表中的负数:
for x in list_data:
	if x >= 0:
		list_data_filter_result.append(x)

# (3) 输出结果:
print(list_data_filter_result)

结果:

【数据处理】在python中按不同的条件在列表list、字典dict和集合set中筛选想要的数据(以实际案例进行详细解析)_第1张图片

上面的for循环方案是一个简单的列表筛选方案,其实Python中还有以下两种更高级的列表筛选方案:

  • (1)列表解析:[x for x in list_data if x >= 0];
  • (2)使用filter函数配合lambda匿名函数:filter(lambda x: x >= 0, list_data)

2. 方案二:使用列表解析进行列表过滤

Python代码如下所示:

from random import randint

# (1) 使用randint生成包含十个数字的随机列表:
List_1 = [randint(-10, 10) for _ in range(10)]

# (2 )下面使用列表解析方法实现筛选类表中的正数:
List_Filter_1 = [x for x in List_1 if x >= 0]

# (3) 输出结果:
print('原始列表:', List_1)
print('过滤负数后的列表:', List_Filter_1)

结果:
【数据处理】在python中按不同的条件在列表list、字典dict和集合set中筛选想要的数据(以实际案例进行详细解析)_第2张图片

3. 方案三:使用filter函数进行列表过滤

filter函数通过匿名函数lambda对列表进行筛选,并返回一个filter生成器对象(filter object)。获取filter生成器对象的方法通常有两种:

  • 1、通过next函数依次读取,当读取完列表内容后,会抛出一个StopIteration异常;
  • 2、使用list列表构造器读取filter生成器对象中的内容(本文使用的方法)。

Python代码如下所示:

from random import randint

List_1 = [randint(-10, 10) for _ in range(10)]

# (1) 使用filter函数配合lambda匿名函数,对列表进行筛选
# 并返回一个filter生成器对象(filter object)。
filter_object = filter(lambda x: x >= 0, List_1)

# (2) 使用list列表构造器读取生成器对象中的内容:
List_Filter_1 = list(filter_object)

# (3) 输出结果:
print('原始列表:', List_1)
print('过滤负数后的列表:', List_Filter_1)

【数据处理】在python中按不同的条件在列表list、字典dict和集合set中筛选想要的数据(以实际案例进行详细解析)_第3张图片

二、筛选出字典中值大于某个值的项

案例: 筛选出字典中值velue满足某些条件的项。比如:{‘xiaoliang’:87, ‘xiaowang’:99, ‘xiaoxin’:95, ‘xiaoli’:67, ‘xiaoran’:79, ‘xiaoxuan’:88}值高于90的项。

1. 方案一:使用字典解析进行字典筛选

这里需要注意两个方面:

  • 1、创建一个包含学生名、成绩字典的方式;
  • 2、字典解析筛选方法。

Python代码如下所示:

from random import randint

# (1) 创建一个包含20个学生名及成绩的字典创建方法
student_dict = {'student_%d' % i: randint(50, 100) 
								for i in range(1, 21)}

# (2) 下面使用字典解析方法,筛选出字典中选取成绩在90分以上的学生:
student_dict_filter  = {stu_key:stu_val for stu_key, stu_val 
							in student_dict.items() if stu_val >= 90}

# (3) 输出结果:
print('原始字典:', student_dict)
print('筛选后的字典:', student_dict_filter)

结果:

【数据处理】在python中按不同的条件在列表list、字典dict和集合set中筛选想要的数据(以实际案例进行详细解析)_第4张图片

2. 方案二:使用filter函数进行字典筛选

filter函数进行字典过滤方法具体步骤:

  • 1、在filter函数中使用匿名函数lambda对字典进行过滤;
  • 2、注意lambda的参数x接收的是字典项student.items(),并以元组形式存储。另外,我们需要判断的是字典的value,即通过x[1]> = 90实现成绩筛选;
  • 3、由于filter函数返回的是一个filter生成器对象(filter_object),所以需要使用字典构造器dict读取其中内容,才能正常输出字典结果。

Python代码如下所示:

from random import randint

# 1、下面是创建一个包含学生及成绩字典的高级方式:
student_dict = {'student_%d' % i: randint(50, 100) 
					for i in range(1, 21)}

# 2、filter函数进行字典过滤方法具体步骤
# (1)下面使用filter函数来进行字典解析,在filter内部
# 使用匿名函数lambda进行字典过滤。
# (2) 注意:x返回的是字典student.items()的一个包含
# 字典key和value的元组,我们需要判断的只是字典的value。
# (3) 还要注意:需要使用字典构造器dict将filter生成器中
# 的内容取出,才能正常输出字典结果。
student_dict_filter = dict(filter(lambda x: x[1] >= 90,
							student_dict.items()))

# 3、输出结果
print('原始字典:' ,student_dict)
print('筛选后的字典:' ,student_dict_filter)

结果:

【数据处理】在python中按不同的条件在列表list、字典dict和集合set中筛选想要的数据(以实际案例进行详细解析)_第5张图片

三、筛选出集合中符合某个条件的元素

案例:筛选出集合中能被3整除的元素,这里使用最常用的集合解析方法实现。

Python代码如下所示:

from random import randint

# (1)下面创建一个20个50以内的数字集合:
number_set = {randint(0, 50) for _ in range(20)}

# (2)下面使用集合解析方法筛选出集合中能够被3整除的元素:
number_set_filter = {x for x in number_set if x % 3 == 0}

# (3)输出结果:
print('原始集合:', number_set)
print('过滤后的的集合:', number_set_filter)

结果:
【数据处理】在python中按不同的条件在列表list、字典dict和集合set中筛选想要的数据(以实际案例进行详细解析)_第6张图片

你可能感兴趣的:(数据处理,python,筛选数据,list,dict字典,列表)