大家好我是菜鸟哥,一些比较熟悉pandas
的读者朋友应该经常会使用query()
、eval()
、pipe()
、assign()
等pandas
的常用方法(相关知识详见我的pandas
专题教程https://www.cnblogs.com/feffery/tag/pandas/
),书写可读性很高的「链式」数据分析处理代码,从而更加丝滑流畅地组织代码逻辑。
但在原生Python
中并没有提供类似shell
中的管道操作符|
、R
中的管道操作符%>%
等语法,也没有针对列表等数组结构的可进行链式书写的快捷方法,譬如javascript
中数组的map()
、filter()
、some()
、every()
等。
正所谓“标准库不够,三方库来凑”,Python
原生对链式写法支持不到位没关系,我们可以使用一些简单方便且轻量的第三方库来协助我们在Python
代码中大面积实现链式写法,今天的文章中我就将带大家一起学习相关的知识技巧~
我们将使用到pipe
这个第三方库,它不仅内置了很多实用的「管道操作函数」,还提供了将常规函数快捷「转换」为管道操作函数的方法,使用pip install pipe
对其进行安装即可。
pipe
的用法非常方便,类似shell
中的管道操作:以你的数组变量为起点,使用操作符|
衔接pipe
内置的各个常见管道操作函数,组装起自己所需的计算步骤即可,譬如,我们筛选输入数组中为偶数的,再求平方,就可以写作:
import pipe
list(
range(10) |
pipe.filter(lambda x: x % 2 == 0) |
pipe.select(lambda x: x ** 2)
)
因为pipe
搭建的管道默认都是惰性运算的,直接产生的结果是生成器类型,所以上面的例子中我们最外层套上了list()
来取得实际计算结果,更优雅的方式是配合pipe.Pipe()
,将list()
也改造为管道操作函数:
from pipe import Pipe
(
range(10) |
pipe.filter(lambda x: x % 2 == 0) |
pipe.select(lambda x: x ** 2) |
Pipe(list)
)
在上面的简单例子中我们使用到的filter()
、select()
等就是pipe
中常见的管道操作函数,事实上pipe
中的管道操作函数相当的丰富,下面我们来展示其中一些常用的:
如果你想要将任意嵌套数组结构展平,可以使用traverse()
:
(
[1, [2, 3, [4, 5]], 6, [7, 8, [9, [10, 11]]]] |
pipe.traverse |
Pipe(list)
)
如果我们需要对包含若干重复值的数组进行去重,且希望保留原始数据的顺序,则可以使用dedup()
,其还支持key
参数,类似sorted()
中的同名参数,实现自定义去重规则:
(
[-1, 0, 0, 0, 1, 2, 3] |
pipe.dedup |
Pipe(list)
)
(
[-1, 0, 0, 0, 1, 2, 3] |
# 基于每个元素的绝对值进行去重
pipe.dedup(key=abs) |
Pipe(list)
)
我们最开始的例子中使用过它,用法就是基于传入的lambda
函数对每个元素进行条件判断,并保留结果为True
的,与javascript
中的filter()
方法非常相似:
(
[1, 4, 3, 2, 5, 6, 8] |
# 保留大于5的元素
pipe.filter(lambda x: x > 5) |
Pipe(list)
)
这个函数非常实用,其功能相当于管道操作版本的itertools.groupby()
,可以帮助我们基于lambda
函数运算结果对原始输入数组进行分组,通过groupby()
操作后直接得到的结果是分组结果的二元组列表,每个元组的第一个元素是分组标签,第二个元素是分到该组内的各个元素:
基于此,我们可以衔接很多其他管道操作函数,譬如衔接select()
对分组结果进行自定义运算:
这个函数是pipe()
中核心的管道操作函数,通过前面的若干例子也能弄明白,它的功能是基于我们自定义的函数,对上一步的运算结果进行遍历运算。
相当于内置函数sorted()
的管道操作版本,同样支持key
、reverse
参数:
上述内容足以支撑大部分日常操作需求,你也可以在https://github.com/JulienPalard/Pipe
中查看pipe
的更多功能介绍。
以上就是本文的全部内容,欢迎在评论区与我进行讨论~
最后给大家送书6本,有兴趣的小伙伴可以看看
抽奖包邮送出6本不错的Python书籍。
需要的同学在下面的公众号后台输入:6本书
推荐阅读:
入门: 最全的零基础学Python的问题 | 零基础学了8个月的Python | 实战项目 |学Python就是这条捷径
干货:爬取豆瓣短评,电影《后来的我们》 | 38年NBA最佳球员分析 | 从万众期待到口碑扑街!唐探3令人失望 | 笑看新倚天屠龙记 | 灯谜答题王 |用Python做个海量小姐姐素描图 |碟中谍这么火,我用机器学习做个迷你推荐系统电影
趣味:弹球游戏 | 九宫格 | 漂亮的花 | 两百行Python《天天酷跑》游戏!
AI: 会做诗的机器人 | 给图片上色 | 预测收入 | 碟中谍这么火,我用机器学习做个迷你推荐系统电影
小工具: Pdf转Word,轻松搞定表格和水印! | 一键把html网页保存为pdf!| 再见PDF提取收费! | 用90行代码打造最强PDF转换器,word、PPT、excel、markdown、html一键转换 | 制作一款钉钉低价机票提示器! |60行代码做了一个语音壁纸切换器天天看小姐姐!|