Python Pandas 快速插入列,快速筛选数据:强大到飞起的 eval 和 query 函数

Python Pandas 快速插入列,快速筛选数据:强大到飞起的 eval 和 query 函数_第1张图片

更多商业数据分析案例(原理,完整代码,数据集)、统计学、SQL、网络爬虫详见公众号 " 数据分析与商业实践 "

引言

  在使用 Python 的 Pandas 库处理数据时,我们时常需要添加一些新列,时不时添加一列也就算了,同时添加多列(毫无规律的,不使用循环)时是真的气人,还有就是快速选择符合条件的数据框有时也会成为令人难受。



业务需求 & 效果实现

快到飞起的 eval()

Python Pandas 快速插入列,快速筛选数据:强大到飞起的 eval 和 query 函数_第2张图片
笔者将效果实现分成了几个版本

低端累到不能呼吸版
  最基础的列操作了
Python Pandas 快速插入列,快速筛选数据:强大到飞起的 eval 和 query 函数_第3张图片


中端客可喘气版
  这个版本借助了循环的帮助,省去了复制粘贴该改数字
在这里插入图片描述
已经快了很多
Python Pandas 快速插入列,快速筛选数据:强大到飞起的 eval 和 query 函数_第4张图片


高端畅顺呼吸版
  使用 eval 函数的同时借助循环的帮助,这里就只是展示 eval 的生成单列的用法。
Python Pandas 快速插入列,快速筛选数据:强大到飞起的 eval 和 query 函数_第5张图片



同样快到飞起的 query()

功能不多说,看图说话即可,只展示 query 最常用的功能
Python Pandas 快速插入列,快速筛选数据:强大到飞起的 eval 和 query 函数_第6张图片



总结

  两个函数的简单和最常见的用法不用说大家看图也能够理解,就是省去了打出文件名和中括号,借助循环的力量,找出列索引的规律;在数据清洗/文件批处理中非常常见。

  这两个相对来说冷门一些的函数不仅代码量大大减少,而且在内存执行速度上也会更快;**从版本0.13开始,Pandas 包含了一下实验性的工具允许你直接使用 C 速度操作,避免中间数组的浪费。这些工具是eval()和 query()函数,它们依赖 Numexpr包。**其实这只是这两个函数的冰山一角,各种快捷骚操作还等待着我们去探索 Pandas,Numpy 的快捷函数太多了,所以鲜有人敢自称自己精通 numpy pandas 或者只是其中一个库(熊猫创始人曾在视频中也对此感到无奈)。总的来说,替自己总是忘记快捷函数而感到担忧是完全没有必要的,只需牢记没有最快,只有更快,想得起来就用想不起来就查。



后记

延伸阅读

  • Excel 还在重复输入相同的数据?不用那么麻烦(避免重复输入,批量填充 – 非手动输入与复制粘贴的快捷精准输入的方法)

  • Word 人人都要会的打印攻略(书籍打印,方便翻页,统一格式,缩放打印省纸又方
    便)

精彩回顾

  • Python 实现 RFM 模型(详):用户行为分析模型,商业实践与数据分析实战(含可视化)

  数据分析,商业实践,数据可视化,网络爬虫,统计学,Excel,Word, 社会心理学,认知心理学,行为科学,民族意志学 各种专栏后续疯狂补充

  欢迎评论与私信交流!

你可能感兴趣的:(#,数据处理,数据分析,python,pandas,数据预处理,经验分享)