python pandas 使用迭代器高效遍历行和列

文章目录

    • 简介
    • 1、for_zip
    • 2、itertuples
    • 3、items
    • 4、iterrows

简介

pandas遍历行和列效率最高的是apply方法,其次是使用迭代器遍历,apply方法在灵活性上不如使用迭代器遍历。使用迭代器有 for_ zip 、itertuples、iterrows、items四种方法,最慢的iterrow使用效率可以比 iloc等切片方法快300多倍。

结合资料和我自己的测试,5种方法效率中,apply>for_ zip>itertuples>items>iterrows。其中apply约为for_ zip的10倍,for_zip约为itertuples的15倍,itertuples约为iterrows的30倍。

python pandas 使用迭代器高效遍历行和列_第1张图片

1、for_zip

可以按行或者列迭代。效率最高但是无法获取索引。

示例:

for a

你可能感兴趣的:(pandas,高效运算,pandas,python,数据分析)