pandas包 问题汇总

  • 跳过错误行
  • 遍历DataFrame数据的行

跳过错误行

在数据文件中可能会出现小部分脏数据,在脏数据对数据整体没有较大影响我们又不知道脏数据位置的情况下,可以选择跳过那部分脏数据,不进行处理。

import pandas as pd
#error_bad_lines=False表示跳过错误数据行
data = pd.read_csv('file1.csv', error_bad_lines=False)

遍历DataFrame数据的行

  • DataFrame.iterrows()
for index, row in df.iterrows():
    print row["c1"], row["c2"]

注:iterrows()迭代返回对象对象被修改,df也会被修改

import pandas as pd
from pandas import DataFrame

#任意的多组列表
a = [1,2,3]
b = [4,5,6]

#字典中的key值即为csv中的列名
data = {'a_name':a,'b_name':b}

#设置DataFrame列的排列顺序
dataFrame = DataFrame(data, columns=['a_name', 'b_name'])
"""
dataFrame:
  a_name  b_name
0     1     4
1     2     5
2     3     6
"""
for index, row in dataFrame.iterrows():
    if row['b_name']==4:
           row['b_name']=10
"""
dataFrame:
  a_name  b_name
0     1     10
1     2     5
2     3     6
"""
for each in dataFrame['b_name']:
    each=20
"""
dataFrame:
  a_name  b_name
0     1     10
1     2     5
2     3     6
"""

你可能感兴趣的:(python)