在数据文件中可能会出现小部分脏数据,在脏数据对数据整体没有较大影响我们又不知道脏数据位置的情况下,可以选择跳过那部分脏数据,不进行处理。
import pandas as pd
#error_bad_lines=False表示跳过错误数据行
data = pd.read_csv('file1.csv', error_bad_lines=False)
for index, row in df.iterrows():
print row["c1"], row["c2"]
注:iterrows()迭代返回对象对象被修改,df也会被修改
import pandas as pd
from pandas import DataFrame
#任意的多组列表
a = [1,2,3]
b = [4,5,6]
#字典中的key值即为csv中的列名
data = {'a_name':a,'b_name':b}
#设置DataFrame列的排列顺序
dataFrame = DataFrame(data, columns=['a_name', 'b_name'])
"""
dataFrame:
a_name b_name
0 1 4
1 2 5
2 3 6
"""
for index, row in dataFrame.iterrows():
if row['b_name']==4:
row['b_name']=10
"""
dataFrame:
a_name b_name
0 1 10
1 2 5
2 3 6
"""
for each in dataFrame['b_name']:
each=20
"""
dataFrame:
a_name b_name
0 1 10
1 2 5
2 3 6
"""