使用Python的pandas对.csv文件进行数据处理

使用Python的pandas对.csv文件进行数据处理

今天使用Python中的pandas模块,对csv数据进行了筛选,简单记录一下。

import pandas as pd
#读入csv文件
data = pd.read_csv("file_path", chunksize = 对数据分块(用于大量数据时), iterator = True)
#data为DataFrame数据结构。

#对符合条件的数据进行筛选。df为数据块,必须在读入数据时使用chunksize才可以使用loc
data1 = df.loc[(df['要筛选的列名'] > 0) & (df['   '] < 0, :]
#最后一个冒号表示scan所有数据
data.to_csv("file_path", spe= ',', header = True, Index = False
#若数据过于巨大,则将会根据chunksize进行分块处理,此时可对header进行特殊处理。

你可能感兴趣的:(大数据)