用pandas中的read_csv()函数读取出csv文件中的数据:
import pandas as pd
df = pd.read_csv("comments.csv")
df.head(2)
用drop函数进行文件中数据的删除行或者删除列操作。
方法一:假设我们要删除的列的名称为 ‘观众ID’,‘评分’ :
df=df.drop(['观众ID','评分'],axis=1)
方法二:
#删除指定列
df.drop(columns=["城市"])
即可删除指定的列
删除某几行
df.drop([1,2]) #删除1,2行的整行数据
删除行(某个范围)
#删除行(某个范围)
df.drop(df.index[3:6],inplace=True)
将数据重新保存到csv文件中
#如果想要保存新的csv文件,则为
df.to_csv("data_new.csv",index=False,encoding="utf-8")
参数axis=0,表示对行进行操作,如对列进行操作则更改默认参数为axis=1。
参数inplace=False,表示该删除操作不改变原数据,返回一个执行删除操作后的新dataframe,如直接对原数据进行删除操作,则更改默认参数为inplace=True。
参数index=False,表示输出不显示index(索引)值。
参数encoding=“utf-8”,表示保存的文件编码格式为utf-8。
上述是对CSV文件数据删除行或列操作,对Excel文件数据进行删除行或列操作同理。