pandas去重及格式转换

1、pandas 读取数据

import pandas as pd
data = pd.read_table('Z:/test.txt',header=None,encoding='gb2312',delim_whitespace=True,index_col=0)
#header=None:没有每列的column name,可以自己设定
#encoding='gb2312':其他编码中文显示错误
#delim_whitespace=True:用空格来分隔每行的数据
#index_col=0:设置第1列数据作为index

data.columns = ['name','pass','len']#设置列名

b=data.drop_duplicates(['name'])#以name删除重复行

lc=pd.DataFrame(b)

lc=lc.sort_values(["pass"],ascending=False)#以pass列排序

lc.to_csv('finally.csv',encoding='gb2312')#输出excel格式

 

你可能感兴趣的:(机器学习)