python-dataframe 常用函数合集

1.读取数据

data = pd.read_excel('文件位置.xlsx')

2.根据某列值筛选整行

data=data[data.年龄.isin([23])]

3.重新排序Index

data=data.reset_index(drop=True)

4.修改日期格式

data['日期'] = pd.to_datetime(data['日期'])

5.自定义日期为:202212整数形式

def year_month(x):
  a=x.year
  b=x.month
  return a*100+b
  
data['日期']=data['日期'].apply(year_month)

6.更改多列的前后顺序

order=['销售员','物料编码','物料名称','客户','日期','销售数量']    
data=data[order]

7.更改多列的自身排序:

data.sort_values(by = ['销售员','物料编码','客户','日期'],ascending=[True,True,True,True],inplace=True)

ascending=True代表升序排列
inplace=True代表替代原有数据
8.分组求和

sum= data.groupby(['销售员','物料编码','客户'],as_index='False')['销售数量'].sum()

9.转换数组为dataframe格式并重新排序索引

sum=sum.to_frame().reset_index()

10.筛选某列大于某值所在的整行

kh1=sum[sum.次数>2]

11.重命名列名

data.columns = ['物料编码', '月平均值']

12.新创建一列

data["Flag"] = ""#字符串类型
data["haha"] = 0 #int类型

13.复制dataframe到新的dataframe

a=b.copy(deep=True)

14.删除某列

a.drop(columns = ['Flag'],inplace = True)

15.拼接dataframe

c= a.append(b)

16.按行删除重复

a = a.drop_duplicates()

你可能感兴趣的:(python自学笔记,python,数据分析,pandas)