Pandas新增数据列

5.pandas新增数据列

进行数据分析时,经常需要按照一定的条件创建新的数据列,然后进行进一步分析。

@直接赋值

@df.apply语法

@df.assign语法

@按条件选择分组分别赋值

演示:

import pandas as pd

fpath="文件位置"
df=pd.read_csv(fpath)

#直接赋值方法
df.loc[:,"索引列名"]=df["索引列名"].str.replace("str","").astype('int32')#替换字符串
#这里导入一个实例,计算温差
df.loc[:,"新索引列名"]=df["减数索引列名"]-df["被减数索引列名"]


#df.apply方法
#实例:添加一列温度类型:1.如果大雨33度就是高温 2.低于-10度就是低温 3.否则为常温
def get_wendu_type{
     X}:
  if x["bWendu"]>33:
    return '高温'
  if x["yWendu"]<-10:
    return '低温'
  return '常温'
df.loc[:,"wendu_type"]=df.apply(get_wendu_type,axis=1)
#查看温度类型计数
df["wendu_type"].value_counts()


#df.assign方法
#实例 实现温度转换
df.assign(
	Ywendu_huashi=lamba x:x["索引列名"]*9/5+32,
  
  Bwendu_huashi=lamba x:x["索引列名"]*9/5+32
)


#按条件选择分组分别赋值
df['wencha_type']=''#创建空列

df.loc[df["bWendu"]-df["yWendu"]>10,"wencha_type"]="温差大"
df.loc[df["bWendu"]-df["yWendu"]<=10,"wencha_type"]="温差正常"

#查看
df["wencha_type"].value_counts()

你可能感兴趣的:(数据挖掘,pycharm,大数据)