pyspark 中文 colomn schema 列 改名

当列名是中文时,你引用该列的名字会报错。

df.姓名 #报error!!
df.name #没有error

所以需要使用 selectExpr改名

df = spark.read.csv("./ex.csv").selectExpr("姓名 as name")

df.name  #不报错

ref:https://stackoverflow.com/questions/34077353/how-to-change-dataframe-column-names-in-pyspark 

你可能感兴趣的:(大数据,pyspark)