使用zipwithindex 算子给dataframe增加自增列 row_number函数实现自增,udf函数实现自增...
DataFramedf=...StructTypeschema=df.schema().add(DataTypes.createStructField("id",DataTypes.LongType,false));使用RDD的zipWithIndex得到索引,作为ID值:JavaRDDrdd=df.javaRDD()//转为JavaRDD.zipWithIndex()//添加索引,结果为Java