PySpark数据分析基础:PySpark基础功能及DataFrame操作基础语法详解_pyspark rdd(1)
dfDataFrame[a:bigint,b:double,c:string,d:date,e:timestamp]####通过由元组列表组成的RDD创建rdd=spark.sparkContext.parallelize([(1,2.,‘string1’,date(2000,1,1),datetime(2000,1,1,12,0)),(2,3.,‘string2’,date(2000,2,1),