Python---pyspark:RDD中数据计算成员方法(map方法、flatMap方法、reduceByKey方法、filter方法、distinct方法、sortBy方法)
1.map算子接受一个处理函数,可用lambda表达式快速编写,对RDD内的元素逐个处理,并返回一个新的RDD注意:对于返回值是新RDD的算子,可以通过链式调用的方式多次调用算子。frompysparkimportSparkConf,SparkContextimportosos.environ['PYSPARK_PYTHON']="D:/dev/python/python310/python.ex