Hadoop集群数据分发——pyspark导出及python写入excel文件或csv文件及邮件附件发送
场景 《Shell语言调用SparkSQL抽取业务DB数据到hadoop集群》讲述了如何将业务库的数据etl到hadoop集群ods层,在hadoop集群上经过spark,hive控件处理dwd层,dm层以及app层后,很多需要还是需要将集群的数据再分发到集群外,比如数据导成excel,csv,数据回写到mysql,sqlserver等等,也找了很多大数据工具,感觉都不是很灵活,于是乎就自己用p