Hadoop(三)通过C#/python实现Hadoop MapReduce

MapReduce Hadoop中将数据切分成块存在HDFS不同的DataNode中,如果想汇总,按照常规想法就是,移动数据到统计程序:先把数据读取到一个程序中,再进行汇总。 但是HDFS存的数据量非常大时,对汇总程序所在的服务器将产生巨大压力,并且网络IO也十分消耗资源。 为了解决这种问题,Map

你可能感兴趣的:(Hadoop(三)通过C#/python实现Hadoop MapReduce)