MapReduce计算班级/全体分数的均值与最值

实验环境:hadoop-3.1.0      java-1.8.172     centOS 7    IDEA

问题引入:

MapReduce计算班级/全体分数的均值与最值_第1张图片

中文表述:

假设有N个班级在学习一门课程,第i个班级有M[i]个学生。课程成绩按照班级,分别存放在单独的文本文件中,如File1.txt是1班的成绩,File2.txt是2班的成绩,以此类推。

(1)在本地文件系统中,首先使用随机数生成N个班级的成绩文件,包括学生的学号、姓名、成绩。注意:成绩要在[0,100]范围内。
(2)使用HDFS 的Java API将上述文件上传至HDFS。
(3)使用MapReduce程序,计算每个班级的平均分、最高分、最低分,以及所有学生的平均分、最高分和最低分。输出时,各个班级的平均分输出班级编号和平均分;所有学生的平均分只输出平均分。最高分、最低分需要输出班级编号、学生和成绩,如果有多个最高分和最低分,则需要输出所有的最高分和最低分。

(4)编写MapReduce程序,按照优秀(>

你可能感兴趣的:(MapReduce计算班级/全体分数的均值与最值)