任务描述
本关任务:计算并输出各个学生的总成绩。
相关知识
为了完成本关任务,你需要掌握:1.集合并行化创建RDD,2.reduceByKey。
集合创建RDD
Spark会将集合中的数据拷贝到集群上去,形成一个分布式的数据集合,也就是一个RDD。相当于是,集合中的部分数据会到一个节点上,而另一部分数据会到其他节点上。然后就可以用并行的方式来操作这个分布式数据集合,即RDD。
编程要求
根据提示,在右侧编辑器begin-end处补充代码,计算并输出各个学生的总成绩。
(“bj”,88): bj指学生姓名,88指学生成绩。
测试说明
平台会对你编写的代码进行测试:
预期输出:
(bj,254)
(sh,221)
(gz,285)
开始你的任务吧,祝你成功!
package step1;
import org.apache.spark.SparkConf;
import org.apache.spark