任务描述
本关任务:使用 MapRedce 对员工按照部门编号的方式进行分区。
相关知识
为了完成本关任务,你需要掌握:1.如何获取数组的长度,2.如何遍历数组。
OutputFormat及其子类
OutputFormat类
本类主要用于描述输出数据的格式,它能够将用户提供的 key/value 对写入特定格式的文件中。主要涉及以下两个方法:
RecordWriter
void checkOutputSpecs(JobContext var1):用于检测作业输出规范有效性。比如FileOutputFormat中输出路径未设置、输出路径已存在时会抛出异常。该方法通常会在任务初始化阶段被调用。
OutputCommitter getOutputCommitter(TaskAttemptContext var1):方法来负责确保输出被正确提交。
FileOutputFormat类
所有写入到文件系统的类都继承自该类,实现了一些公共方法。输入基类该类继承自OutputFormat类,实现了以上最后两个方法。下面对一些常用方法进行总结。
TextOutputFormat类的每个键-值对由制表符进行分隔, 可通过mapreduce.output.textoutputformat.separator属性改变默认的分隔符。可以使用NullWritabl