#MultipleOutputs

解读:MultipleOutputs类

//MultipleOutputs类用于简化多文件输出TheMultipleOutputsclasssimplifieswritingoutputdatatomultipleoutputs//案例一:在job默认的输出之外,附加自定义的输出.自定义的输出可以指定:输出格式以及key/value类型.Caseone:wr...
代码星球 ·2020-03-30

MR案例:多文件输出MultipleOutputs

问题描述:现有ip-to-hosts.txt数据文件,文件中每行数据有两个字段:分别是ip地址和该ip地址对应的国家,以''分隔。要求汇总不同国家的IP数,并以国家名为文件名将其输出。解读:MultipleOutputs类测试数据:ip-to-hosts.txt18.217.167.70UnitedStates206....