【MapReduce】Mapreduce基础知识整理(三)
目录 1. 为什么需要自定义输入 2. 默认输入源码分析 2.1 org.apache.hadoop.mapreduce.Mapper 2.2 org.apache.hadoop.mapred.MapTask 2.3 org.apache.hadoop.mapreduce.lib.map.WrappedMapper 2.4 org.apache.hadoop.mapreduce.task.MapContextImpl 2.5 org.apache.hadoop.mapred.MapTask.NewTrackingRecordReader 2.6 org.apache.hadoop.mapreduce.JobContext#getInputFormatClass 2.7 org.apache.hadoop.mapreduce.task.JobContextImpl#getInputFormatClass 2.8 org.apache.hadoop.mapreduce.lib.input.TextInputFormat 2.9 org.apache.hadoop.mapreduce.lib.input.LineRecordReader 2.10 源码总结 3. 自定义输入 1. 为什么需要自定义输入 我们都知道namenode负责存储文件的metadata,运行时所有数据都保存到内存