特牛生活网

Hadoop系列(三)——心脏命脉 MapReduce 详解_hadoop心跳流程图-CSDN博客

网友收藏
文章浏览阅读1.2w次,点赞2次,收藏8次。最近花了一段时间去了解MapReduce 的工作原理:Map对数据集上的独立元素进行指定的操作,生成键值对形式中间结果;shuffle是MapReduce的心脏,对中间结果进行数据整合分区排序处理,有助于编写效率更高的mapreduce程序和hadoop调优;Reduce则对中间结果中相同“键”的所有“值”进行规约,以得到最终结果。自己画了一张流程图如下图,希望能对MapReduce感兴趣/想了解的同学有所帮助。 同时也希望有发现内容不正确或者有疑问的地方,望指明,一起探讨,学习,进步。MapReduc_hadoop心跳流程图