特牛网址导航

MapReduce原理_reduce的并行度不手动指定的默认计算方式-CSDN博客

网友收藏
文章浏览阅读354次。一、为啥叫MapReduce首先解释为啥叫MapReduce,MapReduce名字的起源可以追溯到谷歌2004年的一篇论文《MapReduce:Simplified Data Processing on Large Clusters》 ,论文题目就是MapReduce,而在Hadoop中连名字都没有修改。1、Map:以一条记录为单位做映射。映射、变换、过滤;1 进N 出2、Reduce:以一组为单位做计算。分解、缩小、归纳;1 组进N 出二、MapReduce的原理上图左边即是Map的过程,右_reduce的并行度不手动指定的默认计算方式