特牛网址导航

MapReduce原理剖析-CSDN博客

网友收藏
文章浏览阅读4.5k次,点赞4次,收藏23次。MapReduce是一种分布式计算模型,是Google提出来的,主要用于搜索领域,解决海量数据的计算问 题.MapReduce是分布式运行的,由两个阶段组成:Map和Reduce, Map阶段是一个独立的程序,在很多个节点同时运行,每个节点处理一部分数据。 Reduce阶段也是一个独立的程序,可以在一个或者多个节点同时运行,每个节点处理一部分数据在这我们先把reduce理解为一个单独的聚合程序即可。在这map就是对数据进行局部汇总,reduce就是对局部数据进行最终汇总。 结合到我们前面分析的统计黑桃的_mapreduce原理
标签:mapreduce原理