特牛网址导航

【MapReduce】浅谈MR Shuffle流程_mr suffle过程-CSDN博客

网友收藏
文章浏览阅读380次。MapReduce shuffle:Map方法之后,Reduce方法之前的数据处理过程称之为Shuffle。在shuffle之前,MapReduce通过InputFormat接口中的getSplit()方法,对要当前要处理的HDFS块数据进行逻辑上的分片(split)操作,进而确定MapTask的个数// 分片不会超过blockSize的大小,取goalSize和minSize的最大值finalSplitSize=max(minSize,min(goalSize,blockSize)) _mr suffle过程
标签:mr suffle过程