特牛生活网

Spark shuffle --------- MR shuffle-CSDN博客

网友收藏
1.复习:MR的shuffle在MR中,shuffle分为两个阶段,分别为shuffle write 和 shuffle read在shuffle writer阶段,会有 写数据-聚合-排序-写磁盘(产生磁盘小文件)-归并排序,合并成大文件在shuffle read阶段,拉取数据写入内存-排序-溢写-合并分组在MR中,排序的是强制的,为了后续的分组2.Spark shuffle:分为...