RDD 中的 reducebyKey 与 groupByKey 哪个性能高?_rdd中reducebykey和groupbykey性能-CSDN博客文章浏览阅读991次。groupByKeyval counts = pairs.groupByKey().map(wordCounts => (wordCounts._1, wordCounts._2.sum))groupByKey的性能,相对来说,是有问题的因为,它是不会进行本地聚合的,而是原封不动的,把ShuffleMapTask的输出,拉取到ResultTask的内...... admin2024-01-22