特牛网址导航

Spark 性能调优之算子调优_map算子调优-CSDN博客

网友收藏
文章浏览阅读211次。算子调优一:mapPartitions普通的map算子对RDD中的每一个元素进行操作,而mapPartitions算子对RDD中每一个分区进行操作。如果是普通的map算子,假设一个partition有1万条数据,那么map算子中的function要执行1万次,也就是对每个元素进行操作如果是mapPartition算子,由于一个task处理一个RDD的partition,那么一个task只会执..._map算子调优
标签:map算子调优