特牛网址导航

spark中mapPartitions双重循环或两次遍历(duplicate)_spark map遍历-CSDN博客

网友收藏
文章浏览阅读6.1k次。在spark当中通常需要对mapPartitions内部进行计算,这样可以在不进行网络传输的情况下,对数据进行局部计算而mapPartitions中的迭代器为Iteratorscala中的Iterator只能进行一次迭代,使用过后就消失了,所以在mapPartitions中既不能两次遍历如:一次mapPartitions求最大最小值val it = Iterator(20, 40,_spark map遍历
标签:spark map遍历