- 链接地址:https://blog.csdn.net/u012102306/article/details/53033706
- 链接标题:spark中mapPartitions双重循环或两次遍历(duplicate)_spark map遍历-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:5715
文章浏览阅读6.1k次。在spark当中通常需要对mapPartitions内部进行计算,这样可以在不进行网络传输的情况下,对数据进行局部计算而mapPartitions中的迭代器为Iteratorscala中的Iterator只能进行一次迭代,使用过后就消失了,所以在mapPartitions中既不能两次遍历如:一次mapPartitions求最大最小值val it = Iterator(20, 40,_spark map遍历
版权声明:本文发布于特牛网址导航 内容均来源于互联网 如有侵权联系删除
标签:spark map遍历