特牛生活网

深入了解Spark RDD(未完成)_doublerdd-CSDN博客

网友收藏
文章浏览阅读224次。概述 RDD(Resilient Distributed Dataset,弹性分布式数据集),是spark最基本的抽象数据类型。用来表示一个不可变的,多分区的,可以并行操作的元素集合。 其中,PairRDDFunctions包含的算子只能被键值对RDD调用所以类似(1,2,3)是无法调用的 DoubleRDDFunctions包含的算子只能被元素内均为Double类型的RDD调用 当基本的..._doublerdd
标签:doublerdd