特牛生活网

大数据开发之Spark常用RDD算子_spark算子开发-CSDN博客

网友收藏
文章浏览阅读448次。文章目录大数据开发之Spark常用RDD算子mapflatMapmapPartitions和mapPartitionsWithIndexfiltersampleunionjoingroupByKeysort,sortBykeyMapValues常用操作算子大数据开发之Spark常用RDD算子mapmap传入一条数据,返回一条数据map是对RDD中元素逐一进行函数操作映射为另外一个RDD,将一个RDD中的每个数据项,通过map中的函数映射变为一个新的元素。输入分区与输出分区一对一,即:有多少个输入_spark算子开发