特牛生活网

spark中RDD的转化操作和行动操作_简述转换和行动操作的概念,以及两者之间的区别-CSDN博客

网友收藏
文章浏览阅读9.2k次。本文主要是讲解spark里RDD的基础操作。RDD是spark特有的数据模型,谈到RDD就会提到什么弹性分布式数据集,什么有向无环图,本文暂时不去展开这些高深概念,在阅读本文时候,大家可以就把RDD当作一个数组,这样的理解对我们学习RDD的API是非常有帮助的。本文所有示例代码都是使用scala语言编写的。  Spark里的计算都是操作RDD进行,那么学习RDD的第一个问题就是如何构建RD_简述转换和行动操作的概念,以及两者之间的区别