特牛网址导航

spark(四):RDD介绍_spark rdd-CSDN博客

网友收藏
文章浏览阅读1.3k次。文章目录说明分享什么是RDDRDD生命周期创建RDDRDD变换RDD缓存RDD结果处理RDD特性总结说明本博客每周五更新一次。RDD 是spark计算引擎重要的数据结构,使用RDD开发业务,必须深入学习使用它。分享大数据博客列表什么是RDDRDD(Resilient Distributed Dataset) 弹性分布式数据集,spark中最重要数据结构概念,代表一个不可变、可分区、可并行计算的集合,逻辑上是一个数据集,物理上可以分块分布在不同的机器上并发运行。RDD具有数据流模型的_spark rdd
标签:spark rdd