- 链接地址:https://blog.csdn.net/qq_22973811/article/details/121032257
- 链接标题:spark(四):RDD介绍_spark rdd-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:1261
文章浏览阅读1.3k次。文章目录说明分享什么是RDDRDD生命周期创建RDDRDD变换RDD缓存RDD结果处理RDD特性总结说明本博客每周五更新一次。RDD 是spark计算引擎重要的数据结构,使用RDD开发业务,必须深入学习使用它。分享大数据博客列表什么是RDDRDD(Resilient Distributed Dataset) 弹性分布式数据集,spark中最重要数据结构概念,代表一个不可变、可分区、可并行计算的集合,逻辑上是一个数据集,物理上可以分块分布在不同的机器上并发运行。RDD具有数据流模型的_spark rdd
版权声明:本文发布于特牛网址导航 内容均来源于互联网 如有侵权联系删除
标签:spark rdd