特牛网址导航

Spark之RDD概述_spark rdd种类-CSDN博客

网友收藏
文章浏览阅读903次。一、什么是RDDRDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象。代码中是一个抽象类,它代表一个弹性的、不可变、可分区、里面的元素可并行计算的集合。1.弹性:存储的弹性:内存与磁盘自动切换容错的弹性:数据丢失可以自动恢复计算的弹性:计算出错重试机制 分片的弹性:可根据需要重新分片2.分布式 数据..._spark rdd种类
标签:spark rdd种类