特牛生活网

spark学习-CacheManager原理_spark envcache-CSDN博客

网友收藏
文章浏览阅读303次。CacheManager原理:1.RDD调用Iterator()方法,计算当前task要计算出来的partition。2.如果RDD之前持久化过,StorageLevel就不为NONE,就会用CacheManager读取持久化过的数据。3.如果RDD没有持久化过,就会从RDD的父RDD,来执行自定义的算子计算新的RDD的partition数据。4.BlockManager尝试从本地读取数据(get..._spark envcache
标签:spark envcache