- 链接地址:https://shenchunxu.blog.csdn.net/article/details/101178901
- 链接标题:[scala-spark]8. RDD的实现和编程接口_spark rdd编程入口-CSDN博客
- 所属网站:shenchunxu.blog.csdn.net
- 被收藏次数:6077
文章浏览阅读396次。1. RDD的实现作业调度当对RDD执行“转换操作”时,调度器(DGAScheduler)会根据RDD的血统来构建由若干调度阶段(State)组成的有向无环图(DAG),每个调度阶段包含尽可能多的连续“窄依赖”转换。调度器按照有向无环图顺序进行计算,并最终得到目标RDD。调度器(TaskScheduler)向各节点分配任务采用延时调度机制并根据数据存储位置来确定(数据本地性:移动计算而非..._spark rdd编程入口
版权声明:本文发布于特牛生活网 内容均来源于互联网 如有侵权联系删除