特牛生活网

Spark-Stage任务划分-CSDN博客

网友收藏
文章浏览阅读245次。Spark-Stage任务划分0.先回忆一下YarnClient运行模式需要记住的是下面两个:(他们都是发生在Driver端)​ 切分任务使用的是DAGScheduler,类似于Hadoop的切片。​ 分配任务使用TaskScheduler,管理由多少任务,具体执行。1.任务运行的整体流程RDD Objects:是写的代码。DAGScheduler:根据shuffle的个数,划分任务。相当于是计划。TaskScheduler:负责任务的调度。具体的执行是Executor端。TaskSch