特牛网址导航

大数据之Spark 知识体系完整解读_spark数据解读-CSDN博客

网友收藏
文章浏览阅读170次。Spark 简介Spark 是整个 BDAS 的核心组件,是一个大数据分布式编程框架,不仅实现了MapReduce的算子map 函数和reduce函数及计算模型,还提供更为丰富的算子,如filter、join、groupByKey等。是一个用来实现快速而同用的集群计算的平台。 Spark将分布式数据抽象为弹性分布式数据集(RDD),实现了应用任务调度、RPC、序列化和压缩,并为运行在其上的上层..._spark数据解读