大数据开发之Spark总结_大数据spark技术栈-CSDN博客文章浏览阅读247次。一、本质Spark是一个分布式的计算框架,是下一代的MapReduce,扩展了MR的数据处理流程二、mapreduce有什么问题1.调度慢,启动map、reduce太耗时2.计算慢,每一步都要保存中间结果落磁盘3.API抽象简单,只有map和re...... admin2024-01-22