特牛生活网

zhihu spark集群,书籍,论文-CSDN博客

网友收藏
文章浏览阅读2.8k次。spark集群中的节点可以只处理自身独立数据库里的数据,然后汇总吗?修改我将spark搭建在两台机器上,其中一台既是master又是slave,另一台是slave,两台机器上均装有独立的mongodb数据库。我是否可以让它们只统计自身数据库的内容,然后将结果汇总到一台服务器上的数据库里?目前我的代码如下,但是最终只统计了master里的数据,另一个worker没有统计上。..._spark论文书籍