特牛网址导航

spark 算子使用类变量_Spark RDD 中的变量 & 函数传递-CSDN博客

网友收藏
文章浏览阅读459次。传递函数的场景当我自己封装好一个 RDD 的算子,需要使用,此时需要主要的是,初始化工作是在Driver 端进行的,而实际运行程序是在Executor端进行的,这就涉及到了跨进程通信,是需要把对象序列化的。封装一个算子这个是传递一个变量过滤掉 RDD 小于 num 的数值,并返回一个 RDD。class MyFilter(num: Int) {// 过滤掉 RDD 小于 num 的数值def fi..._spark rdd.foreach里传入变量