特牛生活网

spark写入hdfs_spark 写入hdfs-CSDN博客

网友收藏
文章浏览阅读1w次。spark streaming写入hdfs场景: 需要将数据写入hdfs,打包成一个gz包, 每5分钟执行一次spark任务。最终的结果如下:5分钟跑一次spark, 将数据写入hdfs, 会产生很多的小文件。spark代码val hadoopConf: Configuration = rdd.context.hadoopConfigurationhadoopConf.set("ma..._spark 写入hdfs
标签:spark 写入hdfs