- 链接地址:https://blog.csdn.net/u012447842/article/details/104694703
- 链接标题:spark写入hdfs_spark 写入hdfs-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:6568
文章浏览阅读1w次。spark streaming写入hdfs场景: 需要将数据写入hdfs,打包成一个gz包, 每5分钟执行一次spark任务。最终的结果如下:5分钟跑一次spark, 将数据写入hdfs, 会产生很多的小文件。spark代码val hadoopConf: Configuration = rdd.context.hadoopConfigurationhadoopConf.set("ma..._spark 写入hdfs
版权声明:本文发布于特牛网址导航 内容均来源于互联网 如有侵权联系删除
标签:spark 写入hdfs