特牛生活网

spark sql实战—加载csv文件到动态分区表_sparksql load文件数据到分区表-CSDN博客

网友收藏
文章浏览阅读706次。概述本文讲述如何通过spark sql把一个dataframe加载到spark的动态分区表中。场景介绍把csv和parquet文件加载到spark的动态分区表中,有很多中方案,这里介绍如何通过spark的dataframe把数据文件加载到动态分区表中。注意:为了保证性能,指定分区的字段的字典数据的唯一值最好不要超过几万。这是spark-2.3的partitionBy算子的源码的注释中写到的..._sparksql load文件数据到分区表