特牛网址导航

数据倾斜的两个解决方案_join操作中,如果只是某几个key导致倾斜,该方式可以用最有效打散key进行join,-CSDN博客

网友收藏
文章浏览阅读4.4k次,点赞2次,收藏2次。解决方案六:采样倾斜key并分拆join操作方案适用场景:两个RDD/Hive表进行join的时候,如果数据量都比较大,无法采用“解决方案五”,那么此时可以看一下两个RDD/Hive表中的key分布情况。如果出现数据倾斜,是因为其中某一个RDD/Hive表中的少数几个key的数据量过大,而另一个RDD/Hive表中的所有key都分布比较均匀,那么采用这个解决方案是比较合适的。方案实_join操作中,如果只是某几个key导致倾斜,该方式可以用最有效打散key进行join,