- 链接地址:https://blog.csdn.net/LEOZHYD/article/details/108352345
- 链接标题:吃透数据倾斜-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:2691
文章浏览阅读149次。原理以及现象先来解释一下,出现什么现象的时候我们认定他为数据倾斜,以及他数据倾斜发生的原理是什么?数据倾斜产生的现象:比如一个spark任务中,绝多数task任务运行速度很快,但是就是有那么几个task任务运行极其缓慢,慢慢的可能就接着报内存溢出的问题了,那么这个时候我们就可以认定他是数据倾斜了。数据倾斜产生的原因:接下来说一下发生数据倾斜的底层理论,其实可以非常肯定的说,数据倾斜就是发生在shuffle类的算子中,在进行shuffle的时候,必须将各个节点的相同的key拉到某个节点上的
版权声明:本文发布于特牛网址导航 内容均来源于互联网 如有侵权联系删除
标签:吃透数据倾斜