- 链接地址:https://tiger.blog.csdn.net/article/details/83388955
- 链接标题:Hive的distinct和group by性能比较_hive group by 和distinct性能比较-CSDN博客
- 所属网站:tiger.blog.csdn.net
- 被收藏次数:6347
文章浏览阅读8.3k次,点赞17次,收藏28次。Hive的distinct和group by性能比较Hive去重统计当一个表的数据量非常大的时候,会发现一个简单的count(distinct order_no)这种语句跑的特别慢,和直接运行count(order_no)的时间差了很多。在能使用group by代替distinc就不要使用distinct验证order_snap为订单的快照表 总记录条数763191489,即..._hive group by 和distinct性能比较
版权声明:本文发布于特牛网址导航 内容均来源于互联网 如有侵权联系删除