特牛网址导航

Hive的distinct和group by性能比较_hive group by 和distinct性能比较-CSDN博客

网友收藏
文章浏览阅读8.3k次,点赞17次,收藏28次。Hive的distinct和group by性能比较Hive去重统计当一个表的数据量非常大的时候,会发现一个简单的count(distinct order_no)这种语句跑的特别慢,和直接运行count(order_no)的时间差了很多。在能使用group by代替distinc就不要使用distinct验证order_snap为订单的快照表 总记录条数763191489,即..._hive group by 和distinct性能比较