- 链接地址:https://blog.csdn.net/qq_43523503/article/details/115272700
- 链接标题:Hive优化总结-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:8807
文章浏览阅读208次。hive的优化:(1)使用mapjoin①mapjoin的原理是把小表加载到内存中在map端进行join,避免reduce处理②多大的表被视为小表呢?默认是25M以下是小表,通过配置参数set hive.mapjoin.smalltable.filesize=25000000③如何开启mapjoin呢?set hive.auto.convert.join=true(2)Fetch抓取(默认就是more)①什么是fetch?Hive中对某些情况的查询可以不走mapreduce②fetch的级别有_hive优化总结
版权声明:本文发布于特牛网址导航 内容均来源于互联网 如有侵权联系删除
标签:hive优化总结