特牛网址导航

Hive优化总结-CSDN博客

网友收藏
文章浏览阅读208次。hive的优化:(1)使用mapjoin①mapjoin的原理是把小表加载到内存中在map端进行join,避免reduce处理②多大的表被视为小表呢?默认是25M以下是小表,通过配置参数set hive.mapjoin.smalltable.filesize=25000000③如何开启mapjoin呢?set hive.auto.convert.join=true(2)Fetch抓取(默认就是more)①什么是fetch?Hive中对某些情况的查询可以不走mapreduce②fetch的级别有_hive优化总结
标签:hive优化总结