特牛生活网

hdfs小文件使用fsimage分析实例-CSDN博客

网友收藏
文章浏览阅读4k次,点赞3次,收藏9次。这里写目录标题1 小文件来源分析1.1 数据主要来源:2 处理方案2.1 实时计算任务2.2 hive做优化,小文件做合并:2.2.1 已有数据2.2.2 新接入数据做数据合并后在load进hive新表dwd层及以后可以通过设置这些参数。2.2.3 mapreduce 定义规范3fsimage 离线分析hdfs内容3.1创建hive表 存储元数据,做分析用3.2 处理fsimage文件3.2.1获取fsimage文件:3.2.2从2进制文件解析:3.2.3加载进hive中3.2.4 统计文件整体情况3.2.