特牛网址导航

Hadoop中小文件过多的问题_hadoop blocks数很多-CSDN博客

网友收藏
文章浏览阅读2.9k次。问题定义HDFS上的小文件是指文件大小明显小于HDFS上块(block)大小(默认64MB)的文件。在hdfs上大量存储小文件会给hadoop的扩展性和性能带来严重问题。原因首先,在HDFS中,任何一个文件,目录或者block在NameNode节点的内存中均以一个对象表示(元数据)(Every file, directory and block in HDFS is represented ..._hadoop blocks数很多