特牛网址导航

最新Hadoop的面试题总结_hdooopcsdn-CSDN博客

网友收藏
文章浏览阅读9.5k次,点赞22次,收藏300次。1、集群的最主要瓶颈  磁盘IO2、Hadoop运行模式  单机版、伪分布式模式、完全分布式模式3、Hadoop生态圈的组件并做简要描述  1)Zookeeper:是一个开源的分布式应用程序协调服务,基于zookeeper可以实现同步服务,配置维护,命名服务。  2)Flume:一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。  3)Hbase:是一个分布式的、面向列的开源数据库, 利用Hadoop HDFS作为其存储系统。  4)Hive:基于Hadoop的一个数据仓库工具_hdooopcsdn
标签:hdooopcsdn