特牛生活网

分布式NoSQL列存储数据库Hbase_列族数据库分布式数据存储与管理-CSDN博客

网友收藏
文章浏览阅读190次。(一)数据采集- Flume:实时数据采集:采集文件或者网络端口- Sqoop:离线数据同步:采集数据库的数据(二)数据存储- HDFS:分布式离线文件存储系统- Hive:离线数据仓库- 将HDFS上的文件映射成了表的结构,让用户可以通过数据库和表的形式来管理大数据(三)数据计算- MapReduce+YARN:分布式离线数据计算- Hive:通过SQL进行分布式计算- 将SQL语句转换为MapReduce程序,提交给YARN运行(四)HBASE诞生 随着大数据的发展,大数据_列族数据库分布式数据存储与管理