- 链接地址:https://blog.csdn.net/qq_45769990/article/details/115086316
- 链接标题:分布式NoSQL列存储数据库Hbase_列族数据库分布式数据存储与管理-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:8906
文章浏览阅读190次。(一)数据采集- Flume:实时数据采集:采集文件或者网络端口- Sqoop:离线数据同步:采集数据库的数据(二)数据存储- HDFS:分布式离线文件存储系统- Hive:离线数据仓库- 将HDFS上的文件映射成了表的结构,让用户可以通过数据库和表的形式来管理大数据(三)数据计算- MapReduce+YARN:分布式离线数据计算- Hive:通过SQL进行分布式计算- 将SQL语句转换为MapReduce程序,提交给YARN运行(四)HBASE诞生 随着大数据的发展,大数据_列族数据库分布式数据存储与管理
版权声明:本文发布于特牛生活网 内容均来源于互联网 如有侵权联系删除