特牛生活网

《大数据湖最佳实践》读书笔记-CSDN博客

网友收藏
文章浏览阅读1.6k次,点赞4次,收藏10次。本书描述了数据湖基础知识,如基本架构、与数仓的对比、数据存储、元数据处理、数据访问控制等,读完能够让你对数据湖技术有一个概述性的认知。笔记按章节整理如下:一 数据湖概述数据湖的演化成熟度:数据水洼、数据池、数据湖、数据洋。陷入数据黑洞的数据沼泽。规划数据湖:针对不同人群的数据服务层以及对应的数据权限访问控制,原始区、产品区、工作区、敏感区数据查找:在减少数据冗余的同时能够让使用者快速查找到自己需要的数据,保持数据完整性,建立数据索引目录,类似于Hadoop NameNode基于_大数据湖最佳实践