特牛生活网

企业级大数据项目【2】数仓-流量域ODS-DWD开发篇_数仓流量域-CSDN博客

网友收藏
文章浏览阅读2.8k次,点赞4次,收藏29次。1数仓整体说明什么数仓:一个面向分析的,反映历史变化的数据仓库;数仓的技术手段:1)传统数仓一般都是采用关系型数据库软件;2)大数据领域中则尚无一站式解决方案,通常需要用到很多技术组件来实现不同环节:使用HDFS做存储使用 spark、mapreduce 作为底层计算引擎使用hive或者sparksql,作为sql引擎另外,还有impala/presto纯内存运算引擎,kylin,clickhouse 等各类组件1.1技术选型数据采集:flume存储平台:hdfs基础设施:hiv_数仓流量域
标签:数仓流量域