文章浏览阅读596次。1 引入背景:目前我们实时接入binlog,用的是kudu,但kudu对大事务支持不好,关键成本比较高,大数据加胜同学建议尝试数据湖,从而开始了数据湖的探索。后续与培殿同学一直配合跟进数据湖,发掘出数据......
admin
文章浏览阅读1.5w次,点赞8次,收藏51次。转载自https://mp.weixin.qq.com/s/321mkZsuxqXOme5hw_83mQ网管产品需要从数据仓库的角度来看,才能获得完整的视图。数据集成真正从大数据的角度来看,才能明白其中的挑战。一个运行了20多年的......
admin
文章浏览阅读757次。我们都知道,进行数据分析工作的时候会用到很多的工具,比如说数据湖和数据仓库,不过这两者之间的差异和区别,可能会让人困惑。那么大家知道不知道数据湖和数据仓库的区别是什么呢?下面我们就给......
admin
文章浏览阅读657次,点赞2次,收藏2次。数据湖调研文档_数据调研文档...
admin
文章浏览阅读2.2k次。数据湖2018.2.21版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。我们生活在数据时代,根据Gartner的报告,全球信息数据量每年以59%的速度递增。管理海量数据是一个重大挑战,数据的品种和......
admin
YoungerChina擅长数据存储,内核驱动,数据湖,等方面的知识,YoungerChina关注分布式领域....
admin
数据湖 - 学习笔记(一),数据湖...
admin
文章浏览阅读550次。数据湖是数据仓库的补充,是为了解决数据仓库漫长的开发周期,高昂的开发、维护成本,细节数据丢失等问题出现的。数据湖大多是相对于传统基于RDBMS的数据仓库,而从2011年前..._datalack分层...
admin
数据湖探索(Data Lake Insight,简称DLI)是一款大数据分析工具,提供标准SQL,完全兼容Spark接口,支持自动弹性扩展,云上多数据源联邦分析,提供资源和数据细粒度管控的多租户能力,广泛应用于IoT,互联网,游戏等行业统计......
admin
文章浏览阅读257次。前言随着大数据技术的不断更新和迭代,数据管理工具得到了飞速的发展,相关概念如雨后春笋一般应运而生,如从最初决策支持系统(DSS)到商业智能(BI)、数据仓库、数据湖、数据..._横向的数据共享和分析......
admin
大数据技术架构擅长HBase,数据湖Hudi/Iceberg/Delta,Flink,等方面的知识,大数据技术架构关注flink,kubernetes,spark,kafka,big data领域....
admin
flink SQL报错java.lang.NoSuchMethodError: com.google.common.base.Preconditions.checkArgument(ZLj,Flink + Hudi demo 环境,SparkSQL查询Apache Hudi表进入命令,apache,hudi...
admin
CDC一键入湖:当 Apache Hudi DeltaStreamer 遇见 Serverless Spark,探索Apache Hudi核心概念(系列文章),探索Apache Hudi核心概念 (4) - Clustering,hudi,datalake,增量处理...
admin
文章浏览阅读2.2k次。来源:知乎 作者:十叶心全文共14108个字,建议阅读 20分钟一、基本概念1.1数仓发展历史数据湖是以集中方式存储各种类型数据,提供弹性的 容量和吞吐能力,能够覆盖广泛的数据源,支持多种计算与处理......
admin
文章浏览阅读1.6k次。前言 元数据管理是企业数据治理的基础,是数据仓库的提升。作为一名数据人,首要任务就是理解元数据管理。本篇文章将为大家梳理元数据的概念,介绍元数据管理在数据仓库的地位、场景及工具......
admin
MapReduce服务(MapReduce Service)为客户提供ClickHouse、Spark、Flink、Kafka、HBase等Hadoop生态的高性能大数据引擎,支持数据湖、数据仓库、BI、AI融合等能力,完全兼容开源,快速帮助客户上云构建低成本、灵活开放、安全可靠、全栈式......
admin
友情链接申请要求: 不违法不降权 权重相当 请联系QQ:737597453