- 链接地址:https://blog.csdn.net/xiaohu21/article/details/109250774
- 链接标题:数仓 拉链表_使用拉链表的时候是使用新数据还是旧数据-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:6997
文章浏览阅读515次。数仓 拉链表1. 背景在数仓开发中,有时候需要记录下数据的所有历史状态,大家是否想起来,其实企业开发中代码也是有这个需求,公司中的需求文档,设计稿也都是有这个需求的。在大数据场景中,其实很多数据存储框架,都会对数据加版本,这是由于数据存储本身机制导致的。例如HBase,kafka都是有数据版本的。因为这些数据存储到磁盘时,是采取顺序写入,这样写入速度很高甚至可以达到内存随机读写的速度。不过带来的坏处就是不能像正常的数据写入更新同一条数据,而是写入一条新的数据,等到一定时机,再对这些数据做合并。而在_使用拉链表的时候是使用新数据还是旧数据
版权声明:本文发布于特牛网址导航 内容均来源于互联网 如有侵权联系删除