特牛网址导航

数仓 拉链表_使用拉链表的时候是使用新数据还是旧数据-CSDN博客

网友收藏
文章浏览阅读515次。数仓 拉链表1. 背景在数仓开发中,有时候需要记录下数据的所有历史状态,大家是否想起来,其实企业开发中代码也是有这个需求,公司中的需求文档,设计稿也都是有这个需求的。在大数据场景中,其实很多数据存储框架,都会对数据加版本,这是由于数据存储本身机制导致的。例如HBase,kafka都是有数据版本的。因为这些数据存储到磁盘时,是采取顺序写入,这样写入速度很高甚至可以达到内存随机读写的速度。不过带来的坏处就是不能像正常的数据写入更新同一条数据,而是写入一条新的数据,等到一定时机,再对这些数据做合并。而在_使用拉链表的时候是使用新数据还是旧数据