阿里云开发者社区覆盖云计算、物联网、大数据、云原生、数据库、人工智能、微服务、安全、开发、运维等技术领域,集合阿里巴巴经济体各个单元技术优势,提供分享、交流、学习、认证、工具、资源、大赛、活动、社群、......
admin
文章浏览阅读664次。阿里云分区操作和列操作_阿里分区字段组合...
admin
大数据是未来的趋势,在数字化转型时代,把握大数据是关键的! 小林玩大数据 华为云开发者联盟...
admin
目录一、数据传输层1、Sqoop2、Flume3、Kafka二、数据存储层1、HDFS2、HBase三、资源管理层1、YARN一、数据传输层1、SqoopSqoop是一款用来在Hadoop(Hive)和关系型数据库之间传输数据的工具。功能概述:Sqoop主要用于在HDFS/Hive与关系型数......
admin
在过去的十年,我们对存储和管理数据的方式发生了很大的变化,并从ETL模式逐渐转向ELT,然而,小编认为这并不会是终点;未来极有可能会向EL(T)发展,也就是EL和T进行完全解耦。当然这只是... 大数据技术派 华为云开发者联......
admin
ETL是英文Extract-Transform-Load的缩写,用来描述将数据从源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程,它能够对各种分布的、异构的源数据(如关系数据)进行抽取,按照预先设计的规则将不完整数据、重复数据以......
admin
随着计算机技术全面融入社会生活,信息爆炸已经积累到了一个开始引发变革的程度。它不仅使世界充斥着比以往更多的信息,而且其增长速度也在加快。那么大数据技术都包括哪些。 大数据技术包括数据收集、数据存......
admin
kafka是最初由linkedin公司开发的,使用scala语言编写,kafka是一个分布式,分区的,多副本的,多订阅者的消息队列系统。常见的消息队列:RabbitMQ,Redis ,zeroMQ ,ActiveMQkafka的优势:Broker:kafka集群中包含一个或者多个服务实例......
admin
数据只有一个目的:推荐一、什么是ETL?二、ETL & ELT三、常用的ETL工具 3.1 sqoop 3.2 DataX 3.3 Kettle 3.4 canal 3.5 StreamSets四、ETL加载策略 4.1 增量 4.2 全量 4.3 流式一、什么是ETL?ETL,是英文Extract-Transform-Load的缩写,用来描述将数......
admin
目录1、什么是映射2、什么是etl3、kettle抽数一般遇到什么问题,你们是怎么解决的?4、如果抽取的数据有重复,怎么解决5、etl脚本开发以后,怎么运维6、一张特别大的表,几千万,几亿 的表,怎么通过etl工具同步7、数据同步......
admin
如今这个数字化时代,需求大薪资高的,依然非大数据工程师莫属。我跟不少行业大佬聊过,他们纷纷表示,大数据现在依然处在非常强的爆发期,依然是“黄金时代”!这里有两个关键趋势:一是实时化,从传统的T+1数仓到实......
admin
友情链接申请要求: 不违法不降权 权重相当 请联系QQ:737597453