Hive-特牛生活网-新媒体运营导航,不一样的分类目录平台,网址导航大全,行业供求信息

【Hive】Hive怎么写自定义函数（UDF、UDTF、UDAF）_udaf继承-CSDN博客

文章浏览阅读479次。Hive的自定义函数UDF UDAF UDTF_udaf继承...

2024-01-23

hive-之拉链表的设计与练习_hive拉链表练习题-CSDN博客

文章浏览阅读124次。hive-之拉链表的设计与练习以下是转载地址：Hive拉链表的设计与简单实现经典Hive练习题_hive拉链表练习题...

2024-01-23

hive数据导入导出方式_shecll脚本导入hive文件-CSDN博客

文章浏览阅读4.3k次。1、数据导入load data local inpath '/usr/local/data/user.txt' into table jiuye partition(grade='1');local 表示从本地加载数据，不加local，表示从hdfs上加载数据2、数据导出insert overwrite local direactory '/tmp/11' select * from ..._shecll脚本......

2024-01-23

数仓模型HIVE业务元数据治理:专题构建方案_hive数仓主题域-CSDN博客

文章浏览阅读1.5k次。专题、专题域、主题、主题域、数据域、离线数据仓库、数仓、业务元数据、数据治理、元数据、元数据搜索、表注释、元数据可视化_hive数仓主题域...

2024-01-23

Hive系列（三）—— 性能优化及数据倾斜_hive优化-CSDN博客

文章浏览阅读9.3k次，点赞8次，收藏23次。在Hive使用中，数据倾斜以及解决方案，是老生常谈的问题，一直没有时间去全面的了解；最近花了一段时间，总结了hive性能优化，尤其是数据倾斜的优化如下。希望能对Hive感兴趣/想了......

2024-01-23

Hive面试题系列第一题-连续登录问题_hive 登入登出多次且次数不同-CSDN博客

文章浏览阅读252次。Hive面试题系列第一题-连续登录问题_hive 登入登出多次且次数不同...

2024-01-21

查询所有HIVE表分区数据量_hive查看每个分区的数据量-CSDN博客

文章浏览阅读6.3k次，点赞4次，收藏12次。查询HIVE表分区的数据占用和行数，用于数据治理通常，每天一个分区；通常，今天查看昨天分区数据量本文日期分区字段为ymd_hive查看每个分区的数据量...

2024-01-23

查询所有HIVE表分区数据量_hive查看每个分区的数据量-CSDN博客

2024-01-23

真正让你明白Hive调优系列4：hive中关于所有数据倾斜的处理_hive sum 为什么不会数据倾斜-CSDN博客

文章浏览阅读1.2w次，点赞11次，收藏112次。1.什么是数据倾斜？数据倾斜主要表现在，map /reduce程序执行时，reduce节点大部分执行完毕，但是有一个或者几个reduce节点运行很慢，导致整个程序的处理时间很长，这是因为某一个key......

2024-01-22

Spark-hive.2.4.0操作Hive数据仓库_蜗牛杨哥的博客-CSDN博客

SparkSQL操作Hive数据仓库(spark-hive_2.11)...

2024-01-24

dataFrame存入到Hive_dataframe写入hive-CSDN博客

文章浏览阅读2.2k次。有多种方式把一个dataframe保存到hive表中： 1.直接把dataframe的内容写入到目标hive表 df.write().mode("overwrite").saveAsTable("tableName");或df.select(df.col("col1"),df..._dataframe写入hive...

2024-01-23

hive完全分布式搭建_hive 分布式搭建-CSDN博客

上篇hadoop-ha伪分布式平台基于yarn，后续脚本需要看这里 node1做mysql node3做metastore server node4做客户端安装配置mysql（node1） yum clean all yum makecache yum install mysql-server开启mysql 并开机启动service my..._hive 分布式搭建...

2023-10-11

hive中分区表的创建_hive创建分区表-CSDN博客

1>开启分区set hive.exec.dynamic.partition=true;set hive.exec.dynamic.partition.mode=nonstrict;否则会出抛出异常：2>创建分区表创建静态分区表：create table test_part_table(word string,num bigint )partiti..._hive创建分区表...

2023-10-11

Hive beeline连接_hive beeline所在的jar包-CSDN博客

文章浏览阅读455次。启动hiveserver2服务[kino@bigdata01.sutpc hive]$ bin/hiveserver2启动beeline[kino@bigdata01.sutpc hive]$ bin/beelineBeeline version 1.2.1 by Apache Hivebeeline>连接hiveserver2beeline> !connect ..._hive beeline所在的jar包...

2024-01-23

hive配置_hive怎么配置-CSDN博客

文章浏览阅读372次。一、Hive的简介1.1 出现的原因facebook团队要管理和分析大量的结构化的日志文件，因为写mapreduce非常麻烦,所以该团队就开发出来一个框架，叫hive.1.2 hive是什么hive是一款运行在hadoop上的数据仓库管理工具，可......

2024-01-24

Hive10---explode拆分多行_pyspark hive explode |-CSDN博客

文章浏览阅读1.5k次。Intro hive explode操作import pysparkfrom pyspark.sql import SparkSession# 创建SparkSession对象，调用.builder类# .appName("testapp")方法给应用程序一个名字；.getOrCreate()方法创建或着获取一个已经创建的SparkSessionspa......

2024-01-23

Hive入门_hu hive-CSDN博客

文章浏览阅读100次。1.什么是hive? 要明确的一点是,Hive并不是数据库,而是用于解决海量结构化日志的数据统计(海量的结构化数据的运算分析)的工具。 1）Hive处理的数据存储在HDFS2）Hive分析数据底层的实现是MapReduce / spark(分布式......

2024-01-23

友情链接申请要求：不违法不降权权重相当请联系QQ：737597453