Hive动态分区表的创建、及数据加载

Hive动态分区表的创建、及数据加载

你吻我是因为你寂寞,我不反抗是因为我爱你

Hive动态分区表的创建、及数据加载
往hive分区表中插入数据时,如果需要创建的分区很多,比如以表中日期字段进行分区存储,则需要复制粘贴修改很多sql去执行,效率低。因为hive是批处理系统,所以hive提供了一个动态分区功能,其可以基于查询参数的位置去推断分区的名称,从而建立分区。

在创建动态分区表时,首先要在当前会话窗口做如下设置

 set hive.exec.dynamic.partition =true
 set hive.exec.dynamic.partition.mode = nonstrict

创建动态分区表

CREATE TABLE if not exists Person_Score (
occurTime string, --成绩记录时间(以日期作为分区字段)
name string, --学生姓名
score int --学生成绩
)
PARTITIONED BY (runtime string)   --分区字段名称,该名称可以随意
row format delimited fields terminated by ','
stored as textfile

测试数据
将Person_Score_tmp表的数据,根据日期字段插入动态分区表Person_Score中

Hive动态分区表的创建、及数据加载
未插入数据前,该分区表Person_Score在hdfs的目录下没有任何文件Hive动态分区表的创建、及数据加载
将Person_Score_tmp表的数据插入Person_Score中

注意:动态分区表只能通过insert overwrite的方式加载,并且查询的字段要和创建表的字段一致,查询字段的最后一个字段默认是分区表的字段

insert overwrite table Person_Score partition(runtime) select occurTime,name,score,occurTime from Person_Score_tmp;

最终效果,动态分区表在指定目录下生成多个分区文件

Hive动态分区表的创建、及数据加载
重要的事情说三遍
查询字段的最后一个字段默认是分区表的字段
查询字段的最后一个字段默认是分区表的字段
查询字段的最后一个字段默认是分区表的字段

Hive动态分区表的创建、及数据加载
拉屎的时候,
为什么要玩手机......?
如果不玩手机,
玩屎吗......?

Original: https://blog.csdn.net/weixin_42327882/article/details/108665345
Author: 麦兜大叔
Title: Hive动态分区表的创建、及数据加载

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/13449/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • 深入浅出 Spark Thrift Sever

    一,Spark Thrift Sever是什么 Spark借助Hive的Metadata Service可以实现通过命令行客户端工具执行Sql语句,就像是Hive或者Mysql的命…

    大数据 2023年2月21日
    011
  • 【Golang开发面经】B站(两轮技术面)

    文章目录 写在前面 笔试 一面 * Go的GMP模型 GO的GC Go的map底层是怎么实现的? 遍历map是有序的吗?为什么? map作为函数是什么传递? 在函数里面修改map会…

    大数据 2023年2月13日
    010
  • Android知识点复习笔记

    Android 系统架构:Linux内核层:为Android的各种硬件提供底层的驱动系统运行库层:通过C/C++提供主要的特性支持,例如SQlite提供数据库支持应用框架层:提供了…

    大数据 2023年2月7日
    027
  • redis命令行查询某个key值

    使用工具xshell连接到按照redis的linux服务器,然后执行以下命令: [root@dbserver 10:28 ~ ]$ redis-cli 127.0.0.1:6379…

    大数据 2023年2月8日
    021
  • ELK+filebeat+kafka部署 (3)Kafka部署

    目录 部署Kafka 1.部署jdk 上传软件包 解压jdk 配置jdk环境变量 查看java 环境 2.安装zookeeper 配置hosts 映射 解压安装包 创建快照日志存放…

    大数据 2023年3月4日
    08
  • flink1.13 sql基础语法(二)join操作

    Redis的常用的集群方式主要有以下3种 1:主从复制 2:哨兵(Sentinel) 3:Cluster 一、主从 主从其实就是一般包含一个主,一个或多个从,从节点从主节点复制数据…

    大数据 2023年2月8日
    09
  • 人脸识别-人脸建库学习:Sqlite3 的基本使用

    调试:本次为方便调试,未使用参考工程中cmakelist搭建,选择qt5搭建测试工程,工程qmake.pro 配置: QT -= gui CONFIG += c++11 conso…

    大数据 2023年2月6日
    019
  • Jedis的了解和使用、Jedis使用Redis事务

    我们要使用java来操作redis 什么是Jedis? 什么是Jedis 是Redis官方推荐的java连接开发工具!使用Java操作Redis 中间件!(就是一个jar包)如果你…

    大数据 2023年2月14日
    09
  • Apache Atlas服务安装

    Atlas架构: Atlas 是一组可扩展和可扩展的核心基础治理服务——使企业能够有效且高效地满足其在 Hadoop 中的合规性要求,并允许与整个企业数据生态系统集成。Apache…

    大数据 2023年2月21日
    011
  • 连接SQL Server 数据库

    连接时有时候需要 SQL Server 允许用户远程登陆。 身份认证方式选择 windows 身份认证。这是通过操作系统进入数据库。 也可以通过用户名和密码进入 SQL Serve…

    大数据 2023年2月15日
    08
  • 挑战100天不停更之hive sql第3天- 累计求值

    🌿挑战100天不停更,刷爆 hive sql🧲 NUM: 第3天- 累计求值 详情请点击🔗我的专栏🖲,共同学习,一起进步~ 文章目录 * – 🌿挑战100天不停更,刷爆…

    大数据 2023年3月6日
    07
  • Kafka — 导入和导出数据

    前提: 一个正常的zookeeper环境和kafka环境:Kafka — linux下简单实用自带脚本启动测试_DGH2430284817的博客-CSDN博客 测试导入…

    大数据 2023年2月27日
    07
  • MySQL数据库中的索引(含SQL语句)

    文章目录 为什么要用索引 索引是什么 索引的原理 * 优点 缺点 创建索引的原则 * 什么情况下需要索引 什么情况下不需要索引 索引的分类 * 主键索引 单值索引 唯一索引 组合索…

    大数据 2023年2月25日
    011
  • 学习open62541 — [58] 使用数据库存储历史数据

    本文讲述如何把OPCUA的历史数据存储到数据库里,数据库使用SQLite3,运行环境Debian 10,Ubuntu也是一样。 文章目录 * – 一 源码来源 &#82…

    大数据 2023年2月7日
    040
  • 深入理解Kafka Producer内部机制

    总的来说,Kafka Producer是将数据发送到kafka集群的客户端。其组成部分如下图所示: 基本组件: Producer Metadata——管理生产者所需的元数据:集群中…

    大数据 2023年2月27日
    09
  • docker搭建Zookeeper集群搭建

    0.前言 之前在学springcloud的时候,提到有些项目还是使用zookeeper作为注册中心。 因此决定掌握这个技能,但是部署zookeeper集群还是比较麻烦的。 因此打算…

    大数据 2023年2月28日
    018
最近整理资源【免费获取】:   👉 程序员最新必读书单  | 👏 互联网各方向面试题下载 | ✌️计算机核心资源汇总