按时间归档:2023年11月12日
-
使用DataX和sqoop将数据从MySQL导入Hive
使用DataX和sqoop将数据从MySQL导入Hive 一、DataX简述 二、sqoop简述 三、需求背景 四、实现方式 * 3.1 使用DataX将数据从MySQL导入Hiv…
-
搭建大数据集群环境
抵扣说明: 1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。 Original: https://blo…
-
挑战100天不停更hive sql第24天 -累计去重
🌿挑战100天不停更,刷爆 hive sql🧲 详情请点击🔗我的专栏🖲,共同学习,一起进步~ 文章目录 * – 🌿挑战100天不停更,刷爆 hive sql🧲 R…
-
Hive考试练习题(参考题解)
; Hive考试练习题(参考题解) 前置环境: 请打开【VMware Workstation Pro】中的【linux1】环境,登录账号【root】密码【root】。 ; 搭建hi…
-
虚拟机开启hive的命令
一.什么是hiveHive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。其本质是将SQL转换为MapReduce的任务进行…
-
FlinkSQL: Create function using jar-located in HDFS and use Hive UDF
序号作者版本时间备注1HamaWhite1.0.02022-12-05新增Flink UDF2HamaWhite1.0.12022-12-06新增Hive UDF JDK: 1.8…
-
datax数据同步问题(mysql2hive)汇总
文章摘要: 1、代码 2、搭建spark 3、使用datax 4、常见问题 5、指正补充 前言: git代码,有需要的可以参考 
; AntlrWorks 前面我们已经已经介绍过了Antlr的工作原理以及应用,我们也自己动手实现了一个计算器的案例,我们验证规则文件是否有效的方式是idea 的插件,如下所示,就…
-
HBase、ES、Hive
HBase是一个分布式的、面向列的数据库,具有存储海量数据、快速随机访问、进行大量改写操作的优点。它介于NOSQL和RDBMS之间,仅能通过主键(row key)和主键的range…
-
文件存储格式:ORC 与 Parquet的较量
Hive 支持的文件存储格式 Apache Hive支持Apache Hadoop中使用的几种熟悉的文件格式 TextFile(文本格式) RCFile(行列式文件) Sequen…