大数据技术架构(组件)——Hive：环境准备3

2023年11月12日上午3:35 • 大数据 • 阅读 28

1.0.2、服务启动

在搭建Hadoop的环节中，已经将Hadoop服务启动了，这里将Hive Metastore服务启动

hive --service metastore

1.0.2.1、服务端启动Debug模式

为了方便学习，大家可以在IDEA中打开Terminal，开启debug模式和metastore服务启动。

hive --debug

1.0.2.2、客户端断点模式

1.0.2.2.1、配置remote debug

在IDEA中配置Remote DeBug信息

1.0.2.2.2、断点

由于是在客户端进行源码追溯，所以一般会进入CliDriver类中，比如在main方法中打上断点，然后开始Debug

到这里，整个调试功能就已经实现了，大家可以在本地编写HSQL，然后根据断点深入学习Hive底层具体的执行流程，甚至自己改造源码！

下一章节：流程剖析

大致流程：

1、客户端连接到HS2(HiveServer2，目前大多数通过beeline形式连接，Hive Cli模式相对较重，且直接略过授权访问元数据),建立会话

2、提交sql，通过Driver进行编译、解析、优化逻辑计划，生成物理计划

3、对物理计划进行优化，并提交到执行引擎进行计算

4、返回结果

Original: https://blog.csdn.net/sysocc/article/details/128718994
Author: mylife512
Title: 大数据技术架构(组件)——Hive：环境准备3

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/817081/

转载文章受原作者版权保护。转载请注明原作者出处！

赞 (0)

0

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Spark-StructuredStreaming 下的checkpointLocation分析以及对接 Grafana 监控和提交Kafka Lag 监控

一、Spark-StructuredStreaming checkpointLocation 介绍 Structured Streaming 在 Spark 2.0 版本于 201…

大数据 2023年6月3日
0069
Redis安装教程（超级详细）！！

大数据 2023年11月15日
0029
【SQLite数据库学习】初步了解Sqlite3数据库

一：什么是数据库二：为什么使用数据库三：数据库的特点四：如何使用数据库【关于数据库的常见术语】五：常见的SQL语句的使用一：什么是数据库结构化查询语句是一种对关系型数据…

大数据 2023年11月11日
0032
HDFS的优缺点

HDFS是一个分布式文件存储系统，前身来自于Google发布的大数据三驾马车之一GFS (Google File System)。 1、高容错 hdfs具有很高的容错性，数据自动保…

大数据 2023年6月3日
0084
Python中SQLite使用

Python中SQLite使用一、前言二、创建数据库文件三、操作SQLite * 1.新增用户数据信息 2.查询用户数据信息 3.修改用户数据信息 4.删除用户信息一、前言…

大数据 2023年11月10日
0056
论文笔记 EMNLP 2020|Reading the Manual-Event Extraction as Definition Comprehension

文章目录 * – 1 简介 – + 1.1 创新 – 2 任务定义 – 3 方法 – 4 模型 – 5 实验…

大数据 2023年5月28日
0070
Hive SQL中的lateral view explode使用记录

explode函数先说一说explode函数吧。 Explode()函数是Hive的内置函数，也有人将其称为炸裂函数，此函数将array或map作为输入，按行输出array或m…

大数据 2023年11月13日
0050
Docker 安装 jira笔记

在 /opt/jira 目录下，新建一个名为 Dockerfile的文件，内容如下 FROM cptactionhank/atlassian-jira-software:lat…

大数据 2023年5月29日
0074
VMware vSphere 8 新增功能

请访问原文链接：https://sysin.org/blog/vmware-vsphere-8-whats-new/，查看最新版。原创作品，转载请保留出处。作者主页：www.sy…

大数据 2023年6月3日
00111
Hive+Spark离线数仓工业项目–数仓维度层DWS层构建（1）

大数据 2023年11月13日
0037
3.4 sqlite3的SQL语法和接口,和示例

介绍体积小支持window和Linux（包括Android），跨平台性很好采用的一种库函数的形式来提供数据库的服务文件性的数据库缺点，不能使用网络，单纯就是本地数据库加密性能不是…

大数据 2023年11月10日
0038
通过Sqoop提供的接口把两张表里面的数据同步到大数据平台的Hive数据仓库中。

大数据 2023年11月14日
0036
python flask 操作 Redis，包含详细代码

大数据 2023年11月14日
0028
问题解决 hive插入数据报错 ClassCastException

大数据 2023年11月14日
0045
Termux安装完整版Linux(Ubuntu)详细步骤

镜像下载、域名解析、时间同步请点击阿里云开源镜像站一、Termux 1.Termux简介 Termux是 Android 平台上的一个终端模拟器，之所以称它为”模拟器…

大数据 2023年5月27日
0074
csdn编写稳定规范

这里写自定义目录标题 * 欢迎使用Markdown编辑器 * 1. 新的改变* 2. 功能快捷键* 3. 合理的创建标题，有助于目录的生成* 4…

大数据 2023年5月26日
0077

亲爱的 Coder【最近整理，可免费获取】👉 最新必读书单 | 👏 面试题下载 | 🌎 免费的AI知识星球