CDH集群使用spark作为hive查询引擎（实时查询）

2023年11月13日下午1:50 • 大数据 • 阅读 57

Hive我们用来搭建数仓，对于大量数据以及离线数仓，可以满足，但是

他不能满足实时查询的情况，如果这次客户来了个需求，不在我们统计分析的指标内。

那你单独写SQL，然后通过mr底层，就不能立刻出结果，运行sql和统计将消耗大量时间。

当然有多种方案（impala+kudu)(presto)都可以。我在CDH上使用，自己的虚拟机测试，避免搭建与启动内存过大，所以采用了spark。

前提：CDH已经搭建完毕，并且有hive和spark

CDH集群使用spark作为hive查询引擎（实时查询）

设置hive的计算引擎为spark

apache hadoop（原生）：

1、配置mapreduce计算引擎
set hive.execution.engine=mr;
2、配置tez计算引擎
set hive.execution.engine=tez;
3、配置spark计算引擎
set hive.execution.engine=spark;

但是在cdh中，我们直接通过其中的配置，执行

cdh执行

打开hive配置

不用执行，你选择了spark和yarn他就默认是spark作为计算引擎

CDH集群使用spark作为hive查询引擎（实时查询）

Original: https://blog.csdn.net/qq_38403590/article/details/125989173
Author: 我要用代码向我喜欢的女孩表白
Title: CDH集群使用spark作为hive查询引擎（实时查询）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/818437/

转载文章受原作者版权保护。转载请注明原作者出处！

赞 (0)

0

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

java-maven环境配置Unresolved dependency: ‘org.apache.spark:spark-tags_2.12:jar:3.4.0-SNAPSHOT‘

大数据 2023年11月16日
0089
java使用两对大括号添加集合元素的问题

使用两对大括号实际上是创建了一个内部类，并在内部类内部使用代码块的方式在创建对象的时候进行初始化 ArrayList list = new ArrayList<>(){…

大数据 2023年6月3日
0086
阿里云Redis开发规范

大数据 2023年11月16日
0056
Airflow 安装

文章目录 1、官网 * 1.1、文档 2、安装 * 2.1、本地安装（Running Airflow locally） – 2.1.1、说明 2.1.2、安装环境 2….

大数据 2023年11月11日
0062
idea tomcat启动后没有编译java文件

在项目结构artifact处，Available Elements右键项目，选择 Put into Output Root，就会将依赖和classes编译到out目录需要重启id…

大数据 2023年6月3日
0080
Redis Stream适配SpringBoot实现消息队列

大数据 2023年11月15日
0041
exec: “com.docker.cli”: executable file not found in %PATH%

添加 C:\Program Files\Docker\Docker\resources\bin 到 %PATH% 环境变量 Original: https://www.cnblog…

大数据 2023年5月29日
0070
Redis可视化工具Redis Desktop Manage下载与安装

大数据 2023年11月14日
0038
windows系统使用docker安装redis并挂载配置文件教程

大数据 2023年11月16日
0046
【面试题】Redis是单线程的为什么那么快

大数据 2023年11月16日
0046
docker安装portainer详细步骤

镜像下载、域名解析、时间同步请点击阿里云开源镜像站 docker安装portainer详细步骤 portainer是一款容器管理可视化界面，不想在虚拟中使用命令管理容器的小伙伴，可…

大数据 2023年5月27日
0090
docker WARNING: IPv4 forwarding is disabled. 解决方法

在建容器时报如下错误: WARNING: IPv4 forwarding is disabled. Networking will not work 解决方法: 第一步：找到文件…

大数据 2023年5月29日
0070
提交Spark作业遇到的NoSuchMethodError问题

问题：提交spark任务，hive写ck，部分executor报错java.lang.NoSuchMethodError: org.apache.http.impl.conn.Po…

大数据 2023年11月13日
0033
redis实现点赞功能。

大数据 2023年11月15日
0055
用TensorFlow实现弹性网络回归算法

用TensorFlow实现弹性网络回归算法原创 lilongsy2022-07-08 13:00:31博主文章分类：python ©著作权文章标签 elastic tensor…

大数据 2023年5月25日
0084
Redis安装到Windows系统上的详细步骤

大数据 2023年11月16日
0052

亲爱的 Coder【最近整理，可免费获取】👉 最新必读书单 | 👏 面试题下载 | 🌎 免费的AI知识星球