Hive报错FAILED:Execution Error, return code 3 from org.apache.hadoop.hive.ql.exec.spark.SparkTask. Spark job failed during runtime. Please check stacktrace for the root cause.

2023年7月24日下午9:29 • 技术杂谈 • 阅读 64

问题出现原因：

这个错误是因为hive的map join参数默认是开启的：

hive.auto.convert.join=true

使用hive进行map join时，节点内存不够就会报该类型错误。

MapJoin是指在Map 端进行join，其原理是broadcast join，即把小表作为一个完整的驱动表来进行join操作。通常情况下，要连接的各个表里面的数据会分布在不同的Map中进行处理。即同一个Key对应的Value可能存在不同的Map中。这样就必须等到 Reduce中去连接。要使MapJoin能够顺利进行，那就必须满足这样的条件：除了一份表的数据分布在不同的Map中外，其他连接的表的数据必须在每个Map中有完整的拷贝。Map Join会把小表全部读入内存中，在Map阶段直接拿另外一个表的数据和内存中表数据做匹配 (这时可以使用Distributed Cache将小表分发到各个节点上，以供Mapper加载使用)，由于在map时进行了join操作，省去了reduce运行的效率也会高很多。

当机器内存不足时，无法在Map端进行join，即会报错

解决方法：

1、可以关闭上面的map join 改为common join
shell命令行：set hive.auto.convert.join=false

2、修改配置文件下的参数可以把map join 关闭，使用common join
hive-site.xml

Original: https://www.cnblogs.com/CYan521/p/16716361.html
Author: 再美不及姑娘你
Title: Hive报错FAILED:Execution Error, return code 3 from org.apache.hadoop.hive.ql.exec.spark.SparkTask. Spark job failed during runtime. Please check stacktrace for the root cause.

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/713629/

转载文章受原作者版权保护。转载请注明原作者出处！

技术杂谈

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

source insight4.0最常用到的设置

1、常用功能 1.1：全局查找 1.2：当前文件查找 1.3：高亮设置 1.4：配置字体以及其他 1.5：配置自动缩进 1.6：其他 1. 常用功能全局查找 Ctl+/ 查找到的…

技术杂谈 2023年6月21日
0073
Oracle授权允许远程访问–Oracle配置允许远程连接

WindowsServer安装Oracle11g 11.2.0.1.0 对应的 windows 版本配置远程连接下载安装这里不详述具体安装步骤了，具体操作可参考安装教程： Ora…

技术杂谈 2023年5月31日
0081
经典45个git使用技巧与场合，专治不会合代码。

前言 git对于大家应该都不太陌生，熟练使用git已经成为程序员的一项基本技能，尽管在工作中有诸如 Sourcetree这样牛X的客户端工具，使得合并代码变的很方便。但找工作面试和…

技术杂谈 2023年7月11日
0089
耗时几个月，终于找到了JVM停顿十几秒的原因

原创：打码日记（微信公众号ID：codelogs），欢迎分享，转载请保留出处。简介最近我们系统出现了一些奇怪的现象，系统每隔几个星期会在大半夜重启一次，分析过程花费了很长时间，…

技术杂谈 2023年7月25日
0083
K8s-二进制安装

K8S-二进制安装使用 1.IP总规划服务类型 ip地址组件 k8s-master01 etcd集群节点1 192.168.80.20 kube-apiserver、kube-…

技术杂谈 2023年7月11日
0064
时间序列异常检测zz

更新： 2022/04/07: 新增一些比较有用的github在useful link2022/03/14: 新增统计异常检测方法 Grubbs’ Test 和 ESD…

技术杂谈 2023年5月31日
00100
Jenkins持续集成入门到精通（入门篇）

什么是持续集成持续集成（Continuous integration,简称CI）指的是频繁将代码集成到主干。它的目的，就是让产品可以快速迭代，同时保持高质量。核心措施，代码集成到…

技术杂谈 2023年7月24日
0075
Centos7 中安装Elasticsearch

1.1 下载elasticsearch 7.13.3 curl -L -O https://artifacts.elastic.co/downloads/elasticsearch…

技术杂谈 2023年7月24日
0048
关于docker创建了mysql容器但却启动不了的解决办法

使用以下命令挂载mysql配置文件目录和数据文件 docker run -p 3306:3306 –name mysql57 \ -v /wfd/mysql/conf:/etc/…

技术杂谈 2023年7月11日
0080
23种设计模式之访问者模式（Visitor Pattern）

文章目录概述访问者模式的优缺点访问者模式的使用场景访问者模式的结构和实现 * 模式结构模式实现总结概述访问者模式把数据结构和作用于结构上的操作解耦合，使得操作集合可…

技术杂谈 2023年7月24日
0061
Java并发编程-线程池

重点内容线程池的使⽤创建线程池提交任务关闭线程池线程池的原理合理配置线程池线程池的监控 1.线程池的创建 new ThreadPoolExecutor(corePoo…

技术杂谈 2023年7月11日
0058
生成表达式目录树泛型缓存

1 using System; 2 using System.Collections.Generic; 3 using System.Linq; 4 using System.Li…

技术杂谈 2023年6月1日
0053
【已解决】error: failed to push some refs to ‘xxx’

【已解决】error: failed to push some refs to ‘xxx’ 【已解决】error: failed to push some …

技术杂谈 2023年6月21日
0092
Vue笔记：bin-code-editor使用

在 main.js 中写入以下内容： Original: https://www.cnblogs.com/-wenli/p/14902817.htmlAuthor: stdTitl…

技术杂谈 2023年5月31日
0090
[ML从入门到入门] 支持向量机：从SVM的推导过程到SMO的收敛性讨论

引言支持向量机（Support Vector Machine，SVM）在70年代由苏联人 Vladimir Vapnik 提出，主要用于处理二分类问题，也就是研究如何区分两类事物…

技术杂谈 2023年7月24日
0078
杂七杂八

 <span class="hljs-keyword">var head = <span class="hljs-…

技术杂谈 2023年5月31日
0084

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Hive报错FAILED:Execution Error, return code 3 from org.apache.hadoop.hive.ql.exec.spark.SparkTask. Spark job failed during runtime. Please check stacktrace for the root cause.

大家都在看