Hive报错FAILED:Execution Error, return code 3 from org.apache.hadoop.hive.ql.exec.spark.SparkTask. Spark job failed during runtime. Please check stacktrace for the root cause.

问题出现原因:

这个错误是因为hive的map join参数默认是开启的:

hive.auto.convert.join=true

使用hive进行map join时, 节点内存不够就会报该类型错误。

MapJoin是指在Map 端进行join,其原理是broadcast join,即把小表作为一个完整的驱动表来进行join操作。通常情况下,要连接的各个表里面的数据会分布在不同的Map中进行处理。即同一个Key对应的Value可能存在不同的Map中。这样就必须等到 Reduce中去连接。要使MapJoin能够顺利进行,那就必须满足这样的条件:除了一份表的数据分布在不同的Map中外,其他连接的表的数据必须在每个Map中有完整的拷贝。Map Join会把小表全部读入内存中,在Map阶段直接拿另外一个表的数据和内存中表数据做匹配 (这时可以使用Distributed Cache将小表分发到各个节点上,以供Mapper加载使用),由于在map时进行了join操作,省去了reduce运行的效率也会高很多。

当机器内存不足时,无法在Map端进行join,即会报错

解决方法:

1、可以关闭上面的map join 改为common join
shell命令行:set hive.auto.convert.join=false

2、修改配置文件下的参数可以把map join 关闭,使用common join
hive-site.xml

Original: https://www.cnblogs.com/CYan521/p/16716361.html
Author: 再美不及姑娘你
Title: Hive报错FAILED:Execution Error, return code 3 from org.apache.hadoop.hive.ql.exec.spark.SparkTask. Spark job failed during runtime. Please check stacktrace for the root cause.

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/713629/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • Saltstack系列3:Saltstack常用模块及API

    API原理是通过调用master client模块,实例化一个LocalClient对象,再调用cmd()方法来实现的。以下API实现test.ping的示例:(其他API调用只需…

    技术杂谈 2023年5月31日
    081
  • [翻译]——Accelerated Database Recovery; Instant Rollback and Database Recovery

    前言: 本文是对这篇博客Accelerated Database Recovery; Instant Rollback and Database Recovery的翻译,翻译如有不…

    技术杂谈 2023年5月30日
    079
  • ADSL理解

    ADSL技术能够充分利用现有PSTN (Public Switched Telephone Network ,公共交换电话网),只须在线路两端加装ADSL设备即可为用户提供高宽带服…

    技术杂谈 2023年5月30日
    0113
  • nodejs集群

    nodejs集群 单个 Node.js 实例运行在单个线程中。 为了充分利用多核系统,有时需要启用一组 Node.js 进程去处理负载任务。 集群中的Master 现在让我们详细了…

    技术杂谈 2023年5月31日
    086
  • vs 2005 thread 无法调试

    两种办法: 1、打开项目属性,在”Debug”一项里,把”Enable the Visual Studio hosting process&#8…

    技术杂谈 2023年7月11日
    060
  • 千古前端图文教程-HTML010-HTML5详解3

    HTML5详解3 HTML5详解3 Web 存储 #H5 中有两种存储的方式 #Web 存储的特性 #常见 API 案例:记住用户名和密码 网络状态 应用缓存 #优势 # cach…

    技术杂谈 2023年7月11日
    097
  • 蓝牙搜索

    /******************************************************************** created: 2010/01/29 …

    技术杂谈 2023年5月31日
    0101
  • 透明Panel

    unit TransparentPanel; interface uses Winapi.Windows, Winapi.Messages, System.SysUtils, Sy…

    技术杂谈 2023年5月31日
    071
  • SpringBoot自定义Banner信息

    SpringBoot自定义Banner信息 一、介绍 本文主要介绍使用springboot框架时,我们可以自定义我们项目的相关信息,例如启动图、启动时的版本号等。 二、自定义ban…

    技术杂谈 2023年6月21日
    0107
  • NoteOfMySQL-13-事务与并发控制

    一、事务简介 存储引擎如InnoDB、BDB才支持事务处理。 每个事务(transaction)的处理必须满足ACID原则: 原子性(Atomicity): 原子性指每个事务都必须…

    技术杂谈 2023年7月11日
    099
  • Nginx

    2022-08-15 22:06:21 星期一2022-09-03 18:23:18 星期六 操作系统安装: centos7 mini版,修改网络配置文件,重启网络服务,查看ip命…

    技术杂谈 2023年7月11日
    066
  • ReadWriteLock接口详解

    ReadWriteLock 接口详解 这是本人阅读ReadWriteLock接口源码的注释后,写出的一篇知识分享博客 读写锁的成分是什么? 读锁 Lock readLock(); …

    技术杂谈 2023年7月24日
    082
  • 武林头条-建站小能手争霸赛

    好话说在前头 如果你 想在自己的主机上 搭建一个属于自己的、独一无二的博客 想学会自主安装WordPress 掌握CentOS常用命令 可以在WordPress上自主安装主题和插件…

    技术杂谈 2023年7月11日
    070
  • 理解Compressed Sparse Column Format (CSC)

    最近在看《Spark for Data Science》这本书,阅读到《Machine Learning》这一节的时候被稀疏矩阵的存储格式CSC给弄的晕头转向的。所以专门写一篇文章…

    技术杂谈 2023年6月1日
    092
  • SpringBoot-Mybatis

    SpringBoot 整合 Mybatis SpringBoot-Mybatis 10.1 导入 MyBatis 所需要的依赖 org.mybatis.spring.boot my…

    技术杂谈 2023年6月21日
    073
  • 解决用官方容器启动redmine无法插入中文字符的问题

    之前采用docker-compose顺利搭建了redmine,但是在使用时发现无法插入中文字符,始终报internal server error错误,后来看日志,显示插入异常,现在…

    技术杂谈 2023年5月31日
    0111
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球