Impala的使用

2023年5月26日下午10:59 • 大数据 • 阅读 54

用来处理存储在Hadoop集群中大量数据的大规模并行处理的sql查询引擎，它是由C++和Java编写的开源软件，它提供了访问Hadoop中分布式文件系统中的数据的最快的方法。

1.使用Impala，与其他SQL引擎（如Hive）相比，用户可以使用SQL查询以更快的方式与HDFS或HBase进行通信。
2.Impala将相同的元数据，SQL语法（Hive SQL），ODBC驱动程序和用户界面（Hue Beeswax）用作Apache Hive，为面向批量或实时查询提供熟悉且统一的平台。
3.减少了使用MapReduce的延迟，这使Impala比Apache Hive快。

虽然Cloudera Impala使用与Hive相同的查询语言，元数据和用户界面，但在某些方面它与Hive和HBase不同。下表介绍了HBase，Hive和Impala之间的比较分析。
一、
HBase是基于Apache Hadoop的宽列存储数据库。它使用BigTable的概念。

Hive是一个数据仓库软件。使用它，我们可以访问和管理基于Hadoop的大型分布式数据集。

Impala是一个管理，分析存储在Hadoop上的数据的工具。

二、
HBase的数据模型是宽列存储。

Hive遵循关系模型。

Impala遵循关系模型。

三、
HBase是使用Java语言开发的。

Hive是使用Java语言开发的。

Impala是使用C ++开发的。

四、
HBase的数据模型是无模式的。

Hive的数据模型是基于模式的。

Impala的数据模型是基于模式的。

HBase提供Java，RESTful和Thrift API。

Hive提供JDBC，ODBC，Thrift API。

Impala提供JDBC和ODBC API。

六、
HBase支持C，C＃，C ++，Groovy，Java PHP，Python和Scala等编程语言。

Hive支持C ++，Java，PHP和Python等编程语言。

Impala支持所有支持JDBC / ODBC的语言。

七、
HBase提供对触发器的支持。

Hive不提供任何触发器支持。

Impala不提供对触发器的任何支持。

Original: https://www.cnblogs.com/lmandcc/p/16002906.html
Author: lmandcc
Title: Impala的使用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/522563/

转载文章受原作者版权保护。转载请注明原作者出处！

大数据

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Linux快速入门(六)Linux网络管理

ping ping命令用于测试两台主机之间是否可以通信，一般情况下会使用 ping www.baidu.com来测试网络连通性，如果不指定发送包的个数默认是一直发送数据包，可以使用…

大数据 2023年5月26日
0056
AutoWare.auto 与ROS2 亲测安装成功

镜像下载、域名解析、时间同步请点击阿里云开源镜像站 AutoWare.auto 安装实践 1. 相关程序版本说明 ubuntu版本：20.04 ADE：4.4.0 Autoware…

大数据 2023年5月27日
0070
一步步搞懂MySQL元数据锁（MDL）

某日，路上收到用户咨询，为了清除空间，想删除某200多G大表数据，且已经确认此表不再有业务访问，于是执行了一条命令’delete from bigtable&#8217…

大数据 2023年6月2日
0073
Kudu_tool备份还原使用文档

日期版本修订说明修改人 2020-08-3 V1.0.0 创建文档王昱翔目录 1. 引言 3 1.1 背景介绍3 1.2 编写目的3 …

大数据 2023年5月26日
0060
Redis中Zset介绍和常用命令示例

大数据 2023年11月15日
0039
线程池详解

前提：线程池创建有两种方式，一种是Executors使用默认方法创建，另一种是通过ThreadPoolExecutor自定义，不推荐前者是因为前者的配置很多都是取得integer得…

大数据 2023年6月3日
00102
使用Java客户端发送消息和消费的应用

体验链接：https://developer.aliyun.com/adc/scenario/fb1b72ee956a4068a95228066c3a40d6 实验简介本教程将D…

大数据 2023年6月3日
0078
Linux磁盘分区、格式化、挂载

一、前期准备 1）增加一块磁盘 2）查看新增磁盘（lsblk），发现没找到新增的磁盘 3）解决查不到新增磁盘问题二、分区 1）简介 2）fdisk 对磁盘进行分区三、磁盘格式化…

大数据 2023年5月27日
0070
Docker容器进入的4种方式

在使用Docker创建了容器之后，大家比较关心的就是如何进入该容器了，其实进入Docker容器有好几多种方式，这里我们就讲一下常用的几种进入Docker容器的方法。进入Docke…

大数据 2023年5月28日
0086
java sqlite 密码保护_密码保护SQLite数据库 . 可能吗？

要 encrypt an existing unencrypted database 或 to change the password of an encrypted databa…

大数据 2023年11月12日
0044
老司机实战Windows Server Docker：2 docker化现有iis应用的正确姿势

问题分析听说Windows支持原生docker了，大家一定都很兴奋。然而，大家想过没有，Windows Server Docker最适合什么场景呢？部署.NET Core应用？为…

大数据 2023年5月28日
2092
Linux快速入门(四)Linux用户管理

虽然 root用户的的权限很大，但一般情况下，我们都不会直接使用 root用户而是创建一个普通用户，这样可以避免因为权限过大带来的一些误操作，当使用一些需要权限的操作时，可以使用s…

大数据 2023年5月26日
0060
go kafka group

在以前的文章kafka初探go和C#的实现里面我们用了sarama来消费kafka的消息，但是很遗憾它没有group的概念。没办法我们只能用sarama-cluster来实现， …

大数据 2023年5月28日
0091
「事件流处理架构」事件流处理的八个趋势

经过二十多年的研究和开发，事件流处理（ESP）软件平台已不再局限于在小生境应用或实验中使用。它们已经成为许多业务环境中实时分析的基本工具。其动机来自需要分析的流数据量的激增，尤其…

大数据 2023年5月24日
0069
移动终端应用开发(Android)考试（武昌首义学院）

1. Android 谷歌、基于Linux、开源手机平台、使用Java语言，（由Linux操作系统、中间件和应用软件组成） 2. iOS 多点触摸操作是iOS的用户界面基础，（核心…

大数据 2023年11月10日
0049
Hadoop， Hadoop涉及到的一些常见概念（分布式与集群、HDFS、MapReduce等），Hadoop怎么用？

Hadoop， Hadoop涉及到的一些常见概念（分布式与集群、HDFS、MapReduce等），Hadoop怎么用？一、Hadoop是什么，有什么用 1，Hadoop是什么？…

大数据 2023年5月26日
0080

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Impala的使用

大家都在看