数据仓库hive本地/远程模式安装

文章目录

1.简述

hive的安装模式有三种:嵌入模式、本地模式以及远程模式。
嵌入模式:即使用hive自身内嵌的数据库Derby作为存储介质进行数据的存储。
本地模式:即使用外部数据库作为存储介质进行数据的存储
远程模式:与本地模式相似,不过其操作是先开一个Metastore服务,再用其他的客户端通过响应的配置去连接服务。
我们平常大多情况会使用其他的服务器去连接hive,及需要用到远程模式。远程模式是建立在本地模式之上的,所以这篇文章主要讲述hive本地模式的安装过程,及远程连接。

2.本地模式

2.1安装包准备

到相应网址下载mysql安装包,hive安装包,mysql驱动文件;mysql安装包下载链接hive安装包下载链接

利用xftp软件,将mysql安装包与hive安装包上传至linux系统的指定路径/export/software

数据仓库hive本地/远程模式安装

; 2.2解压安装mysql

2.2.1 解压mysql安装包

先在文件目录/export/servers下创建一个mysql文件夹,再进入mysql安装包所在文件夹/export/software,执行解压命令解压到指定文件目录/export/servers/mysql

数据仓库hive本地/远程模式安装

; 2.2.2 安装mysql相关组件

再进入mysql文件目录,解压mysql相关组件,分别执行如下命令:

rpm -ivh mysql-community-server-5.7.12-1.el6.x86_64.rpm --force --nodeps
rpm -ivh mysql-community-client-5.7.12-1.el6.x86_64.rpm --force --nodeps
rpm -ivh mysql-community-libs-5.7.12-1.el6.x86_64.rpm --force --nodeps
rpm -ivh mysql-community-common-5.7.12-1.el6.x86_64.rpm --force --nodeps

数据仓库hive本地/远程模式安装
数据仓库hive本地/远程模式安装

2.2.3 修改my.cnf配置文件

执行命令 vi /etc/my.cnf编辑my.cnf文档,向其中添加如下代码:

skip-grant-tables  #跳过登陆验证
user=root  #设置root为mysql用户
character_set_server=utf8  #设置mysql服务默认字符集utf8
init_connect='SET NAMES utf8'  #设置初次连接默认字符集utf8

编辑完,保存退出

数据仓库hive本地/远程模式安装

2.2.4 更改所属组

执行命令 chown -R mysql:mysql /var/lib/mysql

2.2.5 启动mysql服务

执行命令 systemctl start mysqld启动mysql服务器,也可以使用命令 systemctl status mysqld查看服务器状态;执行命令 systemctl enable mysqld设置虚拟机开机mysql服务自动启动(图中没有执行,大家要执行这条命令)

数据仓库hive本地/远程模式安装

执行命令 mysql进入mysql交互式界面

数据仓库hive本地/远程模式安装
这时mysql正使用%s选项运行,不能执行mysql语句,我们需要先执行命令 flush privileges;刷新即可,再输入代码 set password for root@localhost=password('你的密码(自己设置)');
数据仓库hive本地/远程模式安装
执行命令 grant all privileges on *.* to ‘root’@’%’ identified by ‘密码’ with grant option;赋予所有访问权限
数据仓库hive本地/远程模式安装
退出输入命令 quit;退出mysql交互式界面
再执行命令 vi /etc/my.cnf对文档进行修改,注释跳过密码验证那行代码(”#”代表注释)
数据仓库hive本地/远程模式安装
编辑完,保存退出即可,下次登录mysql即需要输入代码 mysql -u用户名 -p来登录(用户名一般为root),回车输入密码(输入密码时不会显示,输完回车即可)
数据仓库hive本地/远程模式安装

; 2.3 hive解压安装及配置

2.3.1 解压

将hive安装包解压到指定目录/export/servers

数据仓库hive本地/远程模式安装

; 2.3.2 改名

由于解压后的文件名带有版本号,把文件名直接改为hive更简洁,方便后续的使用(执行改名命令前,需要进入hive解压包所在目录)

数据仓库hive本地/远程模式安装

2.3.3 配置环境变量

执行命令 vi /etc/profile编辑文档,向文档末尾添加如下代码:

export HIVE_HOME=/export/servers/hive
export PATH=$PATH:$HIVE_HOME/bin

修改完,保存退出,再执行命令 source /etc/profile使环境变量生效

数据仓库hive本地/远程模式安装
数据仓库hive本地/远程模式安装

2.3.4 添加hive-site.xml配置文件

进入hive安装目录下的conf目录,执行命令 vi hive-site.xml新建文件,并向其中添加如下内容:

<configuration>
  <property>
    <name>javax.jdo.option.ConnectionURL</name>
    <value>jdbc:mysql://master:3306/hive?createDatabaseIfNotExist=true</value>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionDriveName</name>
    <value>com.mysql.jdbc.Driver</value>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionUserName</name>
    <value>root</value>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionPassword</name>
    <value>mysql&#x6570;&#x636E;&#x5E93;&#x5BC6;&#x7801;</value>
  </property>
</configuration>

编辑完,保存退出(注意,内容里面的master指的是我自己的hadoop集群主节点,自己主机名是什么就写什么)

数据仓库hive本地/远程模式安装

2.3.5 放置mysql驱动文件

到相应网址下载驱动文件:mysql驱动文件下载链接
通过xftp软件,将驱动文件上传至linux系统指定目录/export/servers/hive/lib下

数据仓库hive本地/远程模式安装

; 2.3.6 启动hive

先在/root目录下创建一个metastore文件夹,再进入这个文件夹,输入命令 nohup /export/servers/hive/bin/hive --service metastore &启动hive的metastore服务

数据仓库hive本地/远程模式安装
通过命令 jps可以查看进程,其中的RunJar表示metastore相关进程,有它则表示启动成功
数据仓库hive本地/远程模式安装
由于我们配置过hive的系统环境变量,所以在任何目录下都能直接输入命令 hive启动hive(注意:由于hive底层应用的是MapReduce,且其存储介质为外界数据库mysql,所以在启动hive之前,要先启动hadoop集群,以及mysql服务)
数据仓库hive本地/远程模式安装
输入命令 show databases;可以查看数据库,从中可以看出有个默认的default数据库
数据仓库hive本地/远程模式安装
我们在hive中创建的数据库存储在HDFS中的/user/hive/warehouse/路径下

3.远程模式

3.1将hive文件夹以及环境变量分发到从节点slave2

执行如下命令:

scp -r /export/servers/hive slave2:/export/servers
scp -r /etc/profile/ slave2:/etc

分发完后,在从节点slave2执行命令 source /etc/profile使环境变量生效

3.2 启动元数据Metastore,及hiveserver2相关服务

先在/root目录下创建一个metastore文件夹,再进入这个文件夹,输入命令 nohup /export/servers/hive/bin/hive --service metastore &启动hive元数据metastore服务

数据仓库hive本地/远程模式安装

再在/root目录下创建一个hiveserver2文件夹,进入此文件夹,输入命令 nohup /export/servers/hive/bin/hive --service hiveserver2 &启动远程连接服务hiveserver2

数据仓库hive本地/远程模式安装

输入命令 jps可以看出有两个RunJar进程,其中一个是元数据metastore的相关进程,另一个是远程连接服务hiveserver2的相关进程,如果有这两个进程,说明启动成功。

数据仓库hive本地/远程模式安装

; 3.3 远程连接

打开从节点slave2,输入远程连接命令 beeline进行连接(由于我们配置了hive的系统环境变量,所以可以在任何路径下直接输入beeline,如果没配置,则需要进入hive文件目录下的bin目录才能执行beeline命令)

数据仓库hive本地/远程模式安装
输入连接协议,用户名以及密码
数据仓库hive本地/远程模式安装
在这里输入HQL指令 show databases;可以看出其中有个默认数据库default(这里远程连接其实和本地模式并无较大差异,用的元数据都是外界数据库mysql的,只不过在master节点多开了一个hiveserver2服务,利用slave2去连接这个服务)
数据仓库hive本地/远程模式安装
至此,远程连接已叙述完!

4.结束语

至此,hive本地/远程模式安装就结束了,大家在安装过程中遇到什么问题,可以提出来,我会尽自己所能去帮大家解决问题;大家能学到hive这里,相信大家对虚拟机的命令的使用已经非常熟练了,如果还不太熟练,可以借鉴学习这篇文章:haddoop集群的搭建(其中讲述了一些基本命令)

Original: https://blog.csdn.net/qq_58281481/article/details/126666792
Author: 十里桃花笑春风️
Title: 数据仓库hive本地/远程模式安装

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/817659/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球