Hue4.10.0 安装并与Hdfs、Hive集成

HUE

第一部分Hue概述
Hue(Hadoop User Experience)是一个开源的 Apache Hadoop UI系统,最早是由 Cloudera Desktop演化而来,由Cloudera贡献给开源社区,它是基于PythonWeb框架Django实现的。通过使用Hue可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例如操作HDFS上的数据,运行MapReduceJob等等。Hue所支持的功能特性集合:

  • 默认基于轻量级sqlite数据库管理会话数据,用户认证和授权,可以自定义为MySQL、Postgresql,以及Oracle
  • 基于文件浏览器(File Browser)访问HDFS
  • 基于Hive编辑器来开发和运行Hive查询
  • 支持基于Solr进行搜索的应用,并提供可视化的数据视图,以及仪表板(Dashboard)
  • 支持基于Impala的应用进行交互式查询
  • 支持Spark编辑器和仪表板(Dashboard)
  • 支持Pig编辑器,并能够提交脚本任务
  • 支持Oozie编辑器,可以通过仪表板提交和监控Workflow、Coordinator和Bundle
  • 支持HBase浏览器,能够可视化数据、查询数据、修改HBase表
  • 支持Metastore浏览器,可以访问Hive的元数据,以及HCatalog
  • 支持Job浏览器,能够访问MapReduce Job(MR1/MR2-YARN)
  • 支持Job设计器,能够创建MapReduce/Streaming/Java Job
  • 支持Sqoop 2编辑器和仪表板(Dashboard)
  • 支持ZooKeeper浏览器和编辑器
  • 支持MySql、PostGresql、Sqlite和Oracle数据库查询编辑器

一句话总结:Hue是一个友好的界面集成框架,可以集成我们各种学习过的以及将要学习的框架,一个界面就可以做到查看以及执行所有的框架。

HUE

官方网址:https://gethue.com/

Hue的安装并不是那么简单,官方并没有编译好的软件包,需要从github上下载源码、安装依赖、编译安装。以下详细讲解Hue下载、编译、安装的操作过程。

安装Hue的节点上最好没有安装过MySQL,否则可能有版本冲突,这里选择将Hue安装在slave1上。

下载软件包

1.hue-release-4.10.0.tar.gz
2.apache-maven-3.8.3-bin.tar.gz
https://dlcdn.apache.org/maven/maven-3/3.8.3/binaries/apache-maven-3.8.3-bin.tar.gz

将软件包下载至 /opt/software

解压至 /opt/servers

tar -zxvf apache-maven-3.8.3-bin.tar.gz -C /opt/servers
tar -zxvf hue-release-4.10.0.tar.gz -C /opt/servers
检查软件包的完整性

安装必要依赖

具体参见:https://docs.gethue.com/administrator/installation/dependencies/#centosrhel

Python2.7以上

CentOS/RHEL 系统所需依赖
yum -y install ant asciidoc cyrus-sasl-devel cyrus-sasl-gssapi cyrus-sasl-plain gcc gcc-c++ krb5-devel libffi-devel libxml2-devel libxslt-devel make mysql mysql-devel openldap-devel python-devel sqlite-devel gmp-devel

Node.js 安装

wget https://nodejs.org/dist/v16.13.0/node-v16.13.0-linux-x64.tar.xz
tar -xvf node-v16.13.0-linux-x64.tar.xz

Node.js 环境变量

vim /etc/profile
Node.js
export PATH=$PATH:/opt/software/node-v16.13.0/bin

设置 Maven 环境变量

编译 Hue 还需要 Maven 环境,因此在编译前需要安装 Maven。

vim /etc/profile

添加环境变量
MAVEN
export MAVEN_HOME=/opt/software/apache-maven-3.8.3
export PATH=$PATH:$MAVEN_HOME/bin

验证安装
source /etc/profile
mvn -v

编译 Hue

:进入hue源码目录,进行编译。使用 PREFIX 指定安装 Hue 的路径

进入源码目录
cd /opt/software/hue-release-4.10.0

PREFIX=/opt/servers make install

注意:编译需要下载 Jar 包所以要保持联网状态,编译过程可能需要持续30分钟

Hue4.10.0 安装并与Hdfs、Hive集成

修改 Hadoop 配置

在 hdfs-site.xml 中增加配置

<!-- HUE -->
<property>
    <!-- HDFS Web 服务 -->
    <name>dfs.webhdfs.enabled</name>
    <value>true</value>
</property>
<property>
    <name>dfs.permissions.enabled</name>
    <value>false</value>
</property>

在core-site.xml中增加配置

<!-- HUE -->
<property>
    <name>hadoop.proxyuser.hue.hosts</name>
    <value>*</value>
</property>
<property>
    <name>hadoop.proxyuser.hue.groups</name>
    <value>*</value>
</property>
<property>
    <name>hadoop.proxyuser.hdfs.hosts</name>
    <value>*</value>
</property>
<property>
    <name>hadoop.proxyuser.hdfs.groups</name>
    <value>*</value>
</property>

增加 httpfs-site.xml 文件,加入配置

<!--HUE-->
<property>
    <name>httpfs.proxyuser.hue.hosts</name>
    <value>*</value>
</property>
<property>
    <name>httpfs.proxyuser.hue.groups</name>
    <value>*</value>
</property>

分发到其他节点中

rsync-script hdfs-site.xml
rsync-script core-site.xml
rsync-script httpfs-site.xml

备注:修改完HDFS相关配置后,需要把配置 scp 给集群中每台机器,重启hdfs服务。

Hue 配置

&#x8FDB;&#x5165;&#x5B89;&#x88C5;&#x76EE;&#x5F55;
cd /opt/servers/hue

&#x8FDB;&#x5165;&#x914D;&#x7F6E;&#x76EE;&#x5F55;
cd desktop/conf

&#x590D;&#x5236;&#x4E00;&#x4EFD; HUE &#x7684;&#x914D;&#x7F6E;&#x6587;&#x4EF6;&#xFF0C;&#x5E76;&#x4FEE;&#x6539;&#x590D;&#x5236;&#x7684;&#x914D;&#x7F6E;&#x6587;&#x4EF6;
cp pseudo-distributed.ini.tmpl pseudo-distributed.ini
vi pseudo-distributed.ini
#[desktop]
http_host=slave1
http_port=8000
time_zone=Asia/shanghai
dev=true
server_user=hue
server_group=hue
default_user=hue

#[[database]]&#x3002;Hue&#x9ED8;&#x8BA4;&#x4F7F;&#x7528;SQLite&#x6570;&#x636E;&#x5E93;&#x8BB0;&#x5F55;&#x76F8;&#x5173;&#x5143;&#x6570;&#x636E;&#xFF0C;&#x66FF;&#x6362;&#x4E3A;mysql
engine=mysql
host=slave2
port=3306
user=hive
password=0000
&#x589E;&#x52A0;&#x4E00;&#x884C; &#x6570;&#x636E;&#x5E93;&#x540D;&#x79F0;
name=hue

211&#x884C;&#x5DE6;&#x53F3;&#x3002;app&#x9ED1;&#x540D;&#x5355;&#xFF0C;&#x7981;&#x7528;solr,&#x89C4;&#x907F;&#x62A5;&#x9519;
app_blacklist=search

1003&#x884C;&#xFF0C;Hadoop&#x914D;&#x7F6E;&#x6587;&#x4EF6;&#x7684;&#x8DEF;&#x5F84;
hadoop_conf_dir=/opt/servers/hadoop-2.10.1/etc/hadoop

slave2

&#x5728;mysq1&#x4E2D;&#x521B;&#x5EFA;&#x6570;&#x636E;&#x5E93;hue,&#x7528;&#x6765;&#x5B58;&#x653E;&#x5143;&#x6570;&#x636E;
mysql -uhive -p0000
mysql> create database hue;
&#x521D;&#x59CB;&#x5316;&#x6570;&#x636E;&#x5E93;
pwd
/opt/servers/hue/

&#x5982;&#x679C;&#x662F;mysql8&#x7684;&#x7248;&#x672C;&#x9700;&#x8981;&#x4FEE;&#x6539;&#x5BC6;&#x7801;&#x52A0;&#x5BC6;&#x65B9;&#x5F0F;&#x4E3A;&#x65E7;&#x7248;
build/env/bin/hue syncdb

build/env/bin/hue migrate
&#x68C0;&#x67E5;&#x6570;&#x636E;
mysql> show tables;

Hue4.10.0 安装并与Hdfs、Hive集成

Hue4.10.0 安装并与Hdfs、Hive集成

修改mysql加密方式

use mysql;
select user,plugin from user where user='root';

alter user 'hive'@'%' identified with mysql_native_password by '0000';

flush privileges;

启动服务

build/env/bin/supervisor

如果启动时出现以下异常

Hue4.10.0 安装并与Hdfs、Hive集成
则是没有hue这个用户
useradd hue -U -m -s /bin/bash
passwd hue

Hue4.10.0 安装并与Hdfs、Hive集成

访问地址
http://slave1:8000/

第一次进入需要创建用户和密码

Hue4.10.0 安装并与Hdfs、Hive集成
此时会报错,需要进行hive的整合

Hue 集成 HDFS、YARN

/opt/servers/hue/desktop/conf

vim pseudo-distributed.ini
[hadoop] -- [[hdfs_clusters]] -- [[[default]]]
&#x6CE8;&#x610F;&#x7AEF;&#x53E3;&#x53F7;&#x3002;
fs_defaultfs=hdfs://master:9000
webhdfs_ur1=http://master:50070/webhdfs/v1

[hadoop] -- [[yarn_clusters]] -- [[[default]]]
resourcemanager_host=slave2
resourcemanager_port=8032
submit_to=True
resourcemanager_api_url=http://slave2:8088
proxy_api_ur1=http://slave2:8088
history_server_api_url=http://slave2:19888

Hue 集成 Hive

集成 Hive 需要启动 Hiveserver2 服务,在 slave2 节点上启动 Hiveserver2

#[beeswax]
hive_server_host=slave2
hive_server_port=10000
hive_conf_dir=/opt/servers/hive-2.3.9/conf

&#x6CE8;&#x610F;&#x5230;&#x6CE8;&#x91CA;&#x4E0A;&#x8BF4;&#xFF0C;11&#x662F;hive3.0&#x7684;
thrift_version=7

Hue 集成MySQL

[librdbms]–[[databases]]–[[[mysq]]]];1922行

注意:1922行原文:##[[mysql]]=>[[mysql]];两个##要去掉!

[[[mysq]]]]
nice_name="My SQL DB"
name=hue
engine=mysql
host=slave2
port=3306
user=hive
password=0000

注意:name是database_name

Original: https://www.cnblogs.com/Likfees/p/15585532.html
Author: 白日醒梦
Title: Hue4.10.0 安装并与Hdfs、Hive集成

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/590968/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球