Hadoop集群（双节点）安装配置

2023年5月26日上午12:35 • 大数据 • 阅读 98

集群安装前置条件

已掌握Hadoop单机伪分布式安装配置，否则先查看Hadoop伪分布式安装与配置。

环境

Ubuntu 18.04 + JDK 1.8 + Hadoop 2.10 + SSH

本教程简单的使用两个节点作为集群环境：一个Master节点，一个Slave节点。

准备工作

Hadoop 集群的安装配置大致为如下流程:

选定一台机器作为 Master
在 Master 节点上配置 hadoop 用户、安装 SSH server、安装 Java 环境
在 Master 节点上安装 Hadoop，并完成配置
在其他 Slave 节点上配置 hadoop 用户、安装 SSH server、安装 Java 环境
将 Master 节点上的 /usr/local/hadoop 目录复制到其他 Slave 节点上
在 Master 节点上开启 Hadoop

如果你已按照Hadoop伪分布式安装与配置进行过单机伪分布式安装，且能正常运行，将此虚拟机实例进行克隆即可。

先关闭当前虚拟机实例。

选择创建完整克隆，此时你就创建了一个跟前者功能完全相同的虚拟机实例（SSH+Java+Hadoop已拥有），就不用再重新配置了。

网络配置

两个虚拟机实例的网络适配器选用NAT模式即可。

查看Linux的几点IP地址（命令为ifconfig），即inet地址。

Master节点IP

Slave节点IP

首先在Master节点上关闭Hadoop（/usr/local/hadoop/sbin/stop-dfs.sh）,在进行后续进群配置。

为了便于区分，我们修改一下各个节点的主机名

sudo vim /etc/hostname

然后根据上述我们查到的两个节点的IP地址修改自己所用节点的IP映射

sudo vim /etc/hosts

在 Master与Slave1节点的/etc/hosts 中将该映射关系填写上去即可（一般该文件中只有一个 127.0.0.1，其对应名为 localhost，如果有多余的应删除，特别是不能有 “127.0.0.1 Master” 这样的记录）：

修改完成后需要重启一下，重启后在终端中才会看到机器名的变化。接下来的操作中请注意区分 Master 节点与 Slave 节点的操作。

配置好后需要在各个节点上测试是否相互 ping 得通，如果ping不通，后面的步骤无法执行

ping Master -c 3       # 在Slave1节点上测试ping Slave1 -c 3       # 在Master节点上测试

例如我在Master节点上ping Slave1，显示如下

牢记：继续下一步配置前，请先完成所有节点的网络配置，修改过的主机名需重启才能生效。

SSH无密码登陆节点

此操作是要让 Master 节点可以无密码 SSH 登陆到各个 Slave 节点上。

首先生成 Master 节点的公匙，在 Master 节点的终端中执行（因为改过主机名，所以还需要删掉原有的再重新生成一次）：

cd ~/.ssh               # 如果没有该目录，先执行一次ssh localhostrm ./id_rsa*            # 删除之前生成的公匙（如果有）ssh-keygen -t rsa       # 一直按回车就可以

让 Master 节点需能无密码 SSH 本机，在 Master 节点上执行

cat ./id_rsa.pub >> ./authorized_keys

完成后可执行 ssh Master 验证一下（可能需要输入 yes，成功后执行 exit 返回原来的终端）。接着在 Master 节点将上公匙传输到 Slave1 节点：

scp ~/.ssh/id_rsa.pub hadoop@Slave1:/home/hadoop/

scp 是 secure copy 的简写，用于在 Linux 下进行远程拷贝文件，类似于 cp 命令，不过 cp 只能在本机中拷贝。执行 scp 时会要求输入 Slave1 上 hadoop 用户的密码(hadoop)，输入完成后会提示传输完毕，如下图所示：

接着在 Slave1 节点上，将 ssh 公匙加入授权

mkdir ~/.ssh                                   # 如果不存在该文件夹需先创建，若已存在则忽略cat ~/id_rsa.pub >> ~/.ssh/authorized_keysrm ~/id_rsa.pub                                # 用完就可以删掉了

如果有其他 Slave 节点，也要执行将 Master 公匙传输到 Slave 节点、在 Slave 节点上加入授权这两步。

这样，在 Master 节点上就可以无密码 SSH 到各个 Slave 节点了，可在 Master 节点上执行如下命令进行检验

ssh Slave1

配置PATH变量

将 Hadoop 安装目录加入 PATH 变量中，这样就可以在任意目录中直接使用 hadoo、hdfs 等命令了，需要在 Master 节点上进行配置

vim ~/.bashrc

在文件中添加下面一行

export PATH=$PATH:/usr/local/hadoop/bin:/usr/local/hadoop/sbin

保存后执行 source ~/.bashrc，使配置生效

source ~/.bashrc

配置集群/分布式环境

集群/分布式模式需要修改 /usr/local/hadoop/etc/hadoop 中的5个配置文件，更多设置项可点击查看官方说明，这里仅设置了正常启动所必须的设置项： slaves、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml 。

1, 文件 slaves，将作为 DataNode 的主机名写入该文件，每行一个，默认为 localhost，所以在伪分布式配置时，节点即作为 NameNode 也作为 DataNode。分布式配置可以保留 localhost，也可以删掉，让 Master 节点仅作为 NameNode 使用。

此教程让 Master 节点仅作为 NameNode 使用，因此将文件中原来的 localhost 删除，只添加一行内容：Slave1。

2、文件 core-site.xml 改为下面的配置

fs.defaultFS                hdfs://Master:9000                                hadoop.tmp.dir                file:/usr/local/hadoop/tmp                Abase for other temporary directories.

3、文件 hdfs-site.xml，dfs.replication 一般设为 3，但我们只有一个 Slave 节点，所以 dfs.replication 的值设为 1

dfs.namenode.secondary.http-address                Master:50090                                dfs.replication                1                                dfs.namenode.name.dir                file:/usr/local/hadoop/tmp/dfs/name                                dfs.datanode.data.dir                file:/usr/local/hadoop/tmp/dfs/data

4、文件 mapred-site.xml （先重命名，默认文件名为 mapred-site.xml.template），然后配置修改如下：

mapreduce.framework.name                yarn                                mapreduce.jobhistory.address                Master:10020                                mapreduce.jobhistory.webapp.address                Master:19888

5、文件 yarn-site.xml

yarn.resourcemanager.hostname                Master                                yarn.nodemanager.aux-services                mapreduce_shuffle

配置好后，将 Master 上的 /usr/local/hadoop 文件夹复制到各个节点上。

因为之前有跑过伪分布式模式，建议在切换到集群模式前先删除之前的临时文件。

在 Master 节点上执行如下操作

cd /usr/local    sudo rm -r ./hadoop/tmp                            # 删除 Hadoop 临时文件sudo rm -r ./hadoop/logs/*                         # 删除日志文件tar -zcf hadoop.tar.gz hadoop                      # 先压缩再复制cd ~scp ./hadoop.tar.gz Slave1:/home/hadoop

在 Slave1 节点上执行（可不用命令解压，直接在文件系统中提取，解压或提取时间较长，耐心等待）

sudo rm -r /usr/local/hadoop                # 删掉旧的（如果存在）tar -zxf hadoop.tar.gz -C /usr/localsudo chown -R hadoop /usr/local/hadoop

PS：压缩和解压过程可能会出现重目录现象（解压后hadoop文件夹里面套了一个hadoop文件夹，而第二个文件夹里面才是我们要用到的hadoop环境），此过程自己查看不在赘述

同样，如果有其他 Slave 节点，也要执行将 hadoop.tar.gz 传输到 Slave 节点、在 Slave 节点解压文件的操作。

首次启动需要先在 Master 节点执行 NameNode 的格式化

hdfs namenode -format       # 首次运行需要执行初始化，之后不需要

接着可以启动 hadoop 了，在 Master 节点上进行

start-dfs.shstart-yarn.shmr-jobhistory-daemon.sh start historyserver

通过命令 jps 可以查看各个节点所启动的进程。正确的话，在 Master 节点上可以看到 NameNode、ResourceManager、SecondrryNameNode、JobHistoryServer 进程

在 Slave 节点可以看到 DataNode 和 NodeManager 进程

缺少任一进程都表示出错。另外还需要在 Master 节点上通过命令 hdfs dfsadmin -report 查看 DataNode 是否正常启动，如果 Live datanodes 不为 0 ，则说明集群启动成功。例如我这边一共有 1 个 Datanodes：

hdfs dfsadmin -report

也可以通过 Web 页面看到查看 DataNode 和 NameNode 的状态http://master:50070/

执行分布式实例

执行分布式实例过程与伪分布式模式一样，首先创建 HDFS 上的用户目录

hdfs dfs -mkdir -p /user/hadoop

将 /usr/local/hadoop/etc/hadoop 中的配置文件作为输入文件复制到分布式文件系统中

hdfs dfs -mkdir inputhdfs dfs -put /usr/local/hadoop/etc/hadoop/*.xml input

通过查看 DataNode 的状态（占用大小有改变），输入文件确实复制到了 DataNode 中

关闭 Hadoop 集群也是在 Master 节点上执行的

stop-yarn.shstop-dfs.shmr-jobhistory-daemon.sh stop historyserver

Original: https://blog.51cto.com/u_15692358/5399375
Author: mb62b13c6f57f4d
Title: Hadoop集群（双节点）安装配置

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/517186/

转载文章受原作者版权保护。转载请注明原作者出处！

大数据

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

JuiceFS 新手必知 24 问

JuiceFS 是一个创新性的软件产品，很多初次尝试的小伙伴对产品和用法感到很多疑惑，所以为了帮助大家快速理解并上手 JuiceFS，我们整理了24个关于 JuiceFS 经典的问…

大数据 2023年6月3日
0089
管道符、重定向和环境变量

一、输入重定向和输出重定向输入重定向是将文件作为命令的参数，输出重定向是将应该输出到屏幕的内容写入文件。 [En] Input redirection is to take the…

大数据 2023年5月27日
0066
主流数据库对比

目录一、数据库分类二、数据库对比三、补充一、数据库分类数据库根据数据结构可分为关系型数据库、非关系型数据库。非关系型数据库中根据应用场景又可分为键值数据库、列存储数据库、…

大数据 2023年11月11日
0038
自然语言处理（十四）：从零开始构建使用注意力机制的Seq2Seq网络实现翻译任务

本案例取自PyTorch官网的 NLP FROM SCRATCH: TRANSLATION WITH A SEQUENCE TO SEQUENCE NETWORK AND ATTE…

大数据 2023年5月28日
0088
手把手大数据架构部署2：Hadoop集群搭建

在上一节里，我们使用VMware搭建了三台Linux服务器，并做时间同步。在此基础上，我们将要搭建一套Hadoop集群。那么这节的目标就很明确了：搭建一套Hadoop集群。 […

大数据 2023年6月2日
0087
大数据开发写sql写烦了，要不要转？

如果说大数据是每天写sql还不太精准（精准的是用各种方式写SQL）当你不创造东西时，你只会根据自己的感觉而不是能力去看待问题。会不会转别的，看个人兴趣，大数据方向还有那么多。瞅…

大数据 2023年11月13日
0043
大数据学习笔记——————-(2)

第2章 Spark弹性分布数据集 2.1 弹性分布式数据集弹性分布式数据集（Resilient Distributed Datasets(RDD)）是spark的一种基本的数据结…

大数据 2023年5月26日
0057
RAID技术图解（mdadm）

一、概述二、RAID类型 1）硬件磁盘阵列（Hardware RAID） 2）软件磁盘阵列（Software RAID） 3）硬件辅助磁盘阵列（Hardware-Assisted…

大数据 2023年5月27日
0079
粗枝大叶记录一下java9模块化改造一个项目的过程(Jigsaw)

假设项目结构如下：其中的依赖关系为我实际用的jdk是17 1. common模块创建描述文件，在common的src/main/java下创建module-info.java, …

大数据 2023年6月3日
0075
用不匹配的图文对也能进行多模态预训练？百度提出统一模态的预训练框架：UNIMO（ACL2021）…

关注公众号，发现CV技术之美本文分享 ACL 2021 论文『UNIMO: Towards Uniﬁed-Modal Understanding and Generation …

大数据 2023年5月28日
0089
Linux 非root用户（无sudo权限）安装sqlite3

sqlite3安装步骤 sqlite3版本：sqlite-autoconf-3350400 ①从官网下载对应的压缩包官方网站 linyuting@Raspberrypi4B:~/…

大数据 2023年11月11日
0055
【SpringBoot实战】数据访问整合Mybatis和Redis

前言在开发中我们通常会对数据库的数据进行操作，SpringBoot对关系性和非关系型数据库的访问操作都提供了非常好的整合支持。SpringData是spring提供的一个用于简化…

大数据 2023年6月3日
0073
hive窗口函数last_value的一个小坑

先说结论 last_value窗口函数默认窗口是从第一条到当前条。问题描述项目中没有使用过last_value窗口函数，最近第一次使用，发现和想象的不太一样。一开始感觉 la…

大数据 2023年11月13日
0042
docker环境下，查看服务的线程数

docker环境下，查看服务的线程数进入docker容器：docker exec -it 服务id bash查询服务所属port：ps使用jstack查询服务的线程信息：jstac…

大数据 2023年5月29日
0066
PyTorch基础(part5)–交叉熵

PyTorch基础(part5)–交叉熵原创 GoatGui2022-06-02 20:52:24博主文章分类：深度学习 ©著作权文章标签 pytorch pyth…

大数据 2023年5月26日
0062
2021年美亚杯个人资格赛（记录第一次的取证之旅）

[单选题]工地主管电话的微信账号是什么? (1分) A. Kasier751111 B.Kasierlee751111 C. Kasierlee D.以上皆非找了一圈发现没有与W…

大数据 2023年11月11日
0041

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31