大数据——配置并启动集群/开启历史服务器和日志聚集

2023年6月8日上午3:21 • Linux • 阅读 101

上篇文章通过克隆将集群搭建出来，这篇文章对Hadoop进行配置，修改配置文件，启动并测试集群。开去历史服务器以及日志聚集。

部署规划

hadoop102 hadoop103 hadoop104 HDFS NameNode DataNode DataNode SencondNameNode DataNode

YARN NodeManager ResourceManager、NodeManager NodeManager

NameNode和 SecondNameNode不要安装在同一台服务器上
ResourceManager也很消耗内存，不要和 NameNode、 SecondNameNode配置在同一台机器上

配置文件

1、默认配置文件

默认配置文件可在对应的jar包中找到

配置文件配置文件位置 core-default.xml hadoop-common-3.1.3.jar/core-default.xml hdf-default.xml hadoop-hdfs-3.1.3.jar/hdfs-default.xml yarn-default.xml hadoop-yarn-common-3.1.3.jar/yarn-default.xml mapred-default.xml hadoop-mapreduce-client-core-3.1.3.jar/mapred-default.xml

2、自定义配置文件

在 $HADOOP_HOME/etc/hadoop中

文章使用的时 /opt/module/hadoop-3.1.3/etc/hadoop

配置集群

所有操作在 swcode用户进行，非 root

在hadoop102上配置

1、核心配置文件： core-site.xml

vim /opt/module/hadoop-3.1.3/etc/hadoop/core-site.xml

内容如下


        fs.defaultFS
        hdfs://hadoop102:8020

        hadoop.tmp.dir
        /opt/module/hadoop-3.1.3/data

        hadoop.http.staticuser.user
        swcode

2、HDFS配置文件： hdfs-site.xml

vim /opt/module/hadoop-3.1.3/etc/hadoop/hdfs-site.xml

内容如下


        dfs.namenode.http-address
        hadoop102:9870

        dfs.namenode.secondary.http-address
        hadoop104:9868

3、YARN配置文件： yarn-site.xml

vim /opt/module/hadoop-3.1.3/etc/hadoop/yarn-site.xml

内容如下


        yarn.nodemanager.aux-services
        mapreduce_shuffle

        yarn.resourcemanager.hostname
        hadoop103

        yarn.nodemanager.env-whitelist
        JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_HOME,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME

4、MapReduce配置文件： mapred-site.xml

vim /opt/module/hadoop-3.1.3/etc/hadoop/mapred-site.xml

内容如下


        mapreduce.framework.name
        yarn

分发配置文件

xsync是自定义的 sync脚本

xsync /opt/module/hadoop-3.1.3/etc/hadoop/

启动集群

1、配置 workers

vim /opt/module/hadoop-3.1.3/etc/hadoop/workers

新增一下内容，内容结尾不允许空格，文件中不允许出现空行

hadoop102
hadoop103
hadoop104

像下面这样

2、分发 workers

xsync /opt/module/hadoop-3.1.3/etc/hadoop/workers

3、第一次启动初始化（ hadoop102）

hdfs namenode -format

/opt/module/hadoop-3.1.3会多出两个文件夹： /data和 /logs

4、启动HDFS（ hadoop102）

start-dfs.sh

启动成功后，每台主机分别运行下面代码，检查一下

jps

根据规划的部署，应该和下面一样

hadoop102： Jps、 DataNode、 NameNode
hadoop103： DataNode、 Jps
hadoop104： DataNode、 SecondaryNameNode、 Jps

查看Web页面：http://192.168.10.102:9870/

5、启动YARN

来到配置了 ResourceManager的节点（ hadoop103）

start-yarn.sh

对照部署规划，一样就说明成功了~

查看YARN资源调度页面：http:192.168.10.103:8088

测试集群

1、上传文件到HDFS（ hadoop102上）

创建目录
hadoop fs -mkdir /wcinput
上传文件
hadoop fs -put /opt/module/hadoop-3.1.3/wcinput/words.txt /wcinput

words.txt是之前使用 wordcount做的小案例

查看效果：Browsing HDFS

2、再次运行 wordcount案例

来到 hadoop 安装目录
cd /opt/module/hadoop-1.3.1/
执行
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /wcinput /wcoutput

来到YARN资源调度页面：http:192.168.10.103:8088

可以看到一条资源调度记录

查看效果：Browsing HDFS

配置历史服务器

1、配置 mapred-site.xml（在 hadoop102上配置）

vim /opt/module/hadoop-3.1.3/etc/hadoop/mapred-site.xml

增加配置文件


    mapreduce.jobhistory.address
    hadoop102:10020

    mapreduce.jobhistory.webapp.address
    hadoop102:19888

2、分发配置

xsync /opt/module/hadoop-3.1.3/etc/hadoop/mapred-site.xml

3、在 hadoop102中启动历史服务器

mapred --daemon start historyserver

需要重启 yarn，在 hadoop103中重启 yarn（本文的 yarn配置在 hadoop103中）

stop-yarn.sh
start-yarn.sh

4、查看历史服务器是否启动

[swcode@hadoop102 ~]$ jps
123607 DataNode
123403 NameNode
127613 JobHistoryServer
127773 Jps
125615 NodeManager

配置日志聚集

1、修改 yarn-site.xml

vim /opt/module/hadoop-3.1.3/etc/hadoop/yarn-site.xml

增加如下内容


    yarn.log-aggregation-enable
    true

    yarn.log.server.url
    http://hadoop102:19888/jobhistory/logs

    yarn.log-aggregation.retain-seconds
    604800

2、分发配置

xsync /opt/module/hadoop-3.1.3/etc/hadoop/yarn-site.xml

3、在 hadoop102中停止历史服务器

mapred --daemon stop historyserver

4、在 hadoop103中重启 yarn

stop-yarn.sh
start-yarn.sh

5、在 hadoop102中停启动历史服务器

mapred --daemon start historyserver

4、在 hadoop103中重启 yarn

下篇文章：大数据集群服务启停脚本/常用端口/时间同步
所有文章：
搭建第一台Hadoop主机
 Linux之间的文件传输方式
 克隆主机并配置集群
 配置并启动集群/开启历史服务器和日志聚集
 大数据集群服务启停脚本/常用端口/时间同步

Original: https://www.cnblogs.com/sw-code/p/15560779.html
Author: sw-code
Title: 大数据——配置并启动集群/开启历史服务器和日志聚集

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/585580/

转载文章受原作者版权保护。转载请注明原作者出处！

Linux

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

深入理解linux内核-进程和程序

task_struct //进程基本信息 pid 进程id号 tgid 线程组id号，与线程组领头线程pid号相同 getpid()返回该值 tasks init_struct链接…

Linux 2023年6月6日
0075
JMeter压测出现“the target server failed to respond“的解决办法

压测接口的时候，遇到了这个问题，在网上找到解决方案，试一下还挺管用，800并发没改前20%以上的报错率，改完800并发0.00%报错率。感谢曲健老师的分享解决方案如下：修改执…

Linux 2023年6月8日
0087
LeetCode-1047. 删除字符串中的所有相邻重复项

题目来源题目详情给出由小写字母组成的字符串 S，重复项删除操作会选择两个相邻且相同的字母，并删除它们。在 S 上反复执行重复项删除操作，直到无法继续删除。在完成所有重复项…

Linux 2023年6月7日
00128
redis启动失败提示Unregistered Authentication Agent for unix-process:6176

使用宝塔软件安装的redis 一直没启动起来。使用 journalctl -xe 命令查看原因，发现redis.pid已经存在。进入该目录，删除redis.pid。再使用sy…

Linux 2023年5月28日
00340
OpenResty入门

OpenResty介绍 OpenResty通过汇聚各种设计精良的 Nginx模块（主要由 OpenResty 团队自主开发），从而将 Nginx 有效地变成一个强大的通用 Web …

Linux 2023年6月8日
0098
haproxy服务部署

haproxy haproxy 一、haproyx是什么二、负载均衡类型三、部署haproxy 1.源码部署haproxy 2.Haproxy搭建http负载均衡一、hapr…

Linux 2023年6月6日
00116
字符设备驱动

1.字符设备驱动概述 Linux用户空间与内核空间之间的虚拟内存是分开的，用户空间不能直接写入内核空间，如果用户空间和内核空间需要传递数据就需要字符设备驱动。 2.结构体以及函数介…

Linux 2023年6月8日
00143
Linux命令（实时更新）

本博客主要总结一下博主工作中比较常用的命令： 1.iconv命令对于给定文件把它的内容从一种编码转换成另一种编码。 -f encoding : 把字符从encoding编码开始转…

Linux 2023年6月6日
0090
MySQL注入点与SQL语句的关系

注入位置分类这个分类方式是我自己想的，可能会有一些不准确。如图所示注入方式有3种，内联、终止、堆叠。每种注入方式又根据服务器的响应分为4类，时间延迟、报错、布尔、将执行结果直接输…

Linux 2023年6月6日
00136
vue 中，echarts的使用，简单入门

vue 中，echarts的使用，简单入门原作者哔哩哔哩视频感谢多多支持效果图首先创建一个页面组件，创建三个div，分别来使用折线图，柱状图，扇形图 //折线图 //柱状图…

Linux 2023年6月7日
00114
QLabel图片自适应

故事背景：由于要做终端定制的需求，在服务端上传一张128像素的图片，下发给客户端，适配所有图标（界面左上角、任务栏、快捷方式、托盘等），但是由于每个位置的图标大小不一样，代码要根据…

Linux 2023年6月13日
0089
DDoS攻击–Syn_Flood攻击防护详解(TCP)

https://blog.csdn.net/qq_34777600/article/details/81946514 Original: https://www.cnblogs.c…

Linux 2023年6月7日
0090
Redis的slot迁移

1) 在目标节点B 上执行，从节点A 导入slot 到节点B ： CLUSTER SETSLOT8 IMPORTING src– A-node-id 对于迁移的slot…

Linux 2023年5月28日
0071
linux正则表达式初探

为什么要学习正则表达式？简单而言，仅仅用通配符无法满足处理字符的需求，这时候就是正则表达式大展身手的机会。相较而言，正则表达式比通配符更灵活，也更强大。我们在网站注册用户的时候…

Linux 2023年6月7日
0085
Redis

Redis原创笑笑师弟最后发布于2018-12-21 14:17:59 阅读数 1780 收藏展开目录 redis简介 redis功能 redis学习步骤 windows系统下的…

Linux 2023年5月28日
00107
内存错误和服务器内存RAS功能-DELL篇-1

简介内存子系统错误是现代计算系统中最常见的一些错误类型。了解内存错误是如何发生的以及如何预防或避免它们可能是一个复杂的话题–在过去30年里，这个话题挑战了无数的行业研…

Linux 2023年6月7日
00137

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

大数据——配置并启动集群/开启历史服务器和日志聚集

部署规划

配置文件

配置集群

在hadoop102上配置

分发配置文件

启动集群

测试集群

配置历史服务器

配置日志聚集

大家都在看