Linux 下搭建 Hadoop 环境

Linux 下搭建 Hadoop 环境

作者:Grey

原文地址:

博客园:Linux 下搭建 Hadoop 环境

CSDN:Linux 下搭建 Hadoop 环境

环境要求

操作系统:CentOS 7

下载地址

安装说明

需要准备两个节点,一个是 master 节点,另一个是 slave 节点。

其中 master 节点的 IP:192.168.100.130

slave 节点的 IP:192.168.100.131

并且参考Linux 下配置 hosts 并设置免密登录先配置好两个 免密登录

JDK 版本:8u181

下载地址

Hadoop 版本:2.7.5

下载地址

如果使用的软件版本不一致,请以官方搭建文档为准。

安装步骤

准备软件目录

mkdir /datalake

上传之前下载好的安装包到 /datalake 目录下

jdk-8u181-linux-x64.gz

hadoop-2.7.5.tar.gz

批量解压这几个安装包

cd /datalake
ls * | xargs -n1 tar xzvf

将解压的软件移动到 /usr/local 目录

cd /datalake
mv jdk1.8.0_181 /usr/local/jdk
mv hadoop-2.7.5 /usr/local/hadoop

配置环境变量

vi /etc/profile

添加如下内容

export JAVA_HOME=/usr/local/jdk
export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

应用环境变量

source /etc/profile

关闭防火墙,在 master 和 slave 下分别执行

systemctl stop firewalld.service

以下的配置,在 master 和 slave 上 都要

vi $HADOOP_HOME/etc/hadoop/core-site.xml

<configuration></configuration>节点之间添加如下内容


  fs.default.name
  hdfs://master:9000

  hadoop.tmp.dir
  /usr/local/hadoop/tmp

配置 hadoop 使用的 jdk,执行

vi $HADOOP_HOME/etc/hadoop/hadoop-env.sh

将 jdk 配置为

export JAVA_HOME=/usr/local/jdk
vi $HADOOP_HOME/etc/hadoop/hdfs-site.xml

<configuration></configuration>节点之间添加如下内容


  dfs.replication
  1

  dfs.permissions
  false

执行

cd $HADOOP_HOME/etc/hadoop && cp mapred-site.xml.template mapred-site.xml

然后执行

vi $HADOOP_HOME/etc/hadoop/mapred-site.xml

<configuration></configuration>节点之间添加如下内容


  mapred.job.tracker
  master:9001

执行

vi $HADOOP_HOME/etc/hadoop/slaves

替换为如下内容

master
slave

在 master 上把 hadoop 的上述配置文件改好以后,可以执行

cd /usr/local && scp -r hadoop slave:/usr/local/

将配置拷贝到 slave,就无需在 slave 上做同样繁琐的配置操作了。

然后,在 master 节点上进行格式化,执行

hadoop namenode -format

最后,在 master 上启动 hadoop

start-dfs.sh

启动成功后,在 master 和 slave 上分别执行 jps,可以看到 hadoop 相关的进程已经正常启动

master 上

[root@master local]# jps
13984 SecondaryNameNode
1579 QuorumPeerMain
14108 Jps
13693 NameNode
13821 DataNode

slave 上

[root@slave hadoop]# jps
9478 Jps
9401 DataNode

在浏览器上访问 : http://192.168.100.130:50070/

正常显示

Linux 下搭建 Hadoop 环境

然后在 master 上启动 yarn,执行

start-yarn.sh

输出如下日志,未报错

[root@master local]# start-yarn.sh
starting yarn daemons
starting resourcemanager, logging to /usr/local/hadoop/logs/yarn-root-resourcemanager-master.out
master: starting nodemanager, logging to /usr/local/hadoop/logs/yarn-root-nodemanager-master.out
slave: starting nodemanager, logging to /usr/local/hadoop/logs/yarn-root-nodemanager-slave.out

浏览器访问:http://192.168.100.130:8088/

正常显示相关信息

Linux 下搭建 Hadoop 环境

Linux 下搭建 Hadoop 环境

Original: https://www.cnblogs.com/greyzeng/p/16801638.html
Author: Grey Zeng
Title: Linux 下搭建 Hadoop 环境

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/800663/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • YOLOv5 的 Android 部署,基于 tflite

    环境 window 10 64bit yolov5 v6.2 torch1.7.1+cuda101 tensorflow-gpu 2.9.1 前言 前文 借助NCNN,在Andro…

    Python 2023年10月24日
    062
  • shoppe项目08—-购物车

    目录 购物车数据结构 添加购物车 查看购物车 购物车数据结构 由于购物车数据量小,且数据变化比较频繁,所以采用Redis内存数据库来存储,采用的数据类型如下: 存储商品数据,采用h…

    Python 2023年8月6日
    073
  • Streamlit(五) widgets-button

    st.button / st.download_button st.button st.button(label, key=None, help=None, on_click=No…

    Python 2023年8月6日
    055
  • C++文件操作

    1.创建文件流 创建文件流需要包含头文件 #include 创建文件输入流对象 ofstream file; 创建文件输出流对象 ifstream file; 2.写入文本文件 1…

    Python 2023年8月9日
    069
  • 符合ASTM标准的雨流计数法及其不同的改进方法

    随着研究的深入,人们发现采用时间序列计算载荷谱太麻烦了,处理的工作量太大,我们不需要将每个时刻点的载荷都做运算,疲劳计算只需要提供 幅值、 均值和 循环次数,鉴于此发展出了很多不同…

    Python 2023年6月11日
    0104
  • scrapy六

    设置代理ip 代理的作用: 突破自身的IP访问限制 隐藏自身真实的ip 如何获取ip:付费代理 代理ip的匿名度: 透明 服务器知道这次使用了代理 也知道真实的ip 匿名 服务器知…

    Python 2023年10月6日
    032
  • Python从门到精通(五):文件处理-06-ini文件处理

    Python从门到精通(五):文件处理-06-ini文件处理 原创 生而为人我很遗憾2022-06-24 18:31:20博主文章分类:python ©著作权 文章标签 pytho…

    Python 2023年5月25日
    068
  • python3 pygame load图片不显示_Python——mac下pygame踩坑,绘制图像不加载

    问题描述:mac下python3版本安装pygame后开发小游戏时,背景和角色在画布上不加载,创建游戏循环执行时,一直加载背景不刷新; pygame相对比较简单,直接上代码: im…

    Python 2023年9月23日
    048
  • pandas进行数据处理

    pandas读取多列 选择表格中的’w’、’z’列 data[[‘w’,’z’]] …

    Python 2023年8月18日
    090
  • 微信自动信息发送助手WMR

    最近放假闲来无事,捣鼓了一下pyqt5,正好手上有每天定时大量群发消息的需求,正好就用pyqt5做个小应用练练手。 包含到的主要库:pyqt5、pyperclip、pyautogu…

    Python 2023年6月11日
    078
  • 接口访问量统计

    一、业务场景 自己参与开发的很多项目都会对外提供一些接口,比如之前自己参与开发的一个小程序的后台项目,有很多的接口都是提供 给小程序进行调用的,这种做得有接口访问量统计。接口访问量…

    Python 2023年10月22日
    050
  • python-变量、运算符、数据类型

    变量、运算符与数据类型 在使用变量之前,您需要立即为其赋值 [En] you need to assign a value to a variable now before usi…

    Python 2023年5月24日
    076
  • 组队学习-pandas数据处理与分析-第4章

    import numpy as np import pandas as pd df = pd.read_csv(‘learn_pandas.csv’) df SchoolGrade…

    Python 2023年8月20日
    042
  • numpy.reshape()方法详解

    reshape方法详解 二维数组 * 1. 定义 2. 二维数组的变形 三维数组及以上 * 1. 定义 2. 三维数组的变形 3. 三维数组的赋值 4. 识别数组维数的小技巧 参考…

    Python 2023年8月29日
    092
  • python实现将多个DataFrame结果导出到同一个excel的不同sheet页中

    目录 * – 一、问题需求 – 二、解决方案 一、问题需求 对于一个脚本一次会生成多个结果,将多个结果分别导出成多个文件,这类需求相对很简单,就不做概述。我…

    Python 2023年8月17日
    053
  • 实现基础的Python数据可视化(Matplotlib)

    Python(matplotlib)基本图形绘制 一、matplotlib的三层结构 二、简单图形绘制 三、辅助显示层 1.显示刻度 2.添加网格 3.添加描述信息 4.显示图例 …

    Python 2023年9月1日
    039
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球