写论文的第四天 Spark安装使用sparkshell

2023年6月3日下午12:13 • 大数据 • 阅读 70

Spark分布式安装

Spark安装注意：需要和本机的hadoop版本对应

前往spark选择自己相对应的版本下载之后进行解压

命令：tar –zxf spark-2.4.0-bin-hadoop2.6.tgz –C /usr/local

配置spark分布式，修改两个主要配置文件 spark-env.sh.template slaves.template slaves 留存备份

命令： cp spark-env.sh.template spark-env.sh

命令：cp slaves.template slaves

配置spark-env.sh

SPARK

export JAVA_HOME=/usr/local/jdk1.8.0_192

export SCALA_HOME=/usr/local/scala

export SPARK_MASTER_IP=master

export SPARK_WORKER_CORES=2

export SPARK_WORKER_MEMORY=1g

export HADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoop

export SPARK_PID_DIR=/usr/local/hadoop/pids

export SPARK_DIST_CLASSPATH=$(/usr/local/hadoop/bin/hadoop classpath)

配置slaves

删除localhost 增加 node1 node2

将配置好的spark复制到子节点

命令：scp –r /usr/local/spark node1:/usr/local

scp –r /usr/local/spark node2:/usr/local

尝试启动spark

命令：/usr/local/spark/sbin/start-all.sh

写论文的第四天 Spark安装使用sparkshell

进入spark-shell查看spark启动是否成功

写论文的第四天 Spark安装使用sparkshell

启动正常

为spark配置环境变量

命令：vim /etc/profile

set SPARK_HOME

export SPARK_HOME=/usr/local/spark

export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

命令：source /etc/profile使配置生效

Original: https://www.cnblogs.com/shun57/p/10775056.html
Author: SHUN丶
Title: 写论文的第四天 Spark安装使用sparkshell

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/564868/

转载文章受原作者版权保护。转载请注明原作者出处！

赞 (0)

0

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

redis探索之缓存一致性

大数据 2023年11月15日
0034
2022 大一大二基础hive考试题

一. 选择题1.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤中进行的？（ C ）A、频繁模式挖掘B、分类和预测C、数据预处理D、数据流挖掘 2.为数据的总体分布建模…

大数据 2023年11月12日
0034
基于Andriod的简易记事本APP设计与实现

本设计完成后，能够实现以下功能： (1)设计实现”添加新记事”,”编辑内容”,”保存和删除当前记事”这三个主…

大数据 2023年11月12日
0051
golang程序通过docker打包到harbor的方式进行jenkins自动化发布

需求描述：公司内部的git仓库 golang 服务端代码需要以docker打包的方式发布到外网多台服务器中，作为api接口服务启动，然后nginx反向代理到这几台机器中如果不以do…

大数据 2023年5月28日
0063
Hive基础

大数据 2023年11月15日
0035
大数据学习笔记——————-(13)

第13章 KAFKA基本组成与集群架构 13.1 KAFKA的基本组成在深入学习KAFKA之前，必须知道的专业术语如：主题 (topics)、中间件(brokers)、生产者 (…

大数据 2023年5月26日
0083
leetcode的Hot100系列–155. 最小栈

栈：先入后出，后入先出像电梯一样，先进入电梯的，走到电梯最深处，后进入电梯的，站在电梯门口，所以电梯打开的时候，后进入的会先走出来，先进入的会后走出来。 push，对应入电梯，把…

大数据 2023年6月3日
0073
海康威视设备网络SDK封装+SpringBoot调用SDK

最近在使用海康威视的摄像头进行车牌抓拍，使用了海康威视设备网络SDK，便稍做包装，便于项目调用。项目地址 https://github.com/Mr-LuXiaoHua/hiki…

大数据 2023年6月3日
00101
HIVE3 深度剖析 (上篇)

大数据 2023年11月13日
0046
centos8 编译安装 httpd-2.4

前提：关闭selinux和防火墙 SElinux： setenforce 0 vim /etc/selinux/config–>disabled 防火墙： firewall…

大数据 2023年5月27日
0078
数据仓库(5)数仓Kimball与Inmon架构的对比

数据仓库主要有四种架构，Kimball的DW/BI架构、独立数据集市架构、辐射状企业信息工厂Inmon架构、混合Inmon与Kimball架构。不过不管是那种架构，基本上都会使用到…

大数据 2023年6月2日
0072
Sqlite如何创建双主键

创建双主键, 需要使用primary key 关键字: string sql = “create table if not exists channel (&#8221…

大数据 2023年11月10日
0051
python搭配sqlite，轻松搞定本地数据管理

假设我们有个项目，每天计算统计结果，那么我们应该怎么存储这些数据呢？直接按天写到一个数据文件（txt,csv,xlsx,pickle）里面？但是如果我们需要对历史数据进行一些对比分…

大数据 2023年11月12日
0055
CogLTX Applying BERT to Long Texts

CogLTX: Applying BERT to Long Texts Ming Ding, Chang Zhou, Hongxia Yang, and Jie Tang. 202…

大数据 2023年5月28日
0092
最新的ZooKeeper GUI

Zookeeper 是一个分布式的、开源的程序协调服务，是 hadoop 项目下的一个子项目。他提供的主要功能包括：配置管理、名字服务、分布式锁、集群管理。平时用zkCli.s…

大数据 2023年6月3日
0066
HDFS角色NameNode多目录配置

HDFS角色NameNode多目录配置原创 wx62be9d88ce2942022-07-01 17:58:44博主文章分类：大数据 ©著作权文章标签 hdfs hadoop …

大数据 2023年5月25日
0073

亲爱的 Coder【最近整理，可免费获取】👉 最新必读书单 | 👏 面试题下载 | 🌎 免费的AI知识星球