Spark在standalone中关于core的参数设置

2023年6月21日下午4:14 • 技术杂谈 • 阅读 106

最近发现，在执行pyspark任务时，对pythonFunction的CPU使用率进行限制存在问题，究其根本，还是sparkConf的参数存在问题。

梳理了下spark启动参数中关于core的设置问题

执行 spark-submit -h 得到spark启动参数的说明，截取部分关于core的说明

 Cluster deploy mode only:
  --driver-cores NUM          Number of cores used by the driver, only in cluster mode
                              (Default: 1).

 Spark standalone, Mesos and Kubernetes only:
  --total-executor-cores NUM  Total cores for all executors.

 Spark standalone, YARN and Kubernetes only:
  --executor-cores NUM        Number of cores used by each executor. (Default: 1 in
                              YARN and K8S modes, or all available cores on the worker
                              in standalone mode).

 Spark on YARN and Kubernetes only:
  --num-executors NUM         Number of executors to launch (Default: 2).

                              If dynamic allocation is enabled, the initial number of
                              executors will be at least NUM.

由于我们使用的是standalone模式，可以看到，原来并不是所有参数都起作用。

例如–num-executors只适用YARN和Kubernetes。

在standalone中，关于core的设置主要是由–total-executor-cores和–executor-cores进行控制。

–total-executor-cores：所有executor的core总数
–executor-cores：每个executor的core个数（standalone下，默认是worker上所有可用的core）

发现，这两个参数好像有点冲突，如果只设置–total-executor-cores而不设置–executor-cores是否会出现问题

针对这两个参数的使用，考虑了三种情况进行测试：

仅设置–total-executor-cores：仍会根据–executor-cores的默认值，使用所有空闲的core。并不会根据设置，使用最多–total-executor-cores个数的core
仅设置–executor-cores：会根据数值对core进行设置
同时设置–total-executor-cores和–executor-cores：standalone模式下，没有对executor的设置，则会根据(–total-executor-cores // –executor-cores)对executor的个数进行计算，得到executor个数。再根据worker情况，建立有–executor-cores个core的executor

有兴趣的可以在扒一扒源码看看。

我在测试时使用的是pyspark3.1.2.

Original: https://www.cnblogs.com/antelx/p/15909047.html
Author: Antel
Title: Spark在standalone中关于core的参数设置

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/643697/

转载文章受原作者版权保护。转载请注明原作者出处！

技术杂谈

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

scala中怎样调用 java中的接口

直接继承 object GetCustomHandler extends ResultSetHandler[Int] { override def handle(rs: Resu…

技术杂谈 2023年7月11日
0085
导出websphere内存镜像

1.将脚本放致profiles\appservername\bin 下 2.查看一下soap host(在控制台port中能够看到) 3.运行例如以下命令：./wsadmin.sh…

技术杂谈 2023年5月31日
00102
2022.22 如何提升技术能力

最近，看到文章《关于技术能力的思考和总结》，里面的一些点还是值得技术人反思学习的。对于什么是技术能力，作者提炼了一个模型如下：首先，技术人要通过练掌握术，提升技术能力，成为团队…

技术杂谈 2023年5月30日
00119
flex布局

设置flex-direction值为row，然后设置flex-wrap值为wrap，此时，如果子元素总长超出容器长度，那么，子元素超出部分将会换行显示。可以看出，flex-dire…

技术杂谈 2023年7月24日
0079
快速模幂算法

快速模幂算法就是将指数变成二进制数来计算，每次按照底数的二进制次方进行计算，因为底数相乘指数相加，又模和乘可以相互变化，所以最后可以一边模一边乘，最后得出的结果还是正确的。例如：…

技术杂谈 2023年6月21日
00124
vite2 打包的时候vendor-xxx.js文件过大的解决方法

vite2是一个非常好用的工具，只是随着代码的增多，打包的时候 vendor-xxxxxx.js 文件也越来越大，这就郁闷了。输出文件名字/static/vendor.9b569…

技术杂谈 2023年5月31日
00115
Microsoft帐户无法登录怎么办，换个dns试试

最近系统设置老提示Microsoft账户重新登录，但始终是无法登录上去，一直转圈并提示请稍等…，最后还提示发生了错误，”请重试，或选择”取消&#…

技术杂谈 2023年5月30日
00202
014 Linux 线上高频使用以及面试高频问题——如何查找大文件并安全的清除？

1 案例描述？ 2 命令一（目录统计排序最佳命令） 3 命令二（最实用，目录和文件一起统计排序）（1）命令详情和说明（2）du、head、sort、awk 详细说明参考已有文章…

技术杂谈 2023年7月10日
0078
Python实现简繁体转换，现在的人玩得老花了

1、opencc-python 首先介绍opencc中的Python实现库，它具有安装简单，翻译准确，使用方便等优点。对于我们日常的需求完全能够胜任。 ; 1.1安装opencc-…

技术杂谈 2023年6月21日
00113
Tableau Desktop for Mac/win(全能数据分析工具)

Original: https://www.cnblogs.com/aurora-123/p/16855177.htmlAuthor: 佛系女孩Title: Tableau Des…

技术杂谈 2023年7月11日
00100
如何用Win10自带chkdsk命令修复磁盘

chkdsk – Guide for Windows 10, 11, XP, Vista, 7, 8 Log into Windows 10 Press the Win…

技术杂谈 2023年5月31日
0086
C++ 虚基类与虚继承 (菱形继承问题)

C++ 是支持多继承的语言，但是实际项目开发中非必要不要使用多继承以降低代码逻辑的复杂性，当然 C++ 多继承的特性带来一些问题即菱形继承。当一个类继承了两个来自同父类的子类…

技术杂谈 2023年6月21日
00113
PyQt5主窗口图标显示问题汇总

窗口程序的开发流程如下：先通过qt designer设置界面并将程序图标设置好，通过在designer中按ctrl + R 进行预览可以看到窗口左上角的图标，然后保存通过pyu…

技术杂谈 2023年7月11日
0092
重载运算符

struct node { int a,b; }; bool operator const node &x,const node &y) { return x.a&…

技术杂谈 2023年6月22日
0098
[转帖]160亿晶体管！完爆英特尔！苹果首款Mac处理器详细解读及评测！

404. 抱歉，您访问的资源不存在。可能是网址有误，或者对应的内容被删除，或者处于私有状态。代码改变世界，联系邮箱 contact@cnblogs.com 园子的商业化努力-困…

技术杂谈 2023年5月30日
0099
copy与mutableCopy区别，strong和copy的使用

本篇文章主要讲两个知识点：1.深拷贝与浅拷贝 2.NSArray和NSMutaleArray应该用copy还是stong修饰。一、我们先来分析深拷贝(返回一个对象，一个新的指针指…

技术杂谈 2023年5月30日
00103

2024 年 6 月
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

Spark在standalone中关于core的参数设置

大家都在看