Spark在standalone中关于core的参数设置

2023年6月21日下午4:14 • 技术杂谈 • 阅读 81

最近发现，在执行pyspark任务时，对pythonFunction的CPU使用率进行限制存在问题，究其根本，还是sparkConf的参数存在问题。

梳理了下spark启动参数中关于core的设置问题

执行 spark-submit -h 得到spark启动参数的说明，截取部分关于core的说明

 Cluster deploy mode only:
  --driver-cores NUM          Number of cores used by the driver, only in cluster mode
                              (Default: 1).

 Spark standalone, Mesos and Kubernetes only:
  --total-executor-cores NUM  Total cores for all executors.

 Spark standalone, YARN and Kubernetes only:
  --executor-cores NUM        Number of cores used by each executor. (Default: 1 in
                              YARN and K8S modes, or all available cores on the worker
                              in standalone mode).

 Spark on YARN and Kubernetes only:
  --num-executors NUM         Number of executors to launch (Default: 2).

                              If dynamic allocation is enabled, the initial number of
                              executors will be at least NUM.

由于我们使用的是standalone模式，可以看到，原来并不是所有参数都起作用。

例如–num-executors只适用YARN和Kubernetes。

在standalone中，关于core的设置主要是由–total-executor-cores和–executor-cores进行控制。

–total-executor-cores：所有executor的core总数
–executor-cores：每个executor的core个数（standalone下，默认是worker上所有可用的core）

发现，这两个参数好像有点冲突，如果只设置–total-executor-cores而不设置–executor-cores是否会出现问题

针对这两个参数的使用，考虑了三种情况进行测试：

仅设置–total-executor-cores：仍会根据–executor-cores的默认值，使用所有空闲的core。并不会根据设置，使用最多–total-executor-cores个数的core
仅设置–executor-cores：会根据数值对core进行设置
同时设置–total-executor-cores和–executor-cores：standalone模式下，没有对executor的设置，则会根据(–total-executor-cores // –executor-cores)对executor的个数进行计算，得到executor个数。再根据worker情况，建立有–executor-cores个core的executor

有兴趣的可以在扒一扒源码看看。

我在测试时使用的是pyspark3.1.2.

Original: https://www.cnblogs.com/antelx/p/15909047.html
Author: Antel
Title: Spark在standalone中关于core的参数设置

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/643697/

转载文章受原作者版权保护。转载请注明原作者出处！

技术杂谈

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

强大的DOM变化观察者MutationObserver

可以监听到属性、文本内容、节点插入删除、子节点变化等事件。可是该事件 W3C 已废弃，虽然一些浏览器仍然支持，但不建议使用。 MutationObserver目前IE11+及其它浏…

技术杂谈 2023年6月1日
0081
MySQL索引结构及原理

一、索引简介索引是一种用于快速查询和检索数据的数据结构。常见的索引结构有： B树 ， B+树 和 Hash 。索引的作用就相当于目录…

技术杂谈 2023年7月24日
00101
Python 可迭代对象和迭代器

可迭代对象：是一个私有的方法比较多，操作灵活（比如列表，字典的增删改查，字符串的常用操作方法等）,比较直观，存储数据相对少（几百万个对象，8G内存是可以承受的）的一个数据集。当你…

技术杂谈 2023年6月21日
0059
C#中is关键字和as关键字的一些文章（链接）

下面的文章阐述了C#中的 is关键字：下面的文章阐述了C#中的 as关键字：下面的文章对C#中的 is关键字和 as关键字进行了比较： Original: https://ww…

技术杂谈 2023年5月31日
0082
【证券从业】金融基础知识-第六章证券投资基金02

注1：后续学习并整理到第八章，全书完结后再合并成一个笔记进行源文件分享注2：本章内容巨多，大约分为三篇文章记录消化 posted @2022-06-11 23:55 陈景中阅读…

技术杂谈 2023年7月10日
0072
python模块，邮件推送交换机error级别以上log，django前端展示

个人博客地址 http://www.darkghost.life 前情概要原syslog服务器只收集不推送日志，可以实时展示，服务器在海外内网，办公网做的有分流，到日志服务器的流…

技术杂谈 2023年7月25日
0069
软件测试流程是什么？这题我不会啊

转载请注明出处❤️ 作者：测试蔡坨坨原文链接：caituotuo.top/ae4fff18.html 你好，我是测试蔡坨坨。最近收到不少准备转行软件测试的小伙伴私信问真实企业里…

技术杂谈 2023年7月11日
0088
禁用FileZilla文件修改后弹出提示上传

在 FileZilla 设置，文件编辑选项卡中禁用”观看本地编辑的文件并提示上传修改”。 Original: https://www.cnblogs.com…

技术杂谈 2023年5月31日
0082
request.getSession(true/false)的区别

【原文链接】：https://blog.tecchen.tech ，博文同步发布到博客园。由于精力有限，对文章的更新可能不能及时同步，请点击上面的原文链接访问最新内容。欢迎访问我的…

技术杂谈 2023年7月11日
0061
kubernetes code-generator使用

404. 抱歉，您访问的资源不存在。可能是网址有误，或者对应的内容被删除，或者处于私有状态。代码改变世界，联系邮箱 contact@cnblogs.com 园子的商业化努力-困…

技术杂谈 2023年7月24日
0064
fashion datasets图像检索实践project

Using Siamese Networks and Pre-Trained Convolutional Neural Networks (CNNs) for Fashion Si…

技术杂谈 2023年6月1日
0097
asp 遍历文件夹

转载请注明出处：http://www.cnblogs.com/cloudgamer/ 如有任何建议或疑问，欢迎留言讨论。如果觉得文章不错的话，欢迎点一下右下角的推荐。程序中包含…

技术杂谈 2023年5月30日
00106
自制聊天软件测试

自制聊天软件测试; 自制聊天软件测试 SWing+Netty Original: https://www.cnblogs.com/chenying99/p/10074816.htm…

技术杂谈 2023年5月31日
00109
dremio odbc 驱动包下载说明

dremio 就在5月底左右的时候，对于odbc 驱动停止了下载，目前在dremio 社区网站有不大好人员反馈了，总的来说是很不好对于数据处理领域基于python （会使用到odb…

技术杂谈 2023年5月30日
00143
Java String Pool–String s = new String(“a”) 到底创建了几个对象？

本篇重点(tips)： String Pool 是以Java 中 String 对象是不可变的这一特性为基础的 String Pool是Heap(堆)中的一块特殊空间(JDK 1….

技术杂谈 2023年6月21日
0072
[转]axios 的理解和使用

有废话少说，直接附上原文链接：其它链接： 1、axios中文文档：http://www.axios-js.com/ Original: https://www.cnblogs.c…

技术杂谈 2023年6月1日
00102

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Spark在standalone中关于core的参数设置

大家都在看