Node节点禁止调度（平滑维护）方式- cordon，drain，delete

2023年5月30日下午11:54 • 技术杂谈 • 阅读 108

cordon、drain和delete三个命令都会使node停止被调度，后期创建的pod不会继续被调度到该节点上，但操作的暴力程度却不一样。

一、cordon 停止调度（不可调度，临时从K8S集群隔离）

二、drain 驱逐节点（先不可调度，然后排干）

需要注意：

一般线上K8S的PDB（PodDisruptionBudgets）配置的也是符合Pod驱逐的理想情况的，即maxUnavailable设置为0，maxSurge设置为1：

bash;gutter:true; replicas: 3 strategy: rollingUpdate: maxSurge: 1 maxUnavailable: 0 type: RollingUpdate <pre><code> 默认情况下，kubectl drain 会忽略那些不能杀死的系统类型的 pod。drain命令中需要添加三个参数：--force、--ignore-daemonsets、--delete-local-data * --force 当一些pod不是经 ReplicationController, ReplicaSet, Job, DaemonSet 或者 StatefulSet 管理的时候就需要用--force来强制执行 (例如:kube-proxy) * --ignore-daemonsets 无视DaemonSet管理下的Pod。即--ignore-daemonsets往往需要指定的,这是因为deamonset会忽略unschedulable标签(使用kubectl drain时会自动给节点打上不可调度标签),因此deamonset控制器控制的pod被删除后可能马上又在此节点上启动起来,这样就会成为死循环.因此这里忽略daemonset。 * --delete-local-data 如果有mount local volumn的pod，会强制杀掉该pod。 drain禁止调度的操作步骤：;gutter:true;
确定要排空的节点的名称
kubectl get nodes

查看pod
kubectl get po

命令node节点开始释放所有pod，并且不接收新的pod进程
kubectl drain [node-name] –force –ignore-daemonsets –delete-local-data

此时可以对该node节点进行平滑维护，后续需要恢复到k8s集群中：
kubectl uncordon [node-name]

三、delete 删除节点

首先，驱逐Node节点上的pod资源到其他节点重新创建。
驱逐流程：先在Node节点删除pod，然后再在其他Node节点上创建这些pod。
node节点删除，master失去对其控制，该节点从k8s集群摘除。
delete是一种暴力删除node的方式。在驱逐pod时是强制干掉容器进程，做不到优雅终止Pod。相比较而言，显然drain更安全。

恢复调度（即重新加入到K8S集群中）

delete删除后，后续如果需重新加入K8S集群。则需要重启node节点的kubelet服务，重启后，基于node的自注册功能，该节点才能重新加入到K8S集群，并且恢复使用（即恢复可调度的身份）。
另外：如果kubelet服务重启后，node节点系统时间跟其他节点不一致，则导致该节点证书会失效！kubelet注册后，还需要手动approve签发TLS认证操作了。如下示例：

bash;gutter:true; k8s-vm02节点重启后，系统时间变了，跟其他node节点系统时间不一致，导致该节点的集群证书失效！ [root@k8s-vm01 ingress]# kubectl exec -ti test-finhub-app-56df548879-ghlb2 -n wiseco -- /bin/bash Error from server: error dialing backend: x509: certificate is valid for k8s-vm01, not k8s-vm02 [root@k8s-vm01 ingress]# kubectl get csr NAME AGE REQUESTOR CONDITION csr-7zt2w 50m system:node:k8s-vm02 Pending csr-8sw6k 36m system:node:k8s-vm02 Pending csr-9jv7z 21m system:node:k8s-vm02 Pending 需要手动approve签发TLS认证 [root@k8s-vm01 ingress]# kubectl certificate approve csr-7zt2w [root@k8s-vm01 ingress]# kubectl certificate approve csr-8sw6k [root@k8s-vm01 ingress]# kubectl certificate approve csr-9jv7z

四、Node节点平滑维护

通常情况下，如果要对K8S集群中的一台Node节点进行平滑维护，如升级或调整配置。正确的操作：

cordon临时从K8S集群隔离出来，标识为SchedulingDisabled不可调度状态。
drain排干该节点上的pod资源到其他node节点上。
对该节点展开平滑维护操作，如升级或调整配置。
uncordon恢复，重新回到K8S集群，变回可调度状态。

同时注意：为了确保drain驱逐pod的时候，容器应用服务不中断，必须满足：

要驱逐的pod副本数量必须大于1
要配置”反亲和策略”，确保被驱逐的pod被调度到不同的Node节点上
deployment采用滚动更新，设置maxUnavailable为0，maxSurge为1

Original: https://www.cnblogs.com/kevingrace/p/14412254.html
Author: 散尽浮华
Title: Node节点禁止调度（平滑维护）方式- cordon，drain，delete

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/546372/

转载文章受原作者版权保护。转载请注明原作者出处！

技术杂谈

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

小米运动修改脚本-云函数版

经常有人问修改这个干嘛？原因有：1、支付宝每天可以领取蚂蚁森林的能量，支持一下公益服务；2、微信小程序每天领取京东30个京豆。领取方法：微信绑定京东账号以后，把这个括号（mp://…

技术杂谈 2023年6月21日
00124
2_Spark Streaming 数据接收器

1. TCP Source import org.apache.spark.SparkConf import org.apache.spark.streaming.dstream….

技术杂谈 2023年7月10日
0088
OpenMP教程（一）深入剖析OpenMPreduction子句

在前面的教程OpenMP入门当中我们简要介绍了 OpenMP 的一些基础的使用方法，在本篇文章当中我们将从一些基础的问题开始，然后仔细介绍在 OpenMP 当中 reduction…

技术杂谈 2023年7月24日
00107
书评写作的4步骤7要点

第一步，选书。就是你要选什么样的书？可以选评分高的书，比如豆瓣评分7分以上的书，看了好书才有好内容可写。可以选你自己喜欢或者感兴趣的书，因为你喜欢才能有触动有感想。可以选与…

技术杂谈 2023年6月1日
00113
ArcGIS Pro SDK获得线的交点

Geometry g = GeometryEngine.Instance.Intersection(line1, line2, GeometryDimension.esriGeom…

技术杂谈 2023年5月30日
00116
documentFragment深入理解

documentFragment深入理解抽疯的稻草绳关注 0.4482020.12.27 16:42:40字数 178阅读 3,225 documentFragment是一个保存…

技术杂谈 2023年6月1日
00112
条件平差

例子：三角形内角观测：注解： 1.上面这个方程是观测方程，这个方程里面有3个未知数，一个方程解3个未知数是不可能解出来的，下面把这个方程表示成矩阵的形式：注解： 1.小写c代…

技术杂谈 2023年5月31日
00154
Windows的三种坐标系：屏幕坐标系，非客户区坐标系，客户区坐标系

屏幕坐标系：以屏幕的左上角为原点，如图所示GetWindowRect() 函数获得的 RECT 就是以屏幕坐标系算的。非客户区坐标系（窗口坐标系）包括标题栏的部分。GetWind…

技术杂谈 2023年5月31日
0095
[]商业画布（ Business Model Generation）总结提炼

[原创]商业画布（ Business Model Generation）总结提炼重要合作关键业务核心资源价值服务客户关系渠道通路客户群体成本结构收入来源 Orig…

技术杂谈 2023年5月30日
00119
【数据结构】12.java源码关于ConcurrentHashMap

目录 1.ConcurrentMap的内部结构 2.ConcurrentMap构造函数 3.元素新增策略4.元素删除5.元素修改和查找6.特殊操作7.扩容8.总结 1.Concur…

技术杂谈 2023年7月24日
0096
pip3安装库时报超时问题小结

在Linux测试服务器上使用pip3安装组件时，遇到下面错误：查了一下相关资料弄清楚了这个错误出现的原因：一般出现这个错误跟本地网络状况或配置有关。一般而言，你可能默认使用了国外…

技术杂谈 2023年5月31日
00110
java多线程基础学习

一、多线程概述 1.1、进程和线程的概念 1.1.1、进程 1.1.2、线程 1.2、线程创建的方法 1.2.1、继承Thread类 1.2.2、重写Runnable接口 1.2….

技术杂谈 2023年6月21日
00110
【LEETCODE】70、字符匹配1023 Camelcase Matching

最近做leetcode总感觉自己是个智障，基本很少有题能自己独立做出来，都是百度。。。不过终于还是做出了一题。。。而且速度效率还可以哎，加油吧，尽量锤炼自己 package y…

技术杂谈 2023年7月24日
0086
transformer

transformer 人工智能模型 transformer 人工智能模型 transformer 人工智能模型 Original: https://www.cnblogs.com…

技术杂谈 2023年5月31日
0092
「免费开源」基于Vue和Quasar的前端SPA项目crudapi后台管理系统实战之数据库逆向（十二）

基于Vue和Quasar的前端SPA项目实战之数据库逆向（十二）回顾通过之前文章基于Vue和Quasar的前端SPA项目实战之动态表单（五）的介绍，实现了动态表单功能。如果是全…

技术杂谈 2023年7月24日
00104
批量创建OU和AD账号

#导出某个OU下的所有OU Get-ADOrganizationalUnit -Filter * -SearchBase "OU=智能中心,OU=Staff,DC=yy,…

技术杂谈 2023年5月31日
00105

2024 年 6 月
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

Node节点禁止调度（平滑维护）方式- cordon，drain，delete

大家都在看