【云原生】K8s pod优雅退出(postStart、terminationGracePeriodSeconds、preStop)

一、概述

  • 更新部署服务时,旧的 Pod 会终止,新 Pod 上位。
  • 如果在这个部署过程中老 Pod 有一个很长的操作,我们想在这个操作成功完成后杀死这个 pod(优雅关闭),如果无法做到的话,被杀死的 pod 可能会丢失一定的流量,或者外界无法感知到该 Pod 被杀死。
  • 特别是,如果我们有一个接收大量流量的 API,错误率在部署过程中会显著增加。这时就必须要设置一些预处理操作让pod的优雅退出,先来了解一下pod的生命周期。

二、Pod 的 生命周期

【云原生】K8s pod优雅退出(postStart、terminationGracePeriodSeconds、preStop)
我们一般将pod对象从创建至终这段时间范围成为pod的生命周期,它主要包含以下的过程:
  • pod创建;
  • 运行初始化容器( init container);
  • 运行主容器( main container);
  • 容器启动后钩子(post start)、容器终止前钩子(pre stop),在启动后就执行 post start
  • 容器的存活性检测(liveness probe)、就绪性检测(readiness probe)。关于探针,可以参考我这篇文章:[云原生] Kubernetes(k8s)健康检查详解与实战演示(就绪性探针 和 存活性探针)
  • pod终止过程,pod完全退出之前执行 pre stop操作,也就是收尾工作。

三、pod的终止过程

  • 在 Pod 退出时,kubelet 删除容器之前会先执行 pod 的 preStop,允许 pod 在退出前执行一段脚本用以清除必要的资源等。
  • 然而 preStop 也有执行失败或者直接 hang 住的情况,这个时候 preStop 并不会阻止 pod 的退出,kubelet 也不会重复执行,而是会等一段时间,超过这个时间会直接删除容器,保证整个系统的稳定。

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:86c66975-b5f1-40fc-9474-400abeb1a40e

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:67e34b24-ae81-4efd-bc19-32013dbaeede

  • 【第一步】用户发出删除 pod 命令
  • 【第二步】K8S 会给旧POD发送SIGTERM信号;将 pod 标记为”Terminating”状态;pod 被视为”dead”状态,此时将不会有新的请求到达旧的pod;
  • 【第三步】并且等待宽限期( pod.spec.terminationGracePeriodSeconds 参数定义, 默认情况下 30秒)这么长的时间
  • 第三步同时运行,监控到 pod 对象为”Terminating”状态的同时启动 pod 关闭过程
  • 第三步同时进行,endpoints 控制器监控到 pod 对象关闭,将pod与service匹配的 endpoints 列表中删除
  • 如果 pod 中定义了 preStop 处理程序,则 pod 被标记为” Terminating“状态时 以同步的方式启动执行 preStop;若宽限期结束后, preStop 仍未执行结束,第二步会重新执行并额外获得一个 2秒 的小宽限期(最后的宽限期,所以定义preStop 注意时间,和terminationGracePeriodSeconds 参数配合使用),
  • Pod 内对象的容器收到 TERM 信号
  • 宽限期结束之后,若存在任何一个运行的进程,pod 会收到 SIGKILL 信号
    Kubelet 请求 API Server 将此 Pod 资源宽限期设置为0从而完成删除操作。

四、钩子函数(postStart 和 preStop)

钩子函数能够感知自身生命周期中的事件,并在相应的时刻到来时运行用户指定的程序代码,k8s在主容器的 启动之后停止之前提供了两个钩子函数。

  • post start:容器创建之后执行,如果失败了会重启容器。
  • pre stop:容器终止之前执行,执行完成之后容器将成功终止,在其完成之前会阻塞删除容器的操作。

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:f047dbca-80b8-4989-9d45-4a2da0990d03

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:006f34db-e6ad-4c1b-8e11-dec538034fee

  • exec命令(自定义):在容器内执行一次命令
......

  lifecycle:
    postStart:
      exec:
        command:
        - cat
        - /tmp/healthy
......

  • tcpSocket:在当前容器尝试访问指定的socket,监听端口,属于四层。
......

  lifecycle:
    postStart:
      tcpSocket:
        port: 8080
......

  • httpGet:在当前容器中向某url发起http请求,监听接口,属于七层。
......

  lifecycle:
    postStart:
      httpGet:
        path: #uri地址
        port:
        host:
        scheme: HTTP  #支持的协议,http或者https
......

五、示例演示

apiVersion: apps/v1
kind: Deployment
metadata:
  name: pod-hook-exec
spec:
  replicas: 1
  selector:
    matchLabels:
     app: pod-hook-exec
  template:
    metadata:
      labels:
        app: pod-hook-exec
    spec:
      terminationGracePeriodSeconds: 5 # 设置5秒宽限时间,默认是30s
      nodeName: local-168-182-110 # 为了测试方便,指定调度机器
      initContainers:
      - name: init-containers
        image: busybox
        command: ["sh","-c","echo init-containers...|tee -a /tmp/pod-hook-exec.log;sleep 5s"]
        volumeMounts:
        - name: logs
          mountPath: /tmp/pod-hook-exec.log
          subPath: pod-hook-exec.log
      containers:
      - name: main-container
        image: busybox
        command: ["sh","-c","echo main-container...|tee -a /tmp/pod-hook-exec.log;sleep 3600s"] # 只有这个才会输出到屏幕,也就是通过logs只能查看主容器日志
        volumeMounts:
        - name: logs
          mountPath: /tmp/pod-hook-exec.log
          subPath: pod-hook-exec.log
        startupProbe:
          exec:
            command: ["sh","-c","echo startupProbe...|tee -a /tmp/pod-hook-exec.log;sleep 5s"]
          timeoutSeconds: 10
        livenessProbe:
          exec:
            command: ["sh","-c","echo livenessProbe...|tee -a /tmp/pod-hook-exec.log;sleep 5s"]
          timeoutSeconds: 10
        readinessProbe:
          exec:
            command: ["sh","-c","echo readinessProbe...|tee -a /tmp/pod-hook-exec.log;sleep 5s"]
          timeoutSeconds: 10
        lifecycle:
          postStart:
            exec: #在容器启动的时候执行一个命令
              command: ["sh","-c","echo postStart...|tee -a /tmp/pod-hook-exec.log;sleep 5s"]
          preStop: # 在pod停止之前执行
            exec:
              command: ["sh","-c","echo preStop...|tee -a /tmp/pod-hook-exec.log"]
      volumes:
      - name: logs #和上面保持一致 这是本地的文件路径,上面是容器内部的路径
        hostPath:
          path: /opt/k8s/test/
kubectl apply -f test.yaml ;kubectl get pods -w |grep pod-hook-exec

【云原生】K8s pod优雅退出(postStart、terminationGracePeriodSeconds、preStop)
【云原生】K8s pod优雅退出(postStart、terminationGracePeriodSeconds、preStop)

从上图的日志就可看出,被分为6个执行阶段,执行的先后顺序: initContainers-》 【main-container、postStart】-》 startupProbe-》 readinessProbe-》 livenessProbe-》 preStop

【温馨提示】 main-containerpostStart 是同时执行,虽然 readinessProbelivenessProbe 也是同时执行,但是他们不是真正的并行执行,也有先后顺序的。

关于K8s pod优雅退出优雅退出,执行先后顺序就先到这里了,有疑问的小伙伴欢迎给我留言哦,后续会持续分享关于【 大数据与云原生】相关的文章,请小伙伴耐心等待哦~

Original: https://www.cnblogs.com/liugp/p/16652330.html
Author: 大数据老司机
Title: 【云原生】K8s pod优雅退出(postStart、terminationGracePeriodSeconds、preStop)

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/562633/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球