Kubernetes
  • 序言
  • 基礎入門
    • Kubernetes 簡介
    • Kubernetes 基本概念
    • Kubernetes 101
    • Kubernetes 201
    • Kubernetes 集群
  • 核心原理
    • 核心原理
    • 架構原理
    • 設計理念
    • 核心組件
      • etcd
      • kube-apiserver
      • kube-scheduler
      • kube-controller-manager
      • kubelet
      • kube-proxy
      • kube-dns
      • Federation
      • kubeadm
      • hyperkube
      • kubectl
    • 資源對象
      • Autoscaling
      • ConfigMap
      • CronJob
      • CustomResourceDefinition
      • DaemonSet
      • Deployment
      • Ingress
      • Job
      • LocalVolume
      • Namespace
      • NetworkPolicy
      • Node
      • PersistentVolume
      • Pod
      • PodPreset
      • ReplicaSet
      • Resource Quota
      • Secret
      • SecurityContext
      • Service
      • ServiceAccount
      • StatefulSet
      • Volume
  • 部署配置
    • 部署指南
    • kubectl 安裝
    • 單機部署
    • 特性開關
    • 最佳配置
    • 版本支持
    • 集群部署
      • kubeadm
      • kops
      • Kubespray
      • Azure
      • Windows
      • LinuxKit
      • kubeasz
    • 附加組件
      • Addon-manager
      • DNS
      • Dashboard
      • 監控
      • 日誌
      • Metrics
      • GPU
      • Cluster Autoscaler
      • ip-masq-agent
    • Kubernetes-The-Hard-Way
      • 準備部署環境
      • 安裝必要工具
      • 創建計算資源
      • 配置創建證書
      • 配置生成配置
      • 配置生成密鑰
      • 部署 Etcd 群集
      • 部署控制節點
      • 部署計算節點
      • 配置 Kubectl
      • 配置網絡路由
      • 部署 DNS 擴展
      • 煙霧測試
      • 刪除集群
  • 插件擴展
    • API 擴展
      • Aggregation
      • CustomResourceDefinition
    • 訪問控制
      • 認證
      • RBAC 授權
      • 准入控制
    • Scheduler 擴展
    • 網絡插件
      • CNI
      • Flannel
      • Calico
      • Weave
      • Cilium
      • OVN
      • Contiv
      • SR-IOV
      • Romana
      • OpenContrail
      • Kuryr
    • 運行時插件 CRI
      • CRI-tools
      • Frakti
    • 存儲插件
      • 容器存儲接口 CSI
      • FlexVolume
      • glusterfs
    • 網絡策略
    • Ingress Controller
      • Ingress + Letsencrypt
      • minikube Ingress
      • Traefik Ingress
      • Keepalived-VIP
    • Cloud Provider 擴展
    • Device 插件
  • 服務治理
    • 服務治理
      • 一般準則
      • 滾動升級
      • Helm
      • Operator
      • Service Mesh
      • Linkerd
      • Linkerd2
    • Istio
      • 安裝
      • 流量管理
      • 安全管理
      • 策略管理
      • 度量管理
      • 排錯
      • 社區
    • Devops
      • Draft
      • Jenkins X
      • Spinnaker
      • Kompose
      • Skaffold
      • Argo
      • Flux GitOps
  • 實踐案例
    • 實踐概覽
    • 資源控制
    • 集群高可用
    • 應用高可用
    • 調試
    • 端口映射
    • 端口轉發
    • 用戶管理
    • GPU
    • HugePage
    • 安全
    • 審計
    • 備份恢復
    • 證書輪換
    • 大規模集群
    • 大數據與機器學習
      • Spark
      • Tensorflow
    • Serverless
  • 排錯指南
    • 排錯概覽
    • 集群排錯
    • Pod 排錯
    • 網絡排錯
    • PV 排錯
      • AzureDisk
      • AzureFile
    • Windows 排錯
    • 雲平臺排錯
      • Azure
    • 排錯工具
  • 社區貢獻
    • 開發指南
    • 單元測試和集成測試
    • 社區貢獻
  • 附錄
    • 生態圈
    • 學習資源
    • 國內鏡像
    • 如何貢獻
    • 參考文檔
Powered by GitBook
On this page
  • Node 管理
  • Node 的狀態
  • Taints 和 tolerations
  • Node 維護模式
  • Node 優雅關閉
  • Node 非優雅關閉
  • 參考文檔
  1. 核心原理
  2. 資源對象

Node

PreviousNetworkPolicyNextPersistentVolume

Last updated 1 year ago

Node 是 Pod 真正運行的主機,可以是物理機,也可以是虛擬機。爲了管理 Pod,每個 Node 節點上至少要運行 container runtime(比如 docker 或者 rkt)、kubelet 和 kube-proxy 服務。

Node 管理

不像其他的資源(如 Pod 和 Namespace),Node 本質上不是 Kubernetes 來創建的,Kubernetes 只是管理 Node 上的資源。雖然可以通過 Manifest 創建一個 Node 對象(如下 yaml 所示),但 Kubernetes 也只是去檢查是否真的是有這麼一個 Node,如果檢查失敗,也不會往上調度 Pod。

kind: Node
apiVersion: v1
metadata:
  name: 10-240-79-157
  labels:
    name: my-first-k8s-node

這個檢查是由 Node Controller 來完成的。Node Controller 負責

  • 維護 Node 狀態

  • 與 Cloud Provider 同步 Node

  • 給 Node 分配容器 CIDR

  • 刪除帶有 NoExecute taint 的 Node 上的 Pods

默認情況下,kubelet 在啓動時會向 master 註冊自己,並創建 Node 資源。

Node 的狀態

每個 Node 都包括以下狀態信息:

  • 地址:包括 hostname、外網 IP 和內網 IP

  • 條件(Condition):包括 OutOfDisk、Ready、MemoryPressure 和 DiskPressure

  • 容量(Capacity):Node 上的可用資源,包括 CPU、內存和 Pod 總數

  • 基本信息(Info):包括內核版本、容器引擎版本、OS 類型等

Taints 和 tolerations

Taints 和 tolerations 用於保證 Pod 不被調度到不合適的 Node 上,Taint 應用於 Node 上,而 toleration 則應用於 Pod 上(Toleration 是可選的)。

比如,可以使用 taint 命令給 node1 添加 taints:

kubectl taint nodes node1 key1=value1:NoSchedule
kubectl taint nodes node1 key1=value2:NoExecute

Node 維護模式

標誌 Node 不可調度但不影響其上正在運行的 Pod,這在維護 Node 時是非常有用的:

kubectl cordon $NODENAME

Node 優雅關閉

當配置 ShutdownGracePeriod 和 ShutdownGracePeriodCriticalPods 後,Kubelet 會根據 systemd 事件檢測 Node 的關閉狀態,並自動終止其上運行的 Pod(ShutdownGracePeriodCriticalPods 需要小於 ShutdownGracePeriod)。注意,這兩個參數默認配置爲 0,即優雅關閉特性默認是未開啓的。

比如,如果 ShutdownGracePeriod 設置爲 30s,而 ShutdownGracePeriodCriticalPods 設置爲 10s,那麼 Kubelet 將使節點關閉延遲 30 秒。 在關閉期間,將保留前20(30-10)秒以終止普通 Pod,而保留最後 10 秒以終止關鍵 Pod。

Node 非優雅關閉

在 Node 發生異常的情況下,Kubelet 可能沒有機會檢測並執行優雅關閉。在這種情況下,StatefulSet 無法創建同名的新 Pod,如果 Pod 使用了卷,則 VolumeAttachments 不會從原來的已關閉節點上刪除,因此這些 Pod 所使用的卷也無法掛接到新的運行節點上。

Node 非優雅關閉正是爲了解決這些問題。用戶可以手動將具有 NoExecute 或 NoSchedule 效果的 node.kubernetes.io/out-of-service 污點添加到節點上,標記其無法提供服務。如果在 kube-controller-manager 上啓用了 NodeOutOfServiceVolumeDetach 特性,並且 Pod 上沒有設置對應的容忍度,那麼這些 Pod 將被強制刪除,並且該在節點上被終止的 Pod 將立即進行卷卸載操作。這樣就允許那些在無法提供服務節點上的 Pod 能在其他節點上快速恢復。

參考文檔

Taints 和 tolerations 的具體使用方法請參考 。

Kubernetes Node
Taints 和 tolerations
node
調度器章節