|
この文書は自動機械翻訳技術を使用して翻訳されています。 正確な翻訳を提供するように努めておりますが、翻訳された内容の完全性、正確性、信頼性については一切保証いたしません。 相違がある場合は、元の英語版 英語 が優先され、正式なテキストとなります。 |
Kubernetesリソース
このページに記載されているコマンド/手順は、最も重要なKubernetesリソースを確認し、Rancherが起動したKubernetesクラスターに適用するために使用できます。
正しいkubeconfig(例えば、Rancher HA用の`export KUBECONFIG=$PWD/kube_config_cluster.yml`)が設定されていることを確認するか、UIを介して埋め込まれたkubectlを使用していることを確認してください。
ノード
ノードを取得
以下のコマンドを実行し、次のことを確認してください:
-
クラスター内のすべてのノードがリストされているはずで、欠落しているノードがないことを確認してください。
-
すべてのノードは*Ready*ステータスを持っている必要があります(*Ready*状態でない場合は、そのノードの`kubelet`コンテナログを`docker logs kubelet`を使用して確認してください)。
-
すべてのノードが正しいバージョンを報告しているか確認してください。
-
OS/カーネル/Dockerの値が期待通りに表示されているか確認してください(アップグレードされたOS/カーネル/Dockerに起因する問題があるかもしれません)。
kubectl get nodes -o wide
出力の例:
NAME STATUS ROLES AGE VERSION INTERNAL-IP EXTERNAL-IP OS-IMAGE KERNEL-VERSION CONTAINER-RUNTIME controlplane-0 Ready controlplane 31m v1.13.5 138.68.188.91 <none> Ubuntu 18.04.2 LTS 4.15.0-47-generic docker://18.9.5 etcd-0 Ready etcd 31m v1.13.5 138.68.180.33 <none> Ubuntu 18.04.2 LTS 4.15.0-47-generic docker://18.9.5 worker-0 Ready worker 30m v1.13.5 139.59.179.88 <none> Ubuntu 18.04.2 LTS 4.15.0-47-generic docker://18.9.5
ノードの状態を取得
以下のコマンドを実行して、 ノードの状態を持つノードをリストします。
kubectl get nodes -o go-template='{{range .items}}{{$node := .}}{{range .status.conditions}}{{$node.metadata.name}}{{": "}}{{.type}}{{":"}}{{.status}}{{"\n"}}{{end}}{{end}}'
以下のコマンドを実行して、正常な操作を妨げる可能性のあるアクティブな ノードの状態を持つノードをリストします。
kubectl get nodes -o go-template='{{range .items}}{{$node := .}}{{range .status.conditions}}{{if ne .type "Ready"}}{{if eq .status "True"}}{{$node.metadata.name}}{{": "}}{{.type}}{{":"}}{{.status}}{{"\n"}}{{end}}{{else}}{{if ne .status "True"}}{{$node.metadata.name}}{{": "}}{{.type}}{{": "}}{{.status}}{{"\n"}}{{end}}{{end}}{{end}}{{end}}'
出力の例:
worker-0: DiskPressure:True
Kubernetesリーダー選挙
Kubernetesコントローラーマネージャーのリーダー
リーダーはリーダー選挙プロセスによって決定されます。リーダーが決定された後、リーダー(holderIdentity)は`kube-controller-manager`エンドポイントに保存されます(この例では、controlplane-0)。
kubectl -n kube-system get endpoints kube-controller-manager -o jsonpath='{.metadata.annotations.control-plane\.alpha\.kubernetes\.io/leader}'
{"holderIdentity":"controlplane-0_xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx","leaseDurationSeconds":15,"acquireTime":"2018-12-27T08:59:45Z","renewTime":"2018-12-27T09:44:57Z","leaderTransitions":0}>
Kubernetesスケジューラーのリーダー
リーダーはリーダー選挙プロセスによって決定されます。リーダーが決定された後、リーダー(holderIdentity)は`kube-scheduler`エンドポイントに保存されます(この例では、controlplane-0)。
kubectl -n kube-system get endpoints kube-scheduler -o jsonpath='{.metadata.annotations.control-plane\.alpha\.kubernetes\.io/leader}'
{"holderIdentity":"controlplane-0_xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx","leaseDurationSeconds":15,"acquireTime":"2018-12-27T08:59:45Z","renewTime":"2018-12-27T09:44:57Z","leaderTransitions":0}>
Ingressコントローラー
デフォルトのIngressコントローラーはTraefikであり、`traefik`ネームスペースにDaemonSetとしてデプロイされています。ポッドは`worker`ロールを持つノードにのみスケジュールされます。
すべてのノードでポッドが実行されているか確認してください:
kubectl -n traefik get pods -o wide
出力の例:
kubectl -n traefik get pods -o wide NAME READY STATUS RESTARTS AGE IP NODE default-http-backend-797c5bc547-kwwlq 1/1 Running 0 17m x.x.x.x worker-1 traefik-4qd64 1/1 Running 0 14m x.x.x.x worker-1 traefik-8wxhm 1/1 Running 0 13m x.x.x.x worker-0
ポッドが実行できない場合(ステータスが*Running*でない、Readyステータスが`1/1`を表示していない、または再起動の回数が多い場合)、ポッドの詳細、ログ、および名前空間のイベントを確認してください。
ポッドコンテナのログ
以下のコマンドは、"app=traefik"というラベルが付けられたすべてのポッドのログを表示できますが、kubectl logs`コマンドの制限により、ログの最初の10行のみが表示されます。詳細については、--tail`の`kubectl logs -h`を参照してください。
kubectl -n traefik logs -l app=traefik
完全なログが必要な場合は、末尾のコマンドでポッド名を指定してください:
kubectl -n traefik logs <pod name>
Rancherエージェント
クラスターへの通信(`cattle-cluster-agent`経由のKubernetes API)およびノードへの通信(`cattle-node-agent`経由のクラスターのプロビジョニング)は、Rancherエージェントを通じて行われます。
cattle-node-agent
各ノードにcattle-node-agentポッドが存在し、ステータスが*Running*であり、再起動の回数が多くないことを確認してください:
kubectl -n cattle-system get pods -l app=cattle-agent -o wide
出力の例:
NAME READY STATUS RESTARTS AGE IP NODE cattle-node-agent-4gc2p 1/1 Running 0 2h x.x.x.x worker-1 cattle-node-agent-8cxkk 1/1 Running 0 2h x.x.x.x etcd-1 cattle-node-agent-kzrlg 1/1 Running 0 2h x.x.x.x etcd-0 cattle-node-agent-nclz9 1/1 Running 0 2h x.x.x.x controlplane-0 cattle-node-agent-pwxp7 1/1 Running 0 2h x.x.x.x worker-0 cattle-node-agent-t5484 1/1 Running 0 2h x.x.x.x controlplane-1 cattle-node-agent-t8mtz 1/1 Running 0 2h x.x.x.x etcd-2
特定のcattle-node-agentポッドまたはすべてのcattle-node-agentポッドのログを確認してください:
kubectl -n cattle-system logs -l app=cattle-agent
cattle-cluster-agent
cattle-cluster-agentポッドがクラスターに存在し、ステータスが*Running*であり、再起動の回数が多くないことを確認してください:
kubectl -n cattle-system get pods -l app=cattle-cluster-agent -o wide
出力の例:
NAME READY STATUS RESTARTS AGE IP NODE cattle-cluster-agent-54d7c6c54d-ht9h4 1/1 Running 0 2h x.x.x.x worker-1
cattle-cluster-agentポッドのログを確認してください:
kubectl -n cattle-system logs -l app=cattle-cluster-agent
ジョブとポッド
ポッドまたはジョブのステータスが*Running*/*Completed*であることを確認してください。
確認するには、次のコマンドを実行してください:
kubectl get pods --all-namespaces
ポッドが*Running*の状態でない場合、次のコマンドを実行して根本原因を調査できます:
追い出されたポッド
ポッドは 追い出し信号に基づいて追い出される可能性があります。
追い出されたポッドのリストを取得します(ポッド名とネームスペース):
kubectl get pods --all-namespaces -o go-template='{{range .items}}{{if eq .status.phase "Failed"}}{{if eq .status.reason "Evicted"}}{{.metadata.name}}{{" "}}{{.metadata.namespace}}{{"\n"}}{{end}}{{end}}{{end}}'
すべての追い出されたポッドを削除するには:
kubectl get pods --all-namespaces -o go-template='{{range .items}}{{if eq .status.phase "Failed"}}{{if eq .status.reason "Evicted"}}{{.metadata.name}}{{" "}}{{.metadata.namespace}}{{"\n"}}{{end}}{{end}}{{end}}' | while read epod enamespace; do kubectl -n $enamespace delete pod $epod; done
追い出されたポッド、スケジュールされたノード、および理由のリストを取得します:
kubectl get pods --all-namespaces -o go-template='{{range .items}}{{if eq .status.phase "Failed"}}{{if eq .status.reason "Evicted"}}{{.metadata.name}}{{" "}}{{.metadata.namespace}}{{"\n"}}{{end}}{{end}}{{end}}' | while read epod enamespace; do kubectl -n $enamespace get pod $epod -o=custom-columns=NAME:.metadata.name,NODE:.spec.nodeName,MSG:.status.message; done
ジョブが完了しない
Istioを有効にしている場合、デプロイしたジョブが完了しない問題が発生している場合は、これらの手順を使用してポッドにアノテーションを追加する必要があります。
Istioサイドカーは無期限に実行されるため、ジョブのタスクが完了してもジョブは完了と見なされません。これは一時的な回避策であり、アノテーションが付けられたポッドへのトラフィックのIstioを無効にします。このことを考慮すると、ジョブがサービスメッシュにアクセスできないため、統合テストのためにジョブを使用し続けることができない可能性があります。