排查 Kubernetes 集群是否正确安装或配置的步骤如下:
- 确认 Kubernetes 的所有组件(kube-apiserver、kube-controller-manager、kube-scheduler、kubelet 和 kube-proxy)都在运行。可以通过以下命令检查:
systemctl status kubelet
systemctl status kube-apiserver
systemctl status kube-controller-manager
systemctl status kube-scheduler
systemctl status kube-proxy
- 检查每个组件的日志以查看是否存在任何错误或异常。可以使用以下命令来查看日志:
journalctl -u kubelet -f # 查看 kubelet 组件的日志
journalctl -u kube-apiserver -f # 查看 kube-apiserver 组件的日志
journalctl -u kube-controller-manager -f # 查看 kube-controller-manager 组件的日志
journalctl -u kube-scheduler -f # 查看 kube-scheduler 组件的日志
journalctl -u kube-proxy -f # 查看 kube-proxy 组件的日志
- 检查 Master 节点上
etcd
数据库是否可用,这是 Kubernetes 存储集群状态信息所需的数据库。可以使用以下命令检查 etcd 是否正在运行,并且能够响应 API 请求:
ETCDCTL_API=3 etcdctl endpoint health --endpoints=https://127.0.0.1:2379 --cert=/etc/kubernetes/pki/etcd/server.crt --key=/etc/kubernetes/pki/etcd/server.key --cacert=/etc/kubernetes/pki/etcd/ca.crt
如果在执行上述步骤时遇到任何问题,请检查日志文件以获取更多详细信息,并尝试修复问题。