第三部分：控制平面组件 etcd 介绍

青萍叙事2025-08-12

📝 前言

在 Kubernetes 的控制平面中，有一个低调但至关重要的组件 —— etcd。

它是集群的大脑，存储了所有集群的状态信息与配置数据。

本文是云原生之旅第三部分的第三篇，将深入介绍 etcd 的定义、工作原理、在 Kubernetes 中的角色，以及在生产环境下的优化建议。

etcd 由 CoreOS 开发（已被 Red Hat 收购并捐献给了 CNCF），是一个分布式键值（Key-Value）存储系统，采用 Raft 共识算法来保证数据一致性。

作为 Kubernetes 的数据存储后端，它承担了存储和维护集群配置、节点状态、资源对象定义等关键任务。

一旦 etcd 出现问题，整个集群的稳定性将面临巨大风险。

比如某次真实的运维事故：

一家互联网公司在凌晨进行例行 Kubernetes 升级时，没有提前做 etcd 数据快照。

升级过程中，由于磁盘 I/O 突然飙高，etcd 节点写入延迟剧增，导致集群的 Leader 无法及时提交事务，触发了频繁的 Leader 选举。

短短几分钟内，所有 API 请求都出现超时，CI/CD 流水线中断，线上 Pod 也无法进行调度。

最终，运维团队不得不紧急从三天前的 etcd 快照中恢复数据，但由于快照过旧，部分业务的最新配置丢失，导致恢复过程拖延了 4 小时以上。

这个案例很好地说明了：

etcd 是一个强一致性分布式键值存储，为需要被分布式系统或机器集群访问的数据提供了一种可靠存储方式。

它在网络分区期间优雅地处理领导者选举，即使在领导者节点也能容忍机器故障。

它的主要特性：

etcd 采用 Raft 共识算法 来实现分布式数据一致性，主要机制如下：

大致流程图如下所示：

在 Kubernetes 中，几乎所有资源对象（Pod、Deployment、Service 等）的定义都存储在 etcd 中，并通过 API Server 与其交互，除此之外还有以下主要任务：

在生产环境中，etcd 的启动参数会直接影响性能和稳定性，常见参数包括：

在大规模 Kubernetes 集群中，etcd 性能优化至关重要，主要建议包括：

硬件层面优化
- 使用 SSD 提升 I/O 性能（至关重要，etcd 对磁盘 I/O 要求较高）
- 增加内存，减少磁盘访问
- 网络延迟低于 1ms
参数调优
- 设置 -auto-compaction-retention 定期清理历史数据
- 调整 -snapshot-count 控制快照频率
- 启用 -quota-backend-bytes 限制存储空间防止爆满
运维策略
- 定期做快照备份（如每日一次）
- 在升级 Kubernetes 之前先升级并验证 etcd
- 使用 etcdctl 工具监控健康状态
高可用部署
- 推荐部署奇数个节点（3 或 5 个）以保证选举稳定
- 分布在不同物理主机或可用区