type
status
date
slug
summary
category
tags
create_time
Jun 14, 2025 09:59 AM
icon
password
my_create_time

🎯 背景

在云原生趋势下,Docker 已成为个人开发者托管应用的首选方式。然而:
  • 默认监控盲区
阿里云 ECS 开箱即用的 CloudMonitor 仅采集 CPU、内存、磁盘等 主机级指标;容器内部负载、单个服务的健康度等一概不知。
  • 运维风险
当某个容器因为内存泄漏或流量激增而崩溃时,传统主机告警往往无感知,问题被放大到用户层面才会被发现。
PS:监控是告警的第一步,告警是保障服务稳定运行的关键手段。

🚧 痛点问题

你可能遇到的痛点:
1、Docker/Docker Compose 中多个服务跑在同一 ECS 上,无法判断哪个容器资源异常。
2、想给关键 API 端点做存活探针,却不知从何下手。
3、手动登录服务器 docker stats 太繁琐,且不具备历史观测能力。

🧩 适用场景

场景
说明
单机多容器
所有服务部署在一台 ECS,通过 Docker/Docker Compose 协调
轻量级站点
个人博客、作品集、API 服务等,无需引入 Kubernetes
不依赖第三方工具
希望通过阿里云原生方案实现监控,而非引入复杂的第三方工具(如 Portainer 等)

🛠️ 步骤概览

1️⃣ 开通云监控服务

进入阿里云控制台,搜索应用实时监控服务ARMS ,首次点击进去后开通即可。
notion image

2️⃣ 接入 Docker 单机容器监控

进入后,点击左侧导航的接入中心 → Docker单机容器监控
notion image

3️⃣ 配置接入

notion image
配置说明:
1、选择你需要接入的 ECS 服务器
2、配置接入名称
3、选择安装方式,自动安装即可
4、cAdvisor 服务端口,默认是8080,注意不要跟服务器当前已使用的冲突,否则会安装失败。

4️⃣ 查看监控大盘

等待几分钟监控组件安装完成后,点击左侧导航的接入管理 → ECS 环境 → 点击环境名称 → 大盘 → cAdvisor Overview,即可查看容器监控大盘。
notion image
notion image
notion image

✅ 总结

通过应用实时监控服务ARMS可快速完成以下能力:
  • 主机 + 容器双层监控:先覆盖系统资源,再下钻到单容器。
  • 最小改动原则:通过插件化方案,避免侵入现有 Docker Compose 文件。
  • 前期先用默认指标,稳定后再逐步接入 自定义业务指标(如请求耗时、错误率)。
后续还可以自定义接入告警规则,进一步保障服务稳定。
💡
有关文章的任何疑问,欢迎您在底部评论区留言,一起交流~
若文章对您有帮助,欢迎 请我喝杯咖啡~
 
上一篇
博客网站更新,顺便聊一聊写作这件事
下一篇
纪念一下首篇文章阅读量破千

评论
Loading...