监控与运维
本章节按资源类型与场景说明平台能帮您解决什么问题。所有页面仅描述产品能力,不涉及技术实现。
模块导航
| 模块 | 主要解决的问题 |
|---|---|
| 平台管理 | 多租户、权限、通知、License |
| AI 智能运维 | AI 助手、根因分析、巡检、Quick 模式 |
| 主机与基础设施 | 服务器与网络设备纳管、远程运维 |
| 容器与云原生 | K8s 集群状态与负载问题 |
| 数据库 | 关系库 / NoSQL 纳管与安全查询 |
| 中间件 | 缓存、MQ、搜索、注册中心等 |
| 技能包 | 标准化巡检与合规场景 |
一条完整的运维闭环
flowchart LR
A[监控告警] --> B[告警入库]
B --> C[AI 根因分析]
C --> D[通知值班人员]
D --> E[AI 追问 / 助手处置]
F[定时巡检] --> G[巡检报告]
G --> E
能力边界说明
- 平台能力取决于已纳管的实例、已配置的智能体以及账号权限;未纳管的资源无法操作。
- 破坏性操作(重启、删文件、DDL 等)默认需要审批;只读查询与巡检为主动安全设计。
- 部分菜单(如 Jenkins、架构图、风险预测等)可能因租户模板或权限不同而未开放,以实际登录后菜单为准。
