平台介绍
炎龙智能 Multi-Agent Ops 面向企业 IT 与运维团队,把监控告警、AI 诊断、定时巡检、资源管理和安全审批整合在同一套控制台中,帮助团队更快发现故障、更少重复劳动、更稳妥地执行变更。
平台定位
传统运维往往要在监控大屏、SSH 终端、数据库客户端、K8s 控制台之间来回切换;告警来了还要人工猜根因。Multi-Agent Ops 希望把「看到问题 → 理解问题 → 处置问题 → 留下记录」这条链路打通,让 AI 承担重复分析,让人专注决策与审批。
核心价值
- 缩短故障恢复时间:告警到达后自动分析并给出根因与建议,减少从零排查的时间。
- 从被动响应到主动发现:支持定时 AI 巡检,在业务受影响前发现资源、服务与健康度异常。
- 统一运维入口:主机、数据库、缓存、消息队列、容器、链路追踪等可在同一平台纳管并通过 AI 助手操作。
- 可控的自动化:日常只读查询直接执行;重启、删文件、DDL 等高危动作需人工审批或 Quick 模式二次确认。
- 多客户一套平台:SaaS 式多租户,每个客户独立账号、菜单、实例与智能体配置,互不影响。
- 可扩展的工具生态:内置常用运维能力,并支持工具扩展与技能包场景化交付。
适用场景
- 7×24 监控告警处置:与 Prometheus / Alertmanager 等对接,告警入库后自动触发 AI 分析。
- 跨组件故障定位:一次告警涉及数据库、缓存、应用主机时,由业务组协调多实例联合分析。
- 周期性健康检查:对 Linux 服务器、MySQL、K8s 集群等做定时或手动巡检,输出可读报告。
- 日常运维问答与操作:通过 AI 助手查慢 SQL、看 Pod 状态、查 Redis 键、拉 SkyWalking 链路等。
- 等保与合规辅助:内置等保测评相关技能,辅助资产梳理、基线检查与报告生成。
- MSP / 集成商多客户运营:租户一键创建,复制模板即可交付新客户环境。
平台组成(用户视角)
从使用者角度,平台提供三类能力,无需关心背后如何部署:
| 能力层 | 您能看到什么 |
|---|---|
| Multi-Agent Ops 控制台 | 首页概览、资源实例管理、告警列表、巡检记录、租户与用户权限等 |
| Multi-Agent Ops AI 助手 | 对话式运维、业务组编排、根因追问、巡检追问、对话快捷键 |
| Multi-Agent Ops 智能体核心 | 多智能体协同分析、巡检报告生成、技能包执行 |
支持纳管的主要资源类型
- 计算与网络:Linux / Windows 主机、华为等网络设备
- 容器与云原生:Kubernetes 集群与负载
- 关系型与非关系型数据库:MySQL 等关系库、MongoDB 等
- 中间件:Redis、Kafka、RabbitMQ、RocketMQ、ActiveMQ、Elasticsearch、Nacos 等
- 可观测性:Prometheus、Zabbix、SkyWalking、Grafana 等
- DevOps 与 IoT:Jenkins、GitLab、EMQX 等(视实例配置而定)
