Skip to content

ITOps Agent Platform 从零到精通

一本系统化教学书籍,让每个开发者都能从零基础到精通全面掌握企业级 IT 运维多 Agent 自动化平台


书籍简介

ITOps Agent Platform 是一个企业级全栈运维自动化平台,通过可视化工作流编排多个 AI Agent 协同工作,实现服务器巡检、告警处理、故障诊断、合规检查等运维任务的自动化。

本书以"零基础友好"为原则,通过循序渐进的学习路径、丰富的代码示例、详细的原理解析和实战练习,帮助读者全面掌握:

  • 项目的整体架构和技术栈
  • 前后端开发实战技能
  • 核心功能模块的实现原理
  • Docker 容器化部署和运维
  • 安全机制和 CI/CD 流水线
  • 二次开发和功能扩展能力

目录结构

第一篇:入门篇(零基础友好)

章节标题链接
第1章初识 ITOps Agent Platform阅读
第2章环境准备与快速上手阅读
第3章第一次使用阅读
第4章技术栈入门阅读

第二篇:开发篇(前后端开发实战)

章节标题链接
第5章项目架构深度解析阅读
第6章后端开发基础阅读
第7章前端开发基础阅读
第8章数据库设计与操作阅读
第9章API 开发实战阅读
第10章组件开发实战阅读
第11章实时通信开发阅读
第12章工作流编辑器开发阅读

第三篇:核心功能篇(深入业务逻辑)

章节标题链接
第13章Agent 系统详解阅读
第14章工作流引擎详解阅读
第15章Web SSH 终端详解阅读
第16章告警中心与通知系统阅读
第17章知识库与 RAG 系统阅读
第18章AI Copilot 实现原理阅读

第三篇补充:新增功能模块

以下功能模块在第13-18章之后新增,建议配套阅读:

功能模块所属模块说明
自动修复系统告警中心告警自动触发修复策略,支持自定义修复工作流和审批流程
告警降噪告警中心智能告警去重和抑制,减少告警风暴
根因分析告警中心AI 驱动的告警根因分析,快速定位问题源头
网络设备管理网络运维路由器/交换机/防火墙管理,多厂商命令适配,自动巡检
VNC 远程桌面主机管理浏览器直接访问远程桌面
网络拓扑可视化服务拓扑图展示,节点依赖关系可视化
变更管理运维审计变更记录与追溯
AI 模型管理AI 平台管理和切换多个 AI 模型,支持豆包/OpenAI/本地部署
数据导入导出主机管理CSV/JSON 批量导入服务器,导出告警/审计/报表数据
备份恢复系统管理数据库自动/手动备份,恢复后自动优雅重启
大屏仪表盘可视化全屏可视化仪表盘,实时展示核心指标
SSH 密钥管理安全管理SSH 密钥统一管理和分发

第四篇:进阶篇(运维、安全、扩展)

章节标题链接
第19章Docker 容器化与部署阅读
第20章安全机制深度解析阅读
第21章CI/CD 自动化流水线阅读
第22章性能优化与调优阅读
第23章二次开发与功能扩展阅读
第24章常见问题与排错指南阅读

第五篇:新功能专题(v3.0+)

章节标题链接
第25章自动修复系统详解阅读
第26章网络设备管理详解阅读
第27章VNC 远程桌面、网络拓扑与变更管理阅读
第28章AI 模型管理与数据治理阅读

附录

附录标题链接
附录A环境变量参考手册阅读
附录BAPI 接口速查表阅读
附录C数据库表结构速查阅读
附录D开发工具配置指南阅读

学习建议

零基础读者

建议按顺序从第1章开始,逐章阅读并完成每章的练习题。前4章(入门篇)是基础,务必扎实掌握。

有经验的开发者

可根据自己的技术栈选择阅读路径:

  • 前端开发者:重点阅读第5、7、10、11、12章
  • 后端开发者:重点阅读第5、6、8、9、13-18章、第25-26章
  • 运维工程师:重点阅读第19、20、21、24、25、26章
  • 全栈开发者:建议完整阅读全书

版本信息

版本日期状态说明
v0.12026-05-27编写中第1批章节编写中
v0.22026-05-29编写中全书基础章节完成,新增功能模块待补充
v0.32026-05-29编写中第25-28章大纲完成,新增第五篇:新功能专题
v1.0待定已完成全书定稿

作者

谭策 — 独立开发者 | AIOps 领域探索者

IT Online 微信公众号

许可证

MPL-2.0 © 谭策

基于 MPL-2.0 许可证发布