这份文件,就是咱们公司的IT监控管理秘籍啦!里面包含了大纲、组织架构和职责、日常工作怎么做、怎么检查和最后的补充说明,目的就是为了让咱们的IT运维中心在信息系统的监控管理上更加规范,让监控效果更上一层楼,确保咱们的系统健健康康的,满足业务的各种需求。
1. 大纲 - 目的:就是要把IT运维中心的信息系统监控管理搞得更棒,让监控更给力,系统更听话,根据实际情况来制定这个制度。 - 适用范围:这个制度是给IT运维中心和各个承建单位的运维岗位的小伙伴们用的哦。 - 原则:我们要做到全程监控,随时准备响应,统一领导,分级负责,这就是我们的行动指南。
2. 组织架构和职责 - 流程负责人:全面掌控监控体系的建设与执行,对结果和原则做决策,确保监控既有效又高效,需要的时候就推动改进。 - 流程经理:负责流程的开发、设计、执行,制定考核指标,跟踪分析KPI,确保流程记录可追溯,管理整个事情的生命周期。 - 监控规划经理:确定监控的目标、对象、优先级等,评估监控标准,定义事态类型和阈值,建立服务运行模型,确定响应团队。 - 监控专家:设计监控指标,确保状态反馈准确无误,优化指标和分类规则,设计新的指标。 - 监控工具工程师:搭建和维护监控工具,实现数据的互联互通,开发新的监控方式和指标。 - 监控工程师:实时监控关键组件,通知负责人,跟进事态处理,记录并报告相关信息。 - 事态响应工程师:处理告警,排查故障,优化系统,确保系统稳稳当当的运行。
3. 工作内容和要求 - 监控内容分类 - 监控规划:由监控规划经理和监控专家搞定,包括定义监控目标、内容、对象事态类型、阈值、服务运行模型、关联规则集及行动角色通知关联。 - 事态处理:由运维工程师或者和维保单位一起完成,包括事态检测、记录、过滤、分类、响应选择、通知与执行策略。 - 监控和事态管理评审:由监控和事态流程经理带头,确定评审目标、纬度,执行评审与优化。 - 工作要求原则 - 优先级区分:明确记录IT组件的优先级和调整策略。 - 组件可监控性:在采购和开发的时候就要考虑监控需求,把它纳入开发的整个生命周期。 - 纳入监控体系:生产环境中的IT组件要自动加入监控体系,新组件上线了要及时更新文档和策略。 - 专门响应团队:指定专人来响应告警,并且要给他们培训。 - 监控阈值优化:定期根据数据来优化阈值。 - 数据驱动监控:监控活动要基于数据的收集、处理、分析和可视化展示。 - 全面监控:覆盖IT基础设施、网络、应用性能和用户体验。 - 灵活性与可扩展性:监控系统要能适应变化,采用模块化设计和开放标准协议,定期审查更新。
4. 监督与检查:IT运维中心要对信息系统的监控工作进行评价和考核。
5.附则:这个制度由IT运维中心来解释和监督执行,从发布之日起就生效啦。
|