×

微信扫一扫,快捷登录!

标签: 暂无标签
粘贴上传202501101019448587..png

华为技术有限公司刚发布了这份《IT运维管理:ITIL先锋论坛—行业IT运维白皮书-监控技术规范》,里面讲的全是华为统一运维服务在IT资源监控方面的技术标准。这份文档的目的是给客户提供一个统一的监控能力,让IT系统稳稳地跑起来。这份文档适合华为的行业运维服务销售和服务交付的小伙伴们。




咱们来聊聊文档的结构和内容概览吧

文档分成了六个主要部分,从机房环境动力到应用系统的监控技术规范,全都包括了。

先说说第一部分,概述
- 目的:就是提供一个统一的IT资源监控能力,包括机房动力环境、物理资源、云基础资源、应用系统运行环境及应用系统资源等等。
- 适用对象:主要是华为的运维服务相关人员。
- 术语定义:解释了弹性云服务器、云硬盘、裸金属服务器等术语,帮助大家更好地理解文档内容。

第二部分,机房环境动力
- 监控对象:包括供配电设施、暖通和制冷设施、机房环境、安防和消防设施等等。
- 监控指标:列出了配电柜、UPS、发电机、空调等设备的监控指标,比如电流、电压、负载率、温度等等。
- 监控告警:定义了各种设备的告警条件,比如电压异常、负载过高、设备故障等等。

第三部分,物理资源监控
- 服务器:监控指标包括CPU使用率、内存使用率、磁盘I/O等等。
- 宿主机:涉及虚拟化平台的CPU和内存使用情况。
- 网络设备:包括路由器、交换机等的CPU利用率、内存利用率、流量值等等。
- 存储设备:涵盖块存储、SAN交换机和文件存储的监控指标,比如存储容量、IOPS、响应时间等等。

第四部分,云基础资源监控
- 计算资源:包括弹性云服务器和裸金属服务器的CPU、内存、网络和存储使用情况。
- 存储资源:对象存储服务的上传下载流量、请求次数等等。
- 网络资源:弹性IP和弹性负载均衡的流量、连接数等等。

第五部分,应用系统运行环境监控
- 操作系统:监控Linux和Windows系统的CPU、内存、网络状态等等。
- 中间件:包括Nginx、IIS、WAS、Tomcat等中间件的端口连通性、进程状态、性能指标等等。
- 数据库:Oracle、SQL Server、MySQL等数据库的连通性、性能指标、资源利用率等等。

第六部分,应用系统
- 监控指标:访问成功率、首屏用时、客户端崩溃率、服务端口可达性、URL可达性、响应时间等等。
- 业务数据:关注关键业务数据的总量、待处理量和已处理量,帮助揭示性能问题。


再来看看文档的特点和应用场景

- 全面性:文档从基础设施到应用系统,全方位监控,确保IT系统的每个层面都得到妥善监控。
- 标准化:提供了统一的监控标准和指标,让运维人员可以轻松地进行标准化监控和管理。
- 实用性:详细列出了各种设备和系统的监控指标和告警条件,给运维人员提供了实用的参考。
- 适用性:适用于不同规模和类型的IT系统,无论是大型数据中心还是中小型企业,都能找到适用的监控规范。


这份文档为IT运维管理提供了一套全面、标准化的监控技术规范。通过详细的监控指标和告警条件,运维人员可以更好地掌握IT系统的运行状态,及时发现和处理潜在问题,从而保障系统的稳定性和可靠性。这对于提升IT运维效率和质量具有重要意义。







上一篇:IT银行数据中心的Zabbix智能运维建设方案,专门针对IT运维管理的!
下一篇:《行业IT运维标准白皮书-应用日志运维规范》
slbenben

写了 1924 篇文章,拥有财富 11774,被 11 人关注

您需要登录后才可以回帖 登录 | 立即注册
B Color Link Quote Code Smilies

成为第一个吐槽的人

返回顶部