×

扫描二维码登录本站

QQ登录

只需一步,快速开始

标签: 暂无标签
国华电力携手KoolPoint打造运维管理新时代

1.客户介绍
    神华北京国华电力有限责任公司成立于1999年3月11日,作为神华集团有限责任公司的全资子公司,全面负责集团电力业务的经营管理。2005年2月25日,按照集团改制重组方案,将电力板块的大部分资产注入上市公司,并设立了中国神华能源股份有限公司国华电力分公司,对纳入上市范围的电力资产进行统一管理。
    根据国民经济发展规划、国家产业政策及市场需求,国华电力认真贯彻落实科学发展观,依托集团煤炭、电力、运输一体化资源优势,按照“点、线、面”相结合的发展战略布局,重点建设坑口、港口、路口和负荷中心的电源项目,建设高效率、高参数、大容量火电机组,形成了规模适度、资产优良、竞争力强的电力产业格局,已成为具有一定规模的跨地区、跨电网的全国性发电企业,并被中国电力企业联合会授予“全国电力行业优秀企业”称号。
    截止2008年底,国华电力管控全资、控股、参股企业33家,业务发展主要分布在华北、东北、西北、珠江三角洲、长江三角洲等区域,资产总额977亿元,运营装机容量为1853万千瓦。规划到2010年,运营装机容量将超过3000万千瓦;到2020年达到5000万千瓦。
    面向未来,国华电力将坚持以实现资本的安全、保值、增值为国家创造价值;以履行企业使命,促进区域经济发展为社会创造价值;以提供满意的产品和优质服务,为客户创造价值;以提供个人发展空间,提升生活品质,为员工创造价值;以“与邻为善、与邻为伴”,承担社会责任,为合作伙伴和公众创造价值,努力建设“本质安全型、质量效益型、科技创新型、资源节约型、和谐发展型”企业,全面促进神华事业的又好又快发展。
2.案例背景
    国华电力早在许久之前就曾经使用北塔网络监控产品,但由于当前国华电力信息中心的网络管理系统呈分散状态,其范围也非常有限,致使无法全面了解国华电力客户信息网中计算机及网络系统的实时运行状况,对网络资源配置及网络流量分布也无法进行有效监控,关键在于无法实现运维流程与事故报警的联动。国华电力客户的各项业务系统对计算机网络和IT基础平台的依赖性越来越高,对系统与网络的可用性、可靠性和稳定性也提出了更高的要求。因此,对全局的计算机及网络系统进行高效、统一、集中的监控和管理是保证国华电力客户及各项业务系统正常运行的重要条件。
    目前国华电力客户的IT管理主要面临以下问题:
    •网络管理的覆盖范围不足
    •缺乏统一的运维管理平台
    作为网络管理员,必须有效地了解网络中数据传输是否正常、服务器以及网络设备是否过载运行、局域网内部以及局域网与互联网的连接是否正常、局域网是否受到非法者的攻击、用户之间的数据传输是否正常等等,同时,在遇到网络时断时续、网络内部用户不能正常上网等网络故障时,必须能快速定位故障点并将其排除。由于网络之间的数据传输的不透明性,没有统一的网络管理平台,管理手段落后,网络管理人员很难及时准确完成上述要求。
网络性能得不到充分发挥。
    由于没有网络性能方面的管理工具,网管人员不能对网络进行有效的调整和优化。
    对于国华电力这个集生产业务网络和电子政务外网混合组网的网络系统来讲,如果没有一个有效而集中的工具进行管理和分析网络的运行趋势,找到隐藏的性能瓶颈,为网络系统管理的长期规划提供数字依据。将难以保证网络及各项业务应用的顺利运行。

3.实施方案介绍
3.1产品概述
    KooPoint 企业版(以下简称KoolPoint),整合了系统管理、监控、服务、统计分析和门户等多种技术,是对ITIL的IT 服务管理核心流程的实现,是一个实用、可扩展的技术解决方案。
    KoolPoint 应用监控也对Oracle和Lotus Domino的平台系统提供可视化监控、故障定位、统计报告等功能的组件。
产品主要具有以下功能:
    •提供面向“业务服务”的,整合网络、主机、应用、服务等各层面IT 资源的、统一的IT 服务管理信息视图。
    •自动的网络拓扑可以从全局监控整个网络架构的健康状态,自定义的网络拓扑可以清晰的按照逻辑结构定义拓扑子Map。通过子Map来快速定位网络问题。
    •实时监控Lotus Domino 平台的运行状态和健康状态。及时发现OA和邮件的问题。
    •实时可视化监控Oracle 数据库的状态。
    •IT资产(在线资产与离线资产)生命周期管理, 资产报废、维修、配置变更提醒等。
    •告知事件对企业影响的严重程度。
    •准确、快速地定位故障产生的根本原因。
    •提供统计报告和分析图表,为领导层提供决策依据。
3.2功能描述
    在国华电力的项目中,我们实现了以下功能。
3.2.1从业务视角管理IT
    国华电力的业务系统通常由以下几个组件组成:
    •网络
    •主机
    •应用
    •用户
    当某个组件出现问题,问题就会反映在业务服务仪表盘上,用户(包括业务部门)只关心提供给他们所使用的业务服务的状态与性能,而不关心技术细节。
    通过服务仪表盘,国华电力信息管理部门可以随时了解到:
    •业务服务运行状态
    •KPI指标(平均无故障时间MTBF、平均恢复时间MTTR)
    •各服务组件之间的依赖关系
    •故障对于服务的影响
3.2.2以用户的身份感受IT服务
    国华电力信息化建设为遍布全国的二十多个电厂业务支撑体系提供了大量的业务系统,从用户体验的角度出发,严格审查业务系统的可用成都,通过模拟用户行为,对业务支撑系统的业务流程进行监测,从应用的层面监控业务支撑系统的可用性。
3.2.3三步走式的故障分析策略
    国华电力目前针对全国二十个电厂提供的业务支撑系统复杂度相对较高,在出现异常情况时往往在初步的故障分析中就浪费了大量的时间,为此,国华电力信息管理中心提出了“三步走”式的监控机制,当出现故障时通过图形化的展示界面即可快速定位到故障点。
    第一步:排除周边影响因素。即当故障时首先通过自动监控机制判断该业务系统主机的网络连接情况、业务系统首页打开情况、Web访问的端口情况等,将网络、主机、业务表现三个因素综合进行初步故障分析。
    第二步:查清平台级影响因素。即在周边条件均正常时,通过自动监控机制提供各个应用平台级底层指标的性能负载及资源消耗情况,主要体现在对一些中间件、数据库、J2EE应用平台等IT资源中,实现业务应用平台级的故障分析。
    第三步:由于在国华电力业务支撑体系中存在大量自行开发的应用程序,对这些程序的执行效率监控就形成了故障分析的法宝,通过自动化的日志监控机制将程序执行过程中的异常抛出按照关键字以及日志级别等方式进行过滤,使运维人员不在因错失日志而无法解决问题。
3.2.4网络设备监控及拓扑展现
    实现对骨干网络的可用性和性能监控,监控范围包含CISCO、华为3Com等90余台设备。通过对网络设备的监控,管理员可以实时掌握设备的CPU利用率、内存利用率、吞吐量等关键性能指标,以及设备的每个网络接口的流量信息。
    通过自动发现以及自定义的网络拓扑图,管理员可以实时的查看到全网所有网络设备的当前状态以及各骨干线路的流量情况。一旦某台设备出现了问题,都会及时的通过状态灯颜色的变化展现出来。
    同时,为国华电力提供了分布全国二十个电厂的机房健康状态监控,以拓扑下钻的机制,实现从面到点的监控手段。
当出现网络故障后更直观的以Flash的方式将设备背板进行展现,方便管理员的操作。
3.2.5主机系统监控
    对全国范围内主要信息系统所在主机监控,包括AIX、SUSE Linux、Windows等设备150余台,每台主机均提供了VM可视化监控方式。
3.2.6应用环境健康状态监控
    对全国范围内主要应用平台进行监控,包括Domino、oracle、sybase、informix等在内的200余套应用平台进行监控,KoolPoint集成了摩卡软件十年系统管理、开发、维护经验,提供最具管理价值的指标,细化到每一个应用元素的监控,单每一个Domino平台提供系统平台级指标10余个,Domino平台级指标20余个,数据库级指标30余个,代替管理员处理繁杂的日常维护和检查工作,以自动化的方式将应用进行监管,实现应用平台级故障预警、性能预警、配置变更预警等功能。
3.2.7        IT资产管理
    实现了对国华电力大楼内700余台个人电脑、90余台打印机等IT资产的生命周期管理。管理员可以在线对资产进行查询和管理,此外还提供对其他离线资产的监管,例如扫描仪、UPS电源、系统软件、应用软件等。系统提供按照时间、生命周期状态、关键字等查询后即刻生成报表,可以为管理员的采购计划提供指导性数据。
    资产管理还提供了设备服务到期提醒功能,当某台设备的服务合同将要到期时管理员可以接收到报警信息,通知管理人员及时签订新的服务合同。
针对于该行业特殊需求,通常设备在购进五年后即报废,系统还提供多种可定制的提醒功能,避免大量设备在送修或进入报废阶段不易管理等,提供人性化的定制和提醒功能。
3.2.7流量分析
    对网络的核心设备进行流量监控,可以清楚的了解到全网的流量情况,网络管理者可以第一时间获得用户利用网络和应用资源的详细情况,进而用于高效地规划和分配资源,保证网络的畅通。从而帮助国华电力解决“到底是谁或者应用在使用网络带宽?什么样的业务和应用占据了企业的大部分带宽?到底是什么样的网络协议在网络中运行?在什么样的时段,企业的业务是处于最高峰的?整个网络是否能承载现有的业务?如果网络出现问题,到底是哪里出现了问题?什么样的业务受到的危害最大?”等诸多问题,提升网管人员对网络状态的控制程度。
    也可通过关注的网络设备的接口信息,查看某个端口的详细信息(会话信息、来源、目的、应用)。
3.2.8配置变更管理
    提供了主机、网络设备、应用的配置变更管理,通过设定基线,一旦IT组件发生了配置变更,管理员可以收到告警信息,并对每一项变更进行风险评估,以确保所有的配置变更都是在可控范围之内。
    KoolPoint配置变更事件全面记录已经发生的配置变更,用户只需定制相应的事件视图,即可按资源、时间段等条件过滤出所需查看的配置变更。资源状态可将配置变更清晰的标明在每个资源名称前,所有的配置变更尽收用户眼底。同时,用户可灵活定制接收配置变更报警的角色与人员,并可通过邮件、短信、语音(通过自动拨打用户电话报警)、KoolPoint Alert(可即时接收KoolPoint报警的桌面软件,简单易用并可设置接收报警的种类,报警音乐等,以帮助客户快速响应)等多种报警方式,确保配置变更自动通知到所有相关人员。
    除此之外,用户还可对一组配置变更记录打上基线,以表示这组变更后达到了一个稳定状态或里程碑(例如,完成了某服务器的全面升级)。配置变更记录不再是单纯以时间做简单排序,而是以基线为组织,使用户可以更条理化的管理变更。
3.2.9报警管理
    •灵活的报警定义,满足各种业务需求
        管理人员可以根据监控需要,定义故障事件是否触发报警、发送给哪个角色或人员、以及发送的时间段。
    •多种报警方式
        用户可设置多种报警方式,当事故发生时,不仅以传统方式邮件方式通知用户,还可通过短信、语音(自动拨打用户电话报警)、桌面告警(KoolPoint Alert)等多种报警方式,全面及时的通知用户。
    •支持报警升级
        在一定时间段内,事故仍没有解决,升级到更高层次用户,自动寻求更强的解决力度 例如,数据库服务器不可用时,报警至数据库管理员,但24小时后数据库仍未恢复 使用,可报警升级至领导层。领导可调集更多资源,加大解决力度,从而迅速排解事故。
3.2.10报表和报告管理
    •可定制报表模板
        按照国华电力特有的报告需求,我们提供KoolPoint Report,支持报告模板的自定义,帮助企业定制符合企业特色的报告模板。
     •“所见即所得”的报告
        订阅报告 —— 灵活选择监控资源、报告发送时间、发送格式、发送方式,实现所见即所得的报告模板定义,定时将报告发送至相关负责人,为IT部门领导提供分析和规划数据。
    •多种专家级的报告模板
        KoolPoint还支持多种专家级的报告模板,包括资源对比报表、可用性报表、故障报表、趋势报表、统计报表和TopN排名报表,为IT运维提供全面的数据分析。
    •报表和报告订阅
        KoolPoint可以帮助系统管理员自动生成运维报告。用户可以根据自己的需要,按照周、月、季度、年订阅自己关心的运维报告,订阅的报告会按时通过邮件等方式发送给系统管理员。KoolPoint提供了丰富的报告模板,包括主机模板,网络设备模板,应用模板等各种模板。
另外,KoolPoint提供了定制报告模板功能,可以定制完全满足用户运维需要的报告模板。
3.2.11        IT运维管理
    KoolPoint的IT运维管理是基于ITIL的流程框架,帮助国华电力从人员、技术和流程三个方面提高了IT运维能力,逐步建立并完善、达到以下目标:
    •标准化——通过ITIL的流程框架,构建最佳实践经验的IT运维流程。
    •流程化——把大部分的IT运维工作流程化,确保这些工作都可重复,确保这些工作都能有质量完成。
    •自动化——替企业有效无误地完成一些日常工作,比如备份,杀毒等。

4.技术架构
    KoolPoint在国华电力的实施采用分布式部署,在总部安装KoolPoint CMS(Central Monitor Server)和DCH(Data Collection Hub)组件,在其遍布全国的二十个电厂等分支机构安装DMS(Distributed Monitor Server)组件,以此实现对监控数量上的限制并以先进的组织架构实现穿透防火墙式的IT资源监控。
    KoolPoint采用了先进的架构设计,管理平台与用户Portal界面集成展示,自动识别用户身份,控制用户视图权限、资源权限,系统提供的所有功能均采用B/S结构进行管理,免除了繁杂的C/S客户端式设计。采用分布式架构部署,扩展监控数量,提供穿透防火墙功能。采用了先进的数据采集机制,对网络压力减小到最低,同时以Agent方式进行采集的性能保持在CPU使用0.5%以下,内存使用量10M以下。
5.运行环境
    国华电力监控系统部署:
    •一台Windows 2003 Server服务器:运行KoolPoint Portal应用服务器,部署KoolPoint CMS,数据库服务器,存储KoolPoint的监控数据。
    •20台Windows 2003 Server服务器:分布在各个地市,部署KoolPoint DCH以及DMS,负责数据采集及上传工作。
    •在被监控的应用系统UNIX主机和Windows主机上分别部署KoolPoint的代理程序,代理程序负责监控系统、获取各项数据。
    用户端
    •操作系统:Windows 2000、Windows XP、Windows 2003
    •硬件配置:CPU 主频200MHz 以上、内存128M以上、硬盘300M 以上
    •浏览器:IE 6.0 以上

6.方案亮点
    国华电力采用KoolPoint产品作为IT资源监控的解决方案。该方案解决了客户在实际工作中所面对的IT服务问题,该系统主要亮点如下:
    •打破传统监控瓶颈,从业务入手的监控机制。
    •从用户的角度体验IT服务。
    •形成“三步走”式的故障分析机制。
    •实时监控网络设备、主机、应用等IT资源的运行状态、性能和可用性。
    •当监测到系统故障时,快速定位故障的主要原因,估算系统事件对业务的影响及其严重程度,并触发相应的故障处理流程。
    •系统监控与流程处理与IT资产管理的整合,当监控到资源出现硬件配置变更后经过管理员的手工复位可以同步到资产管理中,如果通过流程进行设备的申购、领用等也可以同步到资产管理中,自动改变资产生命周期状态。对IT资产的人性化定制提醒功能,可以避免在大量设备送修或维保即将到期或设备即将报废时以多种方式对管理员进行提醒。
    •简单操作的系统管理配置,方便地配置所监控服务器的信息,应用数据自动获取。
    •通过门户系统可以进行统一整合,实现单点登录SSO、统一授权和访问控制、集成展现和个性化等功能,使系统各模块之间实现无缝的协同工作,给IT服务经理、系统管理员、应用管理员等不同的用户群体和角色提供了可视化的工作平台。
    •提供了丰富的报表,提供了统计报告,提供了资源或指标走势,用以辅助分析和决策,并可以以日报、周报、月报等方式定期发送用户所关注的资源历史信息报告。


7.联系我们
摩卡软件有限公司
地址:北京市海淀区学清路8号科技财富中心B座2层
邮政编码:100192
联系电话:400-812-8155
传真:(8622)87341661





上一篇:E8推出IT运维管理软件迷你版,价格仅需69800
下一篇:大家认为:it运维自动化的稳定性怎么样?现在技术成熟么?
koolpoint

写了  篇文章,拥有财富 ,被  人关注

您需要登录后才可以回帖 登录 | 立即注册
B Color Link Quote Code Smilies
daisy8 发表于 2012-9-26 16:21:15
kokotiger 该用户已被删除
kokotiger 发表于 2012-10-8 12:47:52
提示: 作者被禁止或删除 内容自动屏蔽
jemball 发表于 2013-6-10 17:25:43
魔卡也来了
手机版|小黑屋|最新100贴|论坛版块|ITIL先锋论坛 |粤ICP备11099876号|网站地图
Powered by Discuz! X3.4 Licensed  © 2001-2017 Comsenz Inc.
返回顶部