1.用户介绍
湖北省XX电力公司属特大型国有企业,是省域经济赖以发展的重要企业,对省内电力市场实行输配售一体化经营,负责建设、管理、经营除三峡输变电工程和省间联络线以外的省内电网,经销相应的电力电量,并负责运作省级电力市场,是省内电力市场的骨干企业和主导力量,直接为地方经济发展和人民生活提供电力保障,直接为省内发电企业电力生产提供接入电网和经销电量服务。湖北省XX电力公司直属单位27个,直供直管县级供电企业69个,代管县级供电企业15个。公司用电客户1550万户,专变客户14.4万户,居民客户1418.3万户,总营业户数居全国前列。
2.案例背景
湖北XX电力公司原电力营销系统于2000年投入使用,该系统使用传统的C/S架构,分散的部署在各地市电力公司。2009年在国家电网公司统一规划下,启用了新一代的电力营销系统,该系统使用目前流行的B/S多层体系架构,集中部署在省公司数据中心。基于省集中模式的新电力营销系统的上线为湖北XX电力公司实施规范、统一和集中电力营销管理奠定了坚实技术基础,同时也给电力营销系统监控和运维带来了许多新的挑战:
系统运行风险在集中
随着电力营销数据集中和应用集中,任何一起系统故障的影响面都可能波及到全省,而在原来以地市为单位分散部署的情况下系统故障影响面可控制在地市之内,因此系统风险更集中了。
系统监控难度在加大
首先,相比传统的C/S技术架构,监控对象范围更宽了,在多层技术架构下监控对象除了网络、主机和数据库外,还包括了负载均衡、应用服务器和其他各种组件。
其次,在多层技术架构下,同样一个业务应用往往穿越多个资源层面,使得故障原因的诊断变得更为复杂,系统恢复时间可能变得更长。
系统可用性要求更苛刻
首先,在省集中模式下,系统容纳的用电客户和使用终端数目呈现爆发性增长,对系统负载能力要求更高。例如一个省级集中的电力营销系统通常有上千万级用电客户和上万个使用终端,系统性能的下降将大面积地影响业务人员工作效率和客户满意度。
其次,随着网上营业厅、自助缴费终端等新型自助业务的推出,系统用户访问模式正变得越来越不确定,通常需要系统7*24小时不间断运行,以满足客户“随时随地”的服务请求。
对客户体验监控更迫切
通常对IT系统监控一般都局限在网络、主机、数据库和中间件等资源资源层面的监控,使IT部门无法从客户角度来感受系统,如收费业务响应时间是多少?不同城市不同营业厅响应时间是否存在差异?了解这些客户体验监控结果对系统优化和提高客户满意度来说是非常重要的,特别在省集中模式下,可以说运维部门离客户的距离更“远”了,通过技术手段对客户体验进行监控也就显得更为迫切。
系统运维管理模式需变革
随著营销数据中心向省集中,原有的以地市为中心的运维管理模式急需变革,在管理职责划分、运维人员配备、故障响应流程等方面都需要重新梳理,以建立与省集中模式相适应的集中监控、集中管理和集中维护的全新运维管理体系。
3.解决方案
华汇数据SAMP系统在湖北XX电力公司正式上线后,逐步解决了电力营销系统运维面临的各种问题,具体如下:
湖北XX电力营销系统使用到的主要IT基础设备包括:核心数据库小型机4台、应用服务器20台、电能量前置机4台、银行前置机4台、95598呼叫中心服务器60台、Oracle数据库实例8个、Weblogic实例24个、Tuxedo实例5个、核心交换机4台、存储交换机2台、防火墙4台、负载均衡器2台、磁盘阵列3台;应用软件包括:RHCS集群、CRS集群、VCS集群、数据库备份软件、数据库复制软件等。
华汇数据SAMP对湖北电力营销系统使用到的IT资源和应用系统实现了全面的监控。SAMP在创建监控对象的时候,可以根据IT资源的相互关联关系建立依赖关系,在生产数据库和HP小型机以及核心三层交换机之间通过SAMP创建了依赖关系,当IT资源出现故障的时候,SAMP会根据依赖关系来进行分析,准确定位故障位置,并能够根据依赖关系屏蔽非关键告警,防止告警风暴的产生。