请选择 进入手机版 | 继续访问电脑版

ITIL,DevOps,ITSS,ITSM,IT运维管理-ITIL先锋论坛

 找回密码
 微信、QQ、手机号一键注册

扫描二维码登录本站

QQ登录

只需一步,快速开始

查看: 1190|回复: 0

关于银行业智能化运维建设思考

[复制链接]
发表于 2020-3-9 16:03:42 | 显示全部楼层 |阅读模式
本帖最后由 adminlily 于 2020-3-9 16:05 编辑
; X# \- l+ C$ E$ L. r: b; Q7 A4 b+ l5 T/ t
一、现状:银行运维工具已实现技术条线全覆盖,但基于运维管理的全流程自动化、智能化尚停留在研讨阶段

8 M: w$ F, B. R$ ~' S

) R1 ]; Q+ m* w
根据银监会编制的《中国银行业信息科技“十三五”发展规划监管指导意见》,其中“第九章 第三节 提高运维自动化水平,打造智能化运维体系”中明确提出对运维自动化智能化的指导意见:

2 `  e# {( y3 A7 k% {/ f4 ?! [
提高基础资源和应用部署的自动化水平,实现快速交付、动态调整、弹性部署,降低人工操作风险,自动化部署比例不低于75%。

4 {4 I- @$ ]" z
持续推进生产运维监控精细化、自动化、智能化建设,强化系统风险和故障的早预警、早定位和早处置。
0 r( `/ ~' i8 Y9 O
实现应用层面交易全流程、全节点监控全覆盖,结合应用系统交易特性及相关数据的分析对比,提升交易过程监控的智能化水平。强化容量管理,做好相关资源的动态规划,预防非计划性、突发性的容量瓶颈问题发生。

- Y6 X: S5 b% Z6 f1 a
强化运维、开发、安全、风险管理的信息共享和一体化协作,提升多方联动能力。加强运维大数据分析,利用运维大数据加强业务风险防控,探索利用运维大数据推动业务流程优化并支持业务创新。”

. ~6 t" d' a0 p" D  n! b2 q, Q4 v
—— 摘录自《中国银行业信息科技“十三五”发展规划监管指导意见》
* I: N* q1 x8 }) n
——汪曾祺
2 N& |! v+ @9 {8 A( |
在运维建设较前的银行业及互联网企业的建设经验中,平台化和智能化已成为运维体系发展的大趋势。以阿里经验为例,将运维发展分为五个阶段,分别为L1-脚本运维、L2-工具化运维、L3-平台化运维、L4-数据化运维、L5-智能运维。随着运维管理手段的推陈出新,逐渐地提升“系统”在执行和决策环节中的比重,从而不断降低人工参与度,如下图:
$ z4 o6 C0 k  u  t0 {
7 P; D/ p6 @8 x1 s6 H; y! n
在工具化运维阶段,传统运维建设模式基本以烟囱式为主,每个烟囱只为了解决单一的运维场景,如应用发布、系统监控、数据提取等。
- u% g2 J! c2 K4 ~2 a. z
随着新技术不断在信息化建设中应用,带来了操作单元海量化、版本更新频繁化、监控粒度细致化等问题,烟囱式的建设模式已经难以满足运维发展的要求。

$ ~7 l! j& O+ f* E& O( r8 |/ r
随之而来,各个企业开始向着平台化、一体化的方向发展。如腾讯公司的思路是采用SOA和PaaS的技术架构模式,在PaaS内将各能力封装成各类原子平台并自动化,如配置平台(CMDB)、作业平台、容器平台、数据平台(AI)等,而后通过任务引擎将分散在个原子平台的功能,根据不同的场景重新连接成“串”或者“树状分支结构”实现全自动化、智能化。
7 U; N2 [, Q6 Z2 S) T
目前大多数银行的数据中心经过多年建设,尚处于从“工具化”向“平台化”过渡阶段,已经建立较为全面的IT架构基础平台,监控与流程均有一定的建设。如统一配置管理(HP UCMDB、Remady CMDB)、监控系统(zabbix、HP OVO)、流程管理(BMC Remedy)、自动化控制(HP SA、BMC Bladelogic)……等。

8 u7 B2 V: L8 p" a
IT运维管理建设多采用产品采购模式,但随着积累的运维工具数量持续累加,繁杂的烟囱式应用使运维效率难以继续提升,其主要体现在以下几个方面:
, }: D/ U/ N9 M9 C$ q* P! o0 [
系统故障定位时间长,无法达到精准化报警,难以快速解决问题。
" {" ]% p8 l5 }5 T- c
难以评估系统当前和未来对资源的需求,以及资源分配的合理性。
% g- g& V) H# {  x6 V3 m
运维数据普遍存在分散、标准规范不统一、数据使用不规范等问题。

. K) A1 L; b% f

: e/ A# ~& {3 S2 d5 P* [3 c# h
二、IT运维自动化、智能化的转型升级之路
. X& Q$ b/ o- a/ b1 D, A
; A. l- V% K; S' J% q3 i1 i
随着云计算、微服务在企业信息化建设中的大量应用,IT运维岗位正在从资源管理向应用运维、从运维保障向业务运营、从低价值劳动向高附加值服务转型发展。
; T% y: A9 _& ^  K9 ]
而在这个过程中,运维平台化和运维数据化的建设至关重要。

. `- B$ [! V- M+ d& l. T
一定要充分利用数据,这里的数据指的是运维数据,如性能监控数据、运行日志数据、变更操作记录等等,尽可能的接入更多的种类的数据。

" y" Y0 y" X1 t1 j
利用这些数据,通过大数据和机器学习的技术,实现业务系统精准建设、系统资源精准配置、风险隐患精准控制,最终促进降本增效的目标。
8 m" _3 I& @6 X; L) |; Z! g" [
由于目前银行中运维管理建设还采用传统分散建设,各种烟囱式的系统之间数据存在数据重复、数据割裂、数据不准等问题,为运维数据化建设带来了极大的困难,具体体现在如下几个方面:
5 X& E" b# W' v4 I4 q5 h
系统间信息不能共享,难以形成整体,缺乏效率难题持续提升。
+ V5 K6 h+ L' m( J) y
由于信息和功能不能共享,须在多系统内重复建设基础功能和数据。
1 c+ q1 v3 h7 D/ ?$ _: c
场景覆盖面不足,现有功能点无法跨多个系统进行场景式的编排。

( H) ?) R9 ?2 R6 U
为了解决分散的烟囱模式给运维管理建设过程中的问题,尽快实现平台化和数据化的目标,急需通过顶层设计,实现有效整合,建立一体化的综合管理平台,实现数据集中存储,统一分析,集中展示,高效处置。
0 m( f/ _4 r) `5 J7 |9 K, g6 `/ G
参考腾讯、阿里顶级互联网公司的建设经验,建设“平台层”来整合各烟囱式运维应用的功能和数据,从而构建一体化运维综合管理平台。基于一体化的运维平台建设遵循原则如下:
' `" h& Q8 l3 A4 Q6 P) `
1)   一体化平台:采用“平台+应用”的建设模式。

$ ~0 J' `& t" w
2)   功能全覆盖:构建监、管、控于一体的运维管理。
$ ?7 z; l+ }# n. b2 N
3)   自主可控:通过平台的模式将运维开发的能力交付给用户。
4 l  I' J0 ^+ G7 }& b; n/ h% C- W
4)   先进技术架构:构建一套高可用、高性能安全运行系统。

% g2 j. {$ C6 N; ^' S, q" x
基于上述原则,规划一体化平台如下图所示:

" ]& Y2 O9 R% Q8 z
①  服务层面向用户、管理者、维护人员输出友好、便捷、高效的IT服务。
3 o; R" B/ c; N0 R# S  Y
面向用户提供更多的自助式服务。
3 P1 I" a/ p3 f! |2 f0 x
面向管理者提供灵活的可视化服务。
9 z2 u  }3 K- }; C# l+ |* d1 w' f" \
面向维护人员提供丰富的自动化服务。
/ D1 }2 \, N: k3 b
②   平台层是关键,通过平台层将新旧能力层系统整合在一起,产生联动效益。
! c8 P# F# S3 u6 u+ W! ~. Q
构建统一的API服务网关和调度编排引擎,将能力层的各种能力对接到平台层。
0 r# s4 d3 V) `4 y* {9 c$ S) ?2 ^0 q) v
构建统一门户、4A集成、工具市场等易用模块,增强运维管理一体化能力。

/ W+ F7 p# {) D6 M- q
构建工具开发框架和运行托管环境,简化工具建设成本。

0 r) ]3 o+ [7 p$ \3 R
③   能力层包括过往已有的运维管理系统,以及未来继续扩展的管理系统。
5 Y/ I; g  L2 k, n( o
随着技术的发展,需要补充运维大数据平台、人工智能(AI)平台、容器管理等。
4 H/ I  D. S/ S+ _6 y0 R" y8 e
已建成的功能模块需要持续优化和更新,适应新业务、新技术、新管理的要求。
7 U6 f, ]' ^: h9 n# H! \, G) F
④   采控层是在最底层规划建设的统一采控通道,从底层保证数据一致性和准确性。

% g! S' d5 R2 e8 `

( {' x, g6 u4 s& T% ~. g8 Z: k
运维管理建设是一个长期的过程,不能追求一蹴而就,需要分阶段稳步实现。参考运维技术的发展过程以及先进单位或互联网公司,演进路径大致如下:
2 G7 f/ I$ g# A8 e* p
平台化:利用PaaS技术实现平台层,建设一体化平台的基础框架。并在平台层中将现已有的运维管理系统集成起来,从而实现一体化平台的基础框架。初期在平台层之上开发3~5个运维管理工具,作为整合型运维管理工具的试点场景,并持续不断的组装工具以满足运维管理的方方面面。
4 e/ a" F# g; W+ w& O* Q
数据化:在能力层内建设运维大数据能力,将散落在各运维管理系统的数据归集起来,形成运维数据仓库。继而在实际的运维管理工作中,探索数据挖掘场景,利用大数据计算和分析能力辅助管理决策,实现初阶AIOPS场景。

4 q& d- G1 v3 E" K$ E0 _
智能化:正式将人工智能(AI)应用于运维管理中的工作场景中,利用上一阶段积累的数据样本和决策模型,通过机器学习手段解决提升“AI”在管理决策中的占比,实现根因定位、容量预测等高阶AIOPS场景。

; d1 H  {; A5 r% x/ }' D
然而运维大数据技术经过近年的快速发展,相关技术的应用已经基本成熟,根据银行业的现实状况,可以在首期项目中就实现“运维大数据的归集”和“大数据应用场景的探索”,从而形成“两步走”的建设思路:

3 K1 i: X9 a! F! T9 t
“如何利用智能化手段提升运维管理”的研究浪潮已经掀起,部分互联网和银行已经进行了部分尝试并取得了一些效果。顺应时代发展趋势,展开智能化探索,才能主动赢得运维管理的未来。

9 C8 L& r- a4 Q# F$ g5 q/ ^
- d3 w. j" f2 O4 B8 |  G" B

3 L# `; @, G' [  M




上一篇:运维转型 | 运维人不再只是“救火英雄”
下一篇:8个让DevOps转型取得成功的关键步骤

本版积分规则

参加 ITIL 4 基础和中级专家认证、v3专家升级、DevOps专家认证、ITSS服务经理认证报名
本站关键字: ITIL| ITSM| ISO20000| ITIL培训| ITIL认证| ITIL考试| ITSS| ITSS培训| ITSS认证| IT运维管理| DevOps| DevOps培训| DevOps认证| itop| itil4| sre| 开源ITSM软件

QQ|小黑屋|手机版|Archiver|艾拓先锋网 ( 粤ICP备11099876号-1 )|网站地图

Baidu

GMT+8, 2021-5-7 03:02 , Processed in 0.160673 second(s), 30 queries .

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表