请选择 进入手机版 | 继续访问电脑版

IT运维管理,ITIL,ITSS,ITSM,ISO20000-ITIL先锋论坛

 找回密码
 微信、QQ、手机号一键注册

扫描二维码登录本站

QQ登录

只需一步,快速开始

艾拓先锋
搜索
查看: 661|回复: 0

运维自动化的定义就是数据-事件-流程

[复制链接]
来自- 广东广州

参加活动:0

组织活动:12

发表于 2017-9-13 11:40:30 | 显示全部楼层 |阅读模式 来自- 广东广州
本帖最后由 monicazhang 于 2018-8-27 11:07 编辑 2 \  e8 S4 a" b! K$ K

/ X8 K# v- B: J3 B: z

随着互联网发展迅猛,不同的公司IT基础设施面临的增长和快速发展。从人肉维护,建设到半自动,全自动,由此产生的自动化体系/运维工具越来越多,目前大多数运维IT环境架构主要分为3种技术体系:


/ c# U* U* H0 N4 Z* u8 h0 D- e

1)开源工具

- U; L8 H- U, w9 `


. t$ ]6 x9 S4 k0 l2 S% M

2)自研发工具(更多的是包含和利用开源软件优秀的特性进行定制化开发)

- r, r1 r1 _4 a: k2 e  A+ q  ^

; x" |- m; n8 H9 \

3)从0自主研发,底层改造到应用层开发

+ o3 I1 \/ g" U: {. B' g

, k$ {$ N5 c) h  \
0 E- |& W2 x- V# j9 W' X$ I" _

开源的代表作有很多,比如:puppet,saltstack,Ansible,nagioszabbix,Docker,KVM,Openstack等主流开源软件。

自研:资产管理系统,发布系统,监控系统,配管系统,工单系统等。


4 u. c$ Y& b6 ~0 @) T  n4 p

总结:运维自动化已经是成熟的代名词了,无论从网上搜索,还是各大技术分享,都有很多不错的案例和实施过程。但也很多朋友觉得实施起来很困难,复杂,但是看似很简单。困难和复杂:想不通如何把重复性,不可规整/聚合,业务连接成一线枢纽。看似简单:因为有人/其他互联网运维团队实施出来了,实现的还不错,看似近在迟尺。先定义后实施,这个是关键点,想明白才去做,没想明白千万别去做,否则只有推翻重来或者坑越来越多。


+ k$ ~6 }7 n4 n& {1 O0 \  n

定义分为三个层面:1.数据的定义2.事件的定义3.流程的定义

9 k- w7 j. i" w# O; n9 O* N" v  I

; {# }7 }* Y4 B* s6 {

# M. {" @& L$ \! t4 G' W

1.数据的定义:


5 m- I, j4 n2 X# N, U+ z/ h) M- J$ g2 c" z
% L# r; x; o3 B4 j1 v8 Q/ _
# d3 K$ `4 L9 |  h5 ^9 \0 F$ T

一切的基石基于数据,第一步数据的纬度要设计好:

; P( X! M( }3 P1 E; R; b9 j

①.机房的定义:比如北京机房,上海机房,香港机房等

" k  [8 ?" e  y: w' |* O

②.机器类型定义:私有云,公有云,物理机,公有云:ali,aws等细化纬度。


2 u* ?0 e4 Y$ m6 Y

③.业务定义:比如官网业务,订单业务等纬度细化。


) W' c4 Z; Y$ m% Y* M* T# K

④.存储的定义:比如根据自家公司的业务和技术体系来设计:

" F( D2 r$ K/ o' r

比如哪些基础信息是需要的,哪些信息看似可要/可不要的,要做好取舍。


! G" m7 k: F# e, Z0 s, g

数据存储的信息一定要是展现出来有实际意义的,数据存储不在于多,而是在于价值,繁重的数据越来越多,如果定义很多可有/可无的数据存储,对于一个IT基础资产库来说,也是种负担。

6 g* \' I, r4 d. R" Q

数据的存储考量:唯一的,有价值的,可维护,可扩展的四个原则。


" c8 b$ |' r2 J; e

⑤.协同的定义:当拥有一份完整的IT基础资产库的时候,只是一份基石,基石铺垫好了,才有上升的扩建空间,数据的标准接入协同分为二部分:


, X9 f$ }* P3 [" _( Q5 q

1)内部的系统/资源(运维内部的系统)


+ e# m/ m5 @  H5 J: Z$ T

2)外部的系统/资源  (业务,安全的系统)

& h  o  a* o8 b7 ^

内部系统/资源和外部系统/资源对资产信息库的对接关系策略纬度:

- y# Y; V' R6 b) a9 Y/ @- l6 j7 `

1.可增加/删除的,初始化类型数据系统/可移除的资源数据系统,比如:自动化装机系统

% V7 L0 N# I/ C

2.可获取的,获取的信息纬度哪些类型,比如:发布系统,监控系统(拿到资产信息库的业务类型,组,主机/IP信息等。


% G; a: D* I% |; L, u

3.可查询的,单条件查询,多条件查询,连同条件查询,比如:安全审计系统,业务类型系统,对外/对内访问IP区分等。

# U3 c  d9 h4 p8 H) G7 _& Y" N8 A; B

( M4 D/ N7 N, T8 j" L% j$ U

2.事件的定义:

' Q* H  v2 f# x& N% F" C
0 }8 Y/ Q- g! J$ z/ k

4 t4 m8 l! p" @
/ c/ b- o% G3 e! Z

第一要点的数据定义已经设计好,有了完整规范的数据格式,来定义围绕基础信息库基石上扩展事件。

# u  N3 T; q- J) M3 E( Y

事件定义的逻辑方法论:事件设计-事件构建-事件交付-事件数据汇总


/ U% ?, C; E2 w$ C1 F

每个自动化操作都依据某个事件场景来实施,实施的策略很多,也需要平衡好优缺点。

, R  t% [6 N% i" E  {0 V. }4 r7 h7 K/ i


8 H& v  V$ q4 B$ B' T! |

1)数据的初始化录入系统,俗称:自动化装机系统


6 y% v0 n+ h: L9 B; G


, W. K  B1 i2 m" @% K, e$ s6 K

自动化装机系统初衷:

( S2 ^1 B6 r4 G9 k& ]

1.需要人工重复性操作


; R+ Y; R# q. M' _6 t

2.快速交付时间周期慢

- f) E3 E" n/ U4 z$ B0 t5 e" `

3.技术提升优势不大

; H0 q. i& e7 c; p$ n/ E3 ^

4.用事件根据场景来优化

# k' t; [$ Z1 q7 o- Q8 y, O

2 F1 i: W! B9 K

自动化装机系统交付要点(根据不同主机类型来构建事件场景):


' `3 e7 h8 v2 y5 a

1.物理机类型(硬件层面:不同硬件厂商的类型,比如远程卡,BIOS初始化,RAID阵列自动划分,软件层面:cobbler)

9 w2 @( {* b; v2 C5 L3 G. z

2.公有云类型  (服务商的Api或者SDK接口)


0 T. x2 A2 S# X% `

3.私有云类型 (Openstack,Docker,KVM私有云规范的Api接口或者自己构造一份标准的接口).


3 g& _" a7 P% D4 q. {+ [' T: m/ @) V" o% \

4.从类型选择初始化配置-内部DNS数据接入-获取主机信息资源-启动新主机。


" V& Z6 S9 u( r0 r+ [0 S3 o

5.数据完整保存,方便以后分析和进一步优化。比如:成本的使用/扩展,业务方机器资源使用率,分析对该事件场景构建优化提升之处。


: i: O* u$ h* ]9 e4 c" c


! X/ @5 L! h" V; b! P

发布系统,运维日常支持工作占到百分之50%或者更多。代码发布也是运维考核的和支持最重要的一项日常工作。

- u! S3 Z: V# \5 ^8 U# t; @

发布环境常用的包含:local,beta,demo,gray,online等

% z% @7 [' Z7 P1 k

发布的代码类型:混合型居多。

' |7 W2 C7 P. y$ n9 z

通常情况下,人肉支撑的耗时,重复性,自检成功/失败发布,排查故障周期很长。尤其是对于重要业务平滑,耗时的情况更多。

而发布系统满足重要的三个因素:

4 R, f& v) }) W$ d4 c7 f% q: y$ z

1.自动无损平滑发布(支持多种负载均衡策略,发布代码不重启服务策略,环境组主机流量自动切换)和可视化实时过程/结果查看。

, I( e; i2 Y) ]0 c" w3 z8 [. W

2.稳定,并行的构造多环境/多业务发布,即使某个业务出问题,对于整个发布平台/其他业务发布也是无感知,无影响。


/ @8 E( I9 |- I/ T3 h

3.权限,安全隔离,完整的审计功能,让研发自助的发布。


# r6 }1 D( n" `" P8 j" T; B

4.数据的完整保存,分析目前业务发布测试/迭代,资源调度率,发布时间点,全年发布优化指标等。

) l6 M, D" }8 ^7 X: `! _

总结:以上就举2个事件场景构建的案例,一切事件构建皆为场景,场景的价值在于数据是否帮助/量化,改进业务层面/运维层面的持续增长/交付。

7 ?$ G& j/ o+ a( B: i9 d


8 P; E/ g* ?2 f; A

3.流程的定义(一切入口,规范,从流程抓起)


' e5 D' t" s2 r- f* N
$ M! {+ S& y( {8 d2 F  h+ d; q
  s1 K# I4 Z. f7 o$ p- N4 Y" V1 C5 t

为什么最后才是流程,因为在没有数据做基础铺垫,事件场景构建,一切谈流程都是空话,虚拟的。


2 S' @1 N, V6 m5 D( B0 @0 h! n

流程基于实施的要素:


( K' s6 [4 f& T9 _# x  f: P

1)基于一切数据+事件的入口配置


% M/ i2 ?. C  D0 \) F

2)流程不在于复杂,在于易用,快捷,可塑造。


# x8 O3 q0 V: b# H1 v

3)源地址-目的地址全部过程保存,可追踪。

' A3 }7 H5 M$ A6 {% i3 Q

9 R* ~+ f# R- u7 p/ K( p

自动化价值:

) S3 T# U: k& v1 k5 i/ X

1)价值性产出:站在业务/团队角度去思考,不追从完美产品方案,只选择合适的产品方案,同时在一定程度上做好取舍。

7 E1 W$ V4 m5 x& w5 G- T

2)从小而做到细,从细扩展到大,才是本质。


' ^. _/ t- {! }* X) p" Q

3)  自动化产出一切为数据,对数据定义要设计好,宁愿设计周期长些,也不要盲目实施。


: J) Y! N% Q9 p; h: a

原创:符杰超

  G5 R+ s6 p1 M" R

本版积分规则

选择云运维时代的王牌讲师-长河老师,助你轻松入门ITIL Foundation培训课程

QQ|小黑屋|手机版|Archiver|艾拓先锋网 ( 粤ICP备11099876号-1|网站地图

Baidu

GMT+8, 2018-12-13 07:55 , Processed in 0.207271 second(s), 30 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表