请选择 进入手机版 | 继续访问电脑版

IT运维管理,ITIL,ITSS,ITSM,ISO20000-ITIL先锋论坛

 找回密码
 微信、QQ、手机号一键注册

扫描二维码登录本站

QQ登录

只需一步,快速开始

艾拓先锋
搜索
查看: 607|回复: 0

运维自动化的定义就是数据-事件-流程

[复制链接]
来自- 广东广州

参加活动:0

组织活动:12

发表于 2017-9-13 11:40:30 | 显示全部楼层 |阅读模式 来自- 广东广州
本帖最后由 monicazhang 于 2018-8-27 11:07 编辑 6 A" r, [* l8 D
2 z" |1 @; q) \' I

随着互联网发展迅猛,不同的公司IT基础设施面临的增长和快速发展。从人肉维护,建设到半自动,全自动,由此产生的自动化体系/运维工具越来越多,目前大多数运维IT环境架构主要分为3种技术体系:


# V* i' v1 {5 _2 v' h

1)开源工具

: q" p( U# K% J


8 o& }, M1 M0 ]0 R1 e

2)自研发工具(更多的是包含和利用开源软件优秀的特性进行定制化开发)

; _( B" w0 p2 @/ F' \: l! E2 u% M# T


! i" \$ E2 U7 O- F& C. `

3)从0自主研发,底层改造到应用层开发

% F7 S1 W) p/ E" w

; K; k* N- S2 c# g$ X$ L8 w( j, N$ e4 ]8 X

开源的代表作有很多,比如:puppet,saltstack,Ansible,nagioszabbix,Docker,KVM,Openstack等主流开源软件。

自研:资产管理系统,发布系统,监控系统,配管系统,工单系统等。

: t# |1 _9 j% Y- K2 o- j

总结:运维自动化已经是成熟的代名词了,无论从网上搜索,还是各大技术分享,都有很多不错的案例和实施过程。但也很多朋友觉得实施起来很困难,复杂,但是看似很简单。困难和复杂:想不通如何把重复性,不可规整/聚合,业务连接成一线枢纽。看似简单:因为有人/其他互联网运维团队实施出来了,实现的还不错,看似近在迟尺。先定义后实施,这个是关键点,想明白才去做,没想明白千万别去做,否则只有推翻重来或者坑越来越多。

. v. W, {# l, Y. i2 j

定义分为三个层面:1.数据的定义2.事件的定义3.流程的定义

! F! C3 C1 ~6 ^3 T& C

+ v% B) x2 b4 F" f! ^7 I. p

& i, p& \9 K5 T! q  \. i& I

1.数据的定义:


5 N% ^3 v* o/ p
3 z! v% v; y3 v( `: k) H6 X+ @1 J) P* c6 `

5 Z+ ]# _2 x* G5 o

一切的基石基于数据,第一步数据的纬度要设计好:

# p" C8 q# \# C/ U! Y8 M5 }# J

①.机房的定义:比如北京机房,上海机房,香港机房等

5 q# R  i2 A" k% X# a0 R

②.机器类型定义:私有云,公有云,物理机,公有云:ali,aws等细化纬度。

0 e' m6 i$ A" m! z

③.业务定义:比如官网业务,订单业务等纬度细化。


% i  c# Z6 ]: P. g" U: t  K' c

④.存储的定义:比如根据自家公司的业务和技术体系来设计:


- p& U+ Z2 V8 q  d) L6 e0 W

比如哪些基础信息是需要的,哪些信息看似可要/可不要的,要做好取舍。

  ^. Z% a$ o! x9 c1 ^3 |0 Y) ~/ v. m

数据存储的信息一定要是展现出来有实际意义的,数据存储不在于多,而是在于价值,繁重的数据越来越多,如果定义很多可有/可无的数据存储,对于一个IT基础资产库来说,也是种负担。


3 p+ i, M+ d3 h

数据的存储考量:唯一的,有价值的,可维护,可扩展的四个原则。

* x, Z. m8 `. W7 y2 L

⑤.协同的定义:当拥有一份完整的IT基础资产库的时候,只是一份基石,基石铺垫好了,才有上升的扩建空间,数据的标准接入协同分为二部分:


9 H. \$ s5 M' G7 u( _# v

1)内部的系统/资源(运维内部的系统)

* Z1 i; V# f  x

2)外部的系统/资源  (业务,安全的系统)


% M9 A0 t6 v1 H# O0 \" A, K

内部系统/资源和外部系统/资源对资产信息库的对接关系策略纬度:

9 P: _( U6 [+ V( m* A0 l

1.可增加/删除的,初始化类型数据系统/可移除的资源数据系统,比如:自动化装机系统

9 n+ M6 Z! x- y' E5 [6 {  ~' M: m

2.可获取的,获取的信息纬度哪些类型,比如:发布系统,监控系统(拿到资产信息库的业务类型,组,主机/IP信息等。

. S! f7 S9 k" z% V' N# H

3.可查询的,单条件查询,多条件查询,连同条件查询,比如:安全审计系统,业务类型系统,对外/对内访问IP区分等。


3 R' H6 U9 y: v


' Q3 P. Z7 _* ]3 r

2.事件的定义:


+ T& m' F1 _7 G6 L  `& d$ Y, E" w& |
* d( k3 P$ ~  [3 H  o( ^1 S+ a8 m

% P. M4 X* c& y& X1 {8 u1 ~

第一要点的数据定义已经设计好,有了完整规范的数据格式,来定义围绕基础信息库基石上扩展事件。

# f$ m2 d8 s, `# v. Z

事件定义的逻辑方法论:事件设计-事件构建-事件交付-事件数据汇总


5 {! z: O; }8 {& u+ G: O" Z* W! `( F6 T

每个自动化操作都依据某个事件场景来实施,实施的策略很多,也需要平衡好优缺点。


. o" W( J& ?* F% t7 B, ?/ g


! k* x$ R* [# s* k9 @

1)数据的初始化录入系统,俗称:自动化装机系统


) L5 _- ^! t" @4 T1 S2 t

. |3 S/ f7 l9 F: ~7 D3 m: x

自动化装机系统初衷:

, }0 S1 }0 ]9 T( H% v, F

1.需要人工重复性操作

/ A! W+ v- p" w# n; b

2.快速交付时间周期慢

7 ~6 T. K0 @6 Q- K# `. Y+ C

3.技术提升优势不大

" N. p5 m0 U/ E; q% @7 z

4.用事件根据场景来优化

/ e- j: K0 X! ~* b+ {2 Z( z" M$ h. ^" Q

+ E' f4 H6 o/ {7 q

自动化装机系统交付要点(根据不同主机类型来构建事件场景):

7 ?0 @* a, t; K# a( D0 P+ J0 a

1.物理机类型(硬件层面:不同硬件厂商的类型,比如远程卡,BIOS初始化,RAID阵列自动划分,软件层面:cobbler)

8 }. i* ^8 a' M) g+ c

2.公有云类型  (服务商的Api或者SDK接口)


% l# ]2 s6 L: O  Y

3.私有云类型 (Openstack,Docker,KVM私有云规范的Api接口或者自己构造一份标准的接口).

9 O( K! F* X" l

4.从类型选择初始化配置-内部DNS数据接入-获取主机信息资源-启动新主机。


$ j5 o# }+ G4 D" l; |8 C

5.数据完整保存,方便以后分析和进一步优化。比如:成本的使用/扩展,业务方机器资源使用率,分析对该事件场景构建优化提升之处。

# O' I8 s& j: }


- m% \! E' q% D6 ?; X

发布系统,运维日常支持工作占到百分之50%或者更多。代码发布也是运维考核的和支持最重要的一项日常工作。

* B) m$ A" Y; O  R6 J6 m0 m

发布环境常用的包含:local,beta,demo,gray,online等


& L% [  ^5 x; o' F' c  P5 h; n

发布的代码类型:混合型居多。


( x' q0 _  y, Q

通常情况下,人肉支撑的耗时,重复性,自检成功/失败发布,排查故障周期很长。尤其是对于重要业务平滑,耗时的情况更多。

而发布系统满足重要的三个因素:

% y, a5 t& q6 x7 W& \- w

1.自动无损平滑发布(支持多种负载均衡策略,发布代码不重启服务策略,环境组主机流量自动切换)和可视化实时过程/结果查看。


4 r( E& M1 Q2 q# ?5 t  ?( ]

2.稳定,并行的构造多环境/多业务发布,即使某个业务出问题,对于整个发布平台/其他业务发布也是无感知,无影响。

# g/ l1 V4 }( |& H  }

3.权限,安全隔离,完整的审计功能,让研发自助的发布。


: o# N- d  L  F/ F, }* x8 N9 n

4.数据的完整保存,分析目前业务发布测试/迭代,资源调度率,发布时间点,全年发布优化指标等。

$ |, N- ~6 Y4 T4 t5 `9 S, b

总结:以上就举2个事件场景构建的案例,一切事件构建皆为场景,场景的价值在于数据是否帮助/量化,改进业务层面/运维层面的持续增长/交付。

! N( b% Y; J: ]' R3 X5 E


# d7 j. M& m& N/ {8 Q& t

3.流程的定义(一切入口,规范,从流程抓起)

8 q3 w1 K5 d! m- i$ Y3 I1 ~0 r0 z
7 ~) k9 \' q5 v
( {# c# y# u4 o( I
: ^! H# f  G) M9 d1 u. J& \

为什么最后才是流程,因为在没有数据做基础铺垫,事件场景构建,一切谈流程都是空话,虚拟的。


6 P; o9 r( F) U9 m+ n5 ~1 k

流程基于实施的要素:


$ {. Y9 Y8 ~7 Y' v* B, M

1)基于一切数据+事件的入口配置


4 L+ }- r$ m/ W1 c( z) f

2)流程不在于复杂,在于易用,快捷,可塑造。


, H. n$ G1 V: J3 j6 p2 H) ^

3)源地址-目的地址全部过程保存,可追踪。


9 T% _; ~0 i8 I1 m$ b- p


7 H2 J' S7 D: y+ O  O

自动化价值:

& ~4 ~3 E- c3 n0 X% G

1)价值性产出:站在业务/团队角度去思考,不追从完美产品方案,只选择合适的产品方案,同时在一定程度上做好取舍。


7 @  C0 F9 @- V+ b& I

2)从小而做到细,从细扩展到大,才是本质。

4 U: d6 x4 J# x/ O

3)  自动化产出一切为数据,对数据定义要设计好,宁愿设计周期长些,也不要盲目实施。

- Q# D6 Q9 E8 w

原创:符杰超

( g) x8 _/ o& I* Z- i

本版积分规则

选择云运维时代的王牌讲师-长河老师,助你轻松入门ITIL Foundation培训课程

QQ|小黑屋|手机版|Archiver|艾拓先锋网 ( 粤ICP备11099876号-1|网站地图

Baidu

GMT+8, 2018-10-16 14:16 , Processed in 0.236077 second(s), 30 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表