×

微信扫一扫,快捷登录!

  • 来自: IT服务管理体系及ITIL工具

    基于时间序列数据进行有效报警内容介绍

    让查询来得更猛烈些吧,让寻呼机永远保持沉默!—— SRE 谚语 监控,处于整个生产环境需求金字塔模型的最底层。监控是运营一个可靠的稳定服务不│可缺少的部分。服务运维人员依靠监控数据对服务的情况做出理性判断,用科学的方法应对紧急情况。同时,监控数据也可以用来确保服务质量与产品目标保持一 ...
    2969 0 0 我行我素 @ 2020-12-6
  • 来自: IT服务管理体系及ITIL工具
    谷歌SRE有哪些落地的实践

    谷歌SRE有哪些落地的实践

    简单来说,SRE的职责是运维一个服务。该服务由一些相关的系统组件组成,为最终用户提供服务(可以是内部用户或外部用户)。SRE 的终极责任是确保该服务可以正常运转。为达成这个目标,SRE 需要完成以下一系列工作∶开发监控系统,规划容量,处理紧急事件,确保事故根源被跟踪修复等。这一部分将主要讨 ...
    3126 0 0 it168 @ 2020-12-6
  • 来自: IT服务管理体系及ITIL工具

    最小 API和软件系统模块化的建议

    法国诗人 Antoine de Saint Exupery 曾写道,"不是在不能添加更多的时候,而是没有什么可以去掉的时候,才能达到完美。"(参见文献【Sai39】)这个原则同样适用于软件的设计和构建。API是这个规则应该遵循的一个清晰的例子。 书写一个明确的、最小的API 是管理软件系统管理简单性必要的部分。我们 ...
    2525 0 0 Hoop @ 2020-12-6
  • 来自: IT服务管理体系及ITIL工具

    我绝对不放弃我的代码和"负代码行"作为一个指标

    因为工程师也是人,他们经常对于自己编写的代码形成一种情感依附,这些冲突在大规模清理源代码树的时候并不少见。一些人可能会提出抗议,"如果我们以后需要这个代码怎么办?""我们为什么只是把这些代码注释掉,这样稍后再使用它的时候会更容易吗?""为什么不增加一个功能开关?"这些都是糟糕的建议。源 ...
    2106 0 0 书法家 @ 2020-12-6
  • 来自: IT服务管理体系及ITIL工具

    如何让复杂IT系统简单化

    可靠性只有靠对最大程度的简化不断追求而得到。—C.A.R. Hoare,Turing Award lecture 软件系统本质上是动态的和不稳定的。只有真空中的软件系统才是永远稳定的。如果我们不再修改代码,就不会引入新的 Bug。如果底层硬件或类库永远不变,这些组件也就不会引入Bug。如果冻结当前用户群,我们将永 ...
    2341 0 0 @ 2020-12-6
  • 来自: IT服务管理体系及ITIL工具

    如何向谷歌学习更好地发布工程

    当采用合适的工具、合理的自动化方式,以及合理的政策时,开发团队和SRE 都无须担心如何发布软件。发布过程可以像按一个按钮那么简单。 大部分公司,不论团队大小和使用何种工具,都面临着同样的发布工程问题∶如何管理包的版本?应该采用持续构建和部署的模型,还是应该定期构建?发布的频率应该怎样? ...
    2381 0 0 汗青 @ 2020-12-6
  • 来自: IT服务管理体系及ITIL工具

    SRE发布工程师如何做好配置管理

    配置管理是发布工程师与SRE 紧密合作的一个区域。虽然初看起来,配置管理可能很简单,但是这其实是不稳定性的一个重要来源。因此、我们的发布流程和系统运维与配置管理流程都随着时间不停地发展。今天我们使用下面几段描述的模型来分发配置文件。所有这些模型都需要将配置文件存放于我们的主要代码仓库 ...
    2559 0 0 salala @ 2020-12-6
  • 来自: IT服务管理体系及ITIL工具
    谷歌SRE发布工程的Rapid 系统

    谷歌SRE发布工程的Rapid 系统

    图 8-1展示了Rapid系统中的主要组件。Rapid是用Bhueprin文件配置的。Blueprint文件是一种利用Google内部配置语言写成的,用来定义构建目标和测试目标、部署规则,以及一些管理用信息(例如项目负责人信息)。基于角色的访问控制列表可以决定谁能执行哪些动作。 每个Rapid项目都有一些工 ...
    3580 0 0 loonger @ 2020-12-6
欢迎关注“ITIL先锋论坛”微信公众号

微信公众号:







微信在线客服:

返回顶部