×

微信扫一扫,快捷登录!

  • 来自: IT服务管理体系及ITIL工具

    读书有感,SRE书籍摘录 2

    跟踪故障 [*]提高可靠性的唯一可靠的方法论是建立一个极限,同时不断跟踪改变。  测试可靠性 [*]如果你还没有亲自试过某件东西,那么就假设它是坏的。 [*]SRE的一项关键指责就是要定量地分析我们维护的某项服务的质量。对服务质量的自信可以用过去的系统可靠度和未来的系统可靠度来衡量 ...
    2076 0 0 admin @ 2020-11-22
  • 来自: IT服务管理体系及ITIL工具

    读书有感,SRE书籍摘录 1

    [*]SRE是DevOps在google的具体实践。 [*]一件事儿有可能发生就真的很有可能发生。P01是阿波罗8号上面的一个程序,一旦被人按下,就有可能造成数据丢失,当时是有个程序员的孩子在模拟器上玩儿的时候发现的,这个时候程序员打算修复,但是被上级拒绝了,只能写到playbook里面,一单触发bug,需要重新 ...
    2382 0 0 admin @ 2020-11-22
  • 来自: IT服务管理体系及ITIL工具

    SRE一定要学习开发技能?

    SRE 其实是开发,之不过这个开发面对的业务需求是“如何保障公司业务的可靠性”。基于这个目标,DevOps 只是为了对整个环节可控的必要步骤而已,只有规模效应下 SRE 或者说 DevOps 的价值才能更体现价值——或者说成本也是 SRE 必须考虑的指标之一。 最简单的例子,假设有一种新图片格式,可以让 ...
    2472 0 0 admin @ 2020-11-22
  • 来自: IT服务管理体系及ITIL工具

    对于提高系统可靠性来说,SRE到底意味着什么

    DevOps和SRE似乎是同一枚硬币的两个面。他们都旨在弥合开发团队和运维团队之间的鸿沟,都想要提高软件部署的效率和软件运行的可靠性。在大多数公司中,我们可以看到开发团队和运维团队的职责和能力会有重叠。那么DevOps和SRE有什么不同,每个意味着什么?让我们来看看。开发,运维和可靠性在实施DevOps ...
    2063 0 0 admin @ 2020-11-22
  • 来自: IT服务管理体系及ITIL工具

    在美团点评第21期技术沙龙的分享记录整理而成的SRE分享

    SRE(Site Reliability Engineering)是Google于2003年提出的概念,将软件研发引入运维工作。现在渐渐已经成为各大互联网公司技术团队的标配。美团点评作为综合性多业务的互联网+生活服务平台,覆盖“吃住行游购娱”各个领域,SRE就会面临一些特殊的挑战。 [*]业务量的飞速增长,机器数量剧增,导致人 ...
    2146 0 0 admin @ 2020-11-22
  • 来自: IT服务管理体系及ITIL工具

    Linux之下支持SRE的几种关键技术

    什么是 SRE(站点可靠性工程)? 站点可靠性工程(SRE)是 IT 运维的软件工程方案。SRE 团队使用软件作为工具,来管理系统、解决问题并实现运维任务[ /zh/topics/automation]自动化[/url]。SRE 执行的任务以前通常由运维团队手动执行,或者交给使用软件和自动化来解决 ...
    2932 1 0 東東 @ 2020-11-30
  • 来自: IT服务管理体系及ITIL工具

    我看SRE在中小型组织的运用

    [ /jabbok/p/9627248.html]SRE思想[/url] 1 规模效应业务越庞大,服务器就越多,服务越多,就越需要拆分成分布式架构。架构越复杂,对运维的能力要求就越高、出错的概率就越大,运维的工作量就越大。因此就要更多开发提升效率的工具。 ...
    2303 0 0 admin @ 2020-11-22
  • 来自: IT服务管理体系及ITIL工具

    SRE在优云的落地实践案例

    王璞 运维环境的新变化 数人云是基于容器的轻量级PaaS平台落地企业客户时,客户很难理解一个平台背后隐含的东西,任何平台及工具都是与方法论结合的,比如研发工具、持续交付工具等等,都有一套方法和理念,今天主要分享下SRE理念在传统企业中的落地实践。 随着技术的发展,运维环境发生了新 ...
    2427 0 0 admin @ 2020-11-22
欢迎关注“ITIL先锋论坛”微信公众号

微信公众号:







微信在线客服:

返回顶部