1、人与组织
其实这个地方可以谈谈你的人和组织类型了,领导是否重视IT?是否重视运维?组织是否已经认识IT带来的价值,把IT当作自己的一个核心能力来看待?是否把面向用户的业务能力和IT能力很好的对接?是否建立起用户质量的组织文化?等等。
2、流程
流程是梳理多个角色自己的关系和职责。我们第一个要去看这个流程在面对故障的是否起到了积极的作用,比如说能够确保故障信息的准确送达,同时保证处理人的角色和职责是清晰的。其次不断去检查流程是否可以自动化驱动,而非人为驱动。人是不可靠之源!我们最终希望形成是一个自动化、标准化的流程,这样的流程不容易被异化,且能保证预期执行结果一致。
3、技术
很多时候大家看到的技术是运维技术,其实恰恰相反对于互联网业务来说,对其高可用的影响,必然是业务IT技术架构,因此在其中需要遵循很多原则,有一些原则需要有普适的参考价值。比如说服务降级、灰度发布、过载保护、服务公共化等等。这些方法论是否已经融入到研发和运维的架构设计哲学之中?现实是产品功能需求优先,而非可运维性优先,可运维性最终就是业务的质量。
4、业务管理
把你的IT能力最终都业务能力看板化,你可以转换成我们多个业务指标,比如说质量、可用性、用户体验、用户满意度、成本等等,有了这些业务导向性指标,才能把IT能力和业务更好的对接起来。否则很容易在组织内,形成“IT是支撑部门”认识,而非创造价值部门。这一点还有一个重要性,就是让IT部门也要足够的认识到,他们的能力直接和业务相关,需要增强业务敏感度。
三、如何提高系统的可用性
刚刚上面讲到了影响可用性的因素,分成了四个方面,但我想提高系统的可用性从另外一个角度来描述,能把握一些核心准则(其实还有更多)。
1、故障发生前,建立运维质量仪表盘
我们一定要建立运维数据看板,这个看板的数据并且要在业务、研发、测试和运维达成一致,让大家足够重视这份数据,这样数据便有了推动力。建议这个地方的核心数据指标不要太多,因为涉及到多个团队,大家不能够一致理解,特别是传达到管理层,太多的指标,容易失去关注的焦点。
小编推荐阅读
涅槃技能加点技巧攻略秘籍(从零开始,掌握涅槃技能加点的正确方法,让你的角色更加强大!)
阅读无限螺旋出装攻略技巧指南(掌握无限螺旋装备搭配技巧,成为无敌战士)
阅读以为小主而战——《乐土》金牌打手养成计划一览大全(让你在游戏中成为最强金牌打手!)
阅读火候技能选择攻略技巧大全(宝可梦火候技能选择攻略,助你在战斗中脱颖而出!)
阅读《以最后一步第二章为例,怎样打通游戏第二章?》(掌握攻略技巧大全,轻松突破游戏难关)
阅读《明日之后》秋日森林宝箱位置探索攻略技巧大全(揭秘宝箱位置,轻松获得珍贵道具)
阅读姜子牙打野技能加点攻略与技巧大全(王者荣耀姜子牙打野出装及技能加点详解)
阅读《一起来捉妖春节活动技巧攻略指南》(尾火虎打法技巧详解,助你顺利抓妖)
阅读《暗区突围听声训练全攻略最新指南》(游戏迷必读,提升听觉技能的最佳方式)
阅读《崩坏3》鬼铠重磁暴斩解析最新(属性、技能、加点一网打尽,玩转鬼铠重磁暴斩)
阅读《鬼泣巅峰之战》铭文升级攻略技巧指南,让你的英雄更加强大!(打造超级英雄,从铭文升级开始!)
阅读《别惹农夫》小青隐藏皮肤解锁攻略技巧大全(掌握这个关键,你也能拥有小青的另一面)
阅读