摘要:Web运维要求理解架构中的各个组成部分,在理解计算系统的来龙去脉时,扎实的计算背景对你会有莫大的帮助。
扎实的计算背景
Web运维要求理解架构中的各个组成部分,在理解计算系统的来龙去脉时,扎实的计算背景对你会有莫大的帮助。处理器体系结构、内存系统、存储系统、网络交换与路由、为何第二层协议那样工作、HTTP、数据库概念…这个清单可以列好几页。具有扎实的基础,对于理解为什么及如何架构解决方案,以及识别出问题所在,是非常重要的,毕竟,计算是架构我们的智能系统的基础。此外,工程师的思维方式和对物理定律的基本理解也是一个很大的优势。
一天,在喝酒聊天的时候,我的一位朋友,也是Web运维领域的同行,JesseRobbins,讲了一个排查卫星电话线路故障的故事。一套卫星电话设施安装好了,而线路有超过一秒的非预期”延迟。这是很久以前的事了,这套卫星电话设施已经花了一大笔钱,所以,客户对于服务质量感到非常沮丧。经过好几个小时的排查和连续的调优之后,技术人员问道:“先要搞清楚,这一秒的延迟是算到预期的延迟时间里的,对不对?”一阵长时间的沉默之后,客户问:“什么是预期延迟?”技术人员首先向请来的所有人为浪费他们的时间而道歉,然后严厉地斥责客户,说他浪费了所有人的时问。所谓预期延迟就是将信号送到外层空间的卫星再返回所需要的时间,我们就是再怎么努力,也没有办法增加光的速度啊。尽管这个故事看起来很愚鑫,我却经常遇到这种随意的、不切实际的期望。可能最普通的就是跨洲同步复制的企图了,就是公然藐视我们目前所知的物理定律嘛。我们还是努力成为一个维护好站点可靠性的工程师吧,尽量将计算机科学和物理学的基本原理付诸实践。要在理论限度内做好工作,你必须知道这些限度是什么以及在哪里,这就是为什么计算机科学、物理学、电气工程,以及应用数学的理论知识真正不可缺少的原因。
运维,就是理解理论和实践在哪里发生冲突,并发明适当的方法,以便在发生事故时减少损失。
娴熟的决断力
虽然优柔寡断在任何领域都不算是一个优点,但在Web运维中却几乎不能容忍。像急救中心和急诊室的医生一样,你会经常常面临这样的境地,此日时单有良好的判断力是不够的这一点你可要明白。决策的迟延就会导致宕机的持续,所以必须训练你的大脑持续不断地对接收到的输入做出反应,因为那种“收集、审查、建议”的方式将会导致局面不可收拾。
在计算机科学中,算法有两种类型:离线和在线。离线算法是指在确定输出之前,整个输入集都已获得的解决方案。与此相反,在线算法是指边获取输入边产生输出。当然,由于算法在产生输出(或解决方案)时,并没有获得整个输入集,也就没有办法保证产生最优化的输出。与离线算法不同的是,在线算法保证你手上总是有答案。
运维决策必须是在线算法的结果,而非离线算法。这并不是说离线算法在Web运维中就没有地位了,恰恰相反,其中一个非常关键的过程就是离线的,那就是根本原因分析(RCA)。对于尽可能地形式化RCA过程,我可是有巨大热情的。
对失败及其症状表现以及“即时”决策的复审进行彻底的离线(事后)分析,是改进在线算法(你和你的团队用于关键运维决策)的可能的最好途径。
沉稳的性格
一个沉稳与可控的思维过程是非常关键的,没有它,就会出现吉斯通警察综合征,使糟糕的局面变得更加不可收拾。在疯狂的动作片中,一个人崩溃了,另一个人就抓住他使劲摇晃,告诉他要镇定下来一一在这种情形下,你要确定你是处在清醒的一方的。在清醒的一方,你就会有一个快乐、健康的职业,否则,你得到的将是一份沉重的工作,弄不好,将会不堪重负。
因为没有正式的教育途径,Web运维行业,就其目前的状况而言,是一种非正式的师徒模型。互联网的广泛应用,已使商务和社会交往发生了范式转移,而且信息已经在某种程度上唾手可及,从而一种虚拟的师徒模型便成为可能。不幸的是,正如你能够料想到的,在不同的群组之间,这种师徒模型的质量也是千差万别的。
在网站建设Web运维领域,目标很简单,使所有事情在所有时间正常运转:一个简单的定义,但却是一个不可能的期望。或许在这个领域成为一名工程师的更大挑战是组织内的同事对你的不切实际的期望。
平面设计相关资讯推荐阅读: