大家好,今天小編關(guān)注到一個(gè)比較有意思的話(huà)題,就是關(guān)于自動(dòng)化測(cè)試如何在公司推行的問(wèn)題,于是小編就整理了1個(gè)相關(guān)介紹自動(dòng)化測(cè)試如何在公司推行的解答,讓我們一起看看吧。
1、SRE運(yùn)作流程?
在任何有一定規(guī)模的企業(yè)內(nèi)部,一旦推行起來(lái)整個(gè)SRE的運(yùn)維模式,那么對(duì)于可觀測(cè)性系統(tǒng)的建設(shè)將變得尤為重要,而在整個(gè)可觀測(cè)性系統(tǒng)中,通常我們會(huì)分為如下三個(gè)方面:
指標(biāo)監(jiān)控:即各種指標(biāo)監(jiān)控,比如基礎(chǔ)**指標(biāo),服務(wù)性能指標(biāo),業(yè)務(wù)的調(diào)用指標(biāo)。
日志:各種設(shè)備以及服務(wù)的運(yùn)行日志監(jiān)控。
調(diào)用鏈:業(yè)務(wù)層面的調(diào)用鏈分析,通常在分布式系統(tǒng)中幫助運(yùn)營(yíng)、開(kāi)發(fā)以及運(yùn)維人員快速識(shí)別整體調(diào)用的瓶頸點(diǎn)
一整套的可觀測(cè)系統(tǒng),它能確保***洞察系統(tǒng),跟蹤系統(tǒng)的健康狀態(tài)、可用性以及系統(tǒng)內(nèi)部發(fā)生的事情。對(duì)于整個(gè)可觀測(cè)系統(tǒng)的建設(shè),需要注意如下兩點(diǎn):
確定質(zhì)量標(biāo)準(zhǔn)是什么,并確保系統(tǒng)持續(xù)逼近或保持在質(zhì)量標(biāo)準(zhǔn)極限范圍內(nèi)
系統(tǒng)地關(guān)注這項(xiàng)工作—而不應(yīng)該只是隨機(jī)地查看一下系統(tǒng)
在整個(gè)企業(yè)級(jí)可觀測(cè)系統(tǒng)中,我認(rèn)為至少應(yīng)該包括如下幾個(gè)特征:
完備指標(biāo)***集:可以對(duì)接企業(yè)內(nèi)大部分的設(shè)備與技術(shù)棧相應(yīng)的監(jiān)控指標(biāo);同時(shí),支持常見(jiàn)設(shè)備的監(jiān)控指標(biāo)體系,可以快速接入監(jiān)控設(shè)備和指標(biāo),避免所有設(shè)備監(jiān)控都是從頭構(gòu)建;對(duì)于日志數(shù)據(jù)的***集支持
海量設(shè)備支持:企業(yè)IT系統(tǒng)數(shù)量和規(guī)模越來(lái)越大,因此監(jiān)控系統(tǒng)比以前需要監(jiān)控海量設(shè)備監(jiān)控。
監(jiān)控?cái)?shù)據(jù)存儲(chǔ)和分析:監(jiān)控?cái)?shù)據(jù)是運(yùn)維分析、運(yùn)維自動(dòng)化和智能化的基礎(chǔ),因此海量監(jiān)控?cái)?shù)據(jù)存儲(chǔ)以及基于監(jiān)控?cái)?shù)據(jù)的可視化分析是一個(gè)監(jiān)控系統(tǒng)的基本能力。
可觀測(cè)系統(tǒng)是整個(gè)運(yùn)維體系的基礎(chǔ),它需要提供整個(gè)運(yùn)維體系的數(shù)據(jù)化支持。
因此,一個(gè)企業(yè)級(jí)的可觀測(cè)性系統(tǒng)應(yīng)該是平臺(tái)化的。一方面可以通過(guò)配置或者開(kāi)發(fā)實(shí)現(xiàn)更多 運(yùn)維指標(biāo)的接入;另一方面,亦可對(duì)接更多的專(zhuān)業(yè)運(yùn)維工具,整合并打通多元的運(yùn)維數(shù)據(jù),為更多運(yùn)維場(chǎng)景提供數(shù)據(jù)服務(wù)。從整體上,可觀測(cè)性系統(tǒng)為企業(yè)運(yùn)維提供了一個(gè)數(shù)據(jù)基礎(chǔ),讓我們對(duì)事故響應(yīng)以及容量預(yù)測(cè)等方面更多使用數(shù)據(jù)而非憑借以往經(jīng)驗(yàn)和拍腦袋做出決策。
故障響應(yīng)
如果有什么東西出了故障,該如何提醒大家并做出回應(yīng)?工具可以幫助解決這個(gè)問(wèn)題,國(guó)為它可以定義提醒人類(lèi)的規(guī)則。故障響應(yīng)是建立在使用可觀測(cè)性系統(tǒng)構(gòu)建的數(shù)據(jù)之上,并借助反饋循環(huán),來(lái)幫助我們加***對(duì)服務(wù)的監(jiān)控。故障響應(yīng)通常包含如下幾個(gè)動(dòng)作:
關(guān)注: 不論是主動(dòng)發(fā)現(xiàn)瓶頸點(diǎn)或異常點(diǎn),還是通過(guò)可觀測(cè)性系統(tǒng)被動(dòng)暴露瓶頸點(diǎn),我們都應(yīng)該進(jìn)行主動(dòng)關(guān)注
交流: 及時(shí)將觀察到風(fēng)險(xiǎn)點(diǎn)通知到相關(guān)方,并告知影響面以及相關(guān)的補(bǔ)救措施
恢復(fù): 三方達(dá)成一致后,根據(jù)補(bǔ)救措施進(jìn)行修復(fù)相關(guān)風(fēng)險(xiǎn)點(diǎn)和異常點(diǎn)
需要注意的是,如果在前期整個(gè)可觀測(cè)性系統(tǒng)能夠做好,通常故障應(yīng)當(dāng)始于一個(gè)簡(jiǎn)單的告警信息或一個(gè)報(bào)障電話(huà),因此,通常情況下,可觀測(cè)系統(tǒng)做的足夠好僅能起到追溯和排查的作用,但是無(wú)***起到及時(shí)發(fā)現(xiàn)的作用,此時(shí)就需要依賴(lài)于各個(gè)觀測(cè)數(shù)據(jù)進(jìn)行計(jì)算和評(píng)估告警,以及時(shí)將相關(guān)的告警通知到相關(guān)人,以暴露風(fēng)險(xiǎn)點(diǎn)。告警只是整個(gè)故障響應(yīng)的第一個(gè)環(huán)節(jié),解決的是故障如何發(fā)現(xiàn)的問(wèn)題,而大多數(shù)的故障響應(yīng)工作都是關(guān)于定義處理策略和提供培訓(xùn)的,以便人們?cè)谑盏骄瘓?bào)時(shí)知***該怎么做,通常這部分更多的是過(guò)去歷史經(jīng)驗(yàn)和運(yùn)維經(jīng)歷的總結(jié)和沉淀,包括經(jīng)驗(yàn)的一些抽象和工具化沉淀,以保證故障響應(yīng)的效率和普遍化(即不依賴(lài)人為經(jīng)驗(yàn))。
而對(duì)于整個(gè)告警系統(tǒng)來(lái)說(shuō),需要確保的是告警的有效性,否則,整個(gè)報(bào)警系統(tǒng)很有可能淪落為垃圾數(shù)據(jù)制造機(jī),告警有效性意味著需要滿(mǎn)足如下兩個(gè)需求:
告警及時(shí)性: 系統(tǒng)有問(wèn)題需要及時(shí)通過(guò)告警信息告知運(yùn)維處理人員及時(shí)處理告警;
告警準(zhǔn)確性: 只要有告警信息系統(tǒng)必然出現(xiàn)問(wèn)題(對(duì)于很多企業(yè)可能存在大量的無(wú)用告警,比如磁盤(pán)問(wèn)題,mem等相關(guān)問(wèn)題,當(dāng)然這里涉及到了自動(dòng)化、業(yè)務(wù)形態(tài)、告警閾值的問(wèn)題);
在整個(gè)運(yùn)維過(guò)程中,我們經(jīng)常會(huì)發(fā)現(xiàn)有大量的無(wú)關(guān)緊要的告警信息,讓運(yùn)維人員的注意力***失在告警海洋當(dāng)中,而通常非運(yùn)維領(lǐng)域的領(lǐng)導(dǎo)會(huì)關(guān)注整個(gè)告警的響應(yīng)程度,因此,抑制和消除無(wú)效的告警,讓運(yùn)維人員不被告警風(fēng)暴所吞沒(méi),也是告警管理中重點(diǎn)建設(shè)的內(nèi)容。通常情況,在我們的各個(gè)可觀測(cè)系統(tǒng)構(gòu)建完成后,可以通過(guò)整合到監(jiān)控平臺(tái)中的各種監(jiān)控?cái)?shù)據(jù),應(yīng)用趨勢(shì)預(yù)測(cè)、短周期檢測(cè)、間歇性恢復(fù)、基線(xiàn)判斷、重復(fù)壓縮等算***和手段實(shí)現(xiàn)告警壓縮收斂,***化告警的有效性。
關(guān)于自動(dòng)化測(cè)試如何在公司推行和自動(dòng)化測(cè)試的難點(diǎn)在于如何快速學(xué)會(huì)使用測(cè)試工具的介紹到此就結(jié)束了,不知******從中找到***需要的信息了嗎 ?如果***還想了解更多這方面的信息,記得收***關(guān)注本站。 自動(dòng)化測(cè)試如何在公司推行的介紹就聊到這里吧,感謝***花時(shí)間閱讀本站內(nèi)容,更多關(guān)于自動(dòng)化測(cè)試的難點(diǎn)在于如何快速學(xué)會(huì)使用測(cè)試工具、自動(dòng)化測(cè)試如何在公司推行的信息別忘了在本站進(jìn)行查找喔。