說(shuō)到運(yùn)維,大數(shù)據(jù)時(shí)代的運(yùn)維面臨“業(yè)務(wù)、規(guī)模、團(tuán)隊(duì)”三大難題多種壓力,這讓我們一談到企業(yè)IT系統(tǒng)的運(yùn)維,往往總是想到被動(dòng)救火、背鍋不斷。我們的運(yùn)維工作到底怎么做才能將風(fēng)險(xiǎn)扼殺在故障發(fā)生之前?如何能夠擺脫繁瑣、低效、高風(fēng)險(xiǎn)的傳統(tǒng)人肉運(yùn)維方式?如何能夠更直觀的在公司呈現(xiàn)我們的價(jià)值和存在感?這些難題,在AIOps被廣泛提及的當(dāng)下變得尤為迫切。
那么,作為運(yùn)維人員,我們應(yīng)該如何主動(dòng)尋求變革呢?新炬網(wǎng)絡(luò)董事、副總經(jīng)理程永新在全球敏捷運(yùn)維峰會(huì)說(shuō)到就是“企業(yè)級(jí)敏捷運(yùn)維三板斧”,也就是可視化呈現(xiàn)價(jià)值、自動(dòng)化解放效率、智能化驅(qū)動(dòng)能力。
企業(yè)級(jí)運(yùn)維三板斧
1.可視化呈現(xiàn)價(jià)值
在軟件市場(chǎng),國(guó)內(nèi)和國(guó)外有很大的區(qū)別,國(guó)外的軟件可視化做得其實(shí)沒(méi)有國(guó)內(nèi)好,因?yàn)閲?guó)外所有的這些軟件叫工具軟件,這些工具軟件是給干活的人用的,所以國(guó)外的這些工具軟件不管是開(kāi)源的還是商業(yè)的,其實(shí)做得沒(méi)有那么好。但是國(guó)內(nèi)不一樣,國(guó)內(nèi)企業(yè)的領(lǐng)導(dǎo)更希望看到的是:你說(shuō)我出問(wèn)題了,好,我要看哪里出問(wèn)題了,純技術(shù)層面你可能會(huì)發(fā)現(xiàn),解釋半天也解釋不清楚,所以這時(shí)候,可視化就變得更為重要了,一方面是我們操作人員自己本身工作是需要的,另一方面關(guān)鍵是在客戶端,在領(lǐng)導(dǎo)那里怎么樣呈現(xiàn)這個(gè)價(jià)值,我們的工作怎么能被看到,這很重要。

在可視化層面,我們的做法是通過(guò)縱向打通應(yīng)用層、平臺(tái)層和設(shè)備層,橫向接入全網(wǎng)IT設(shè)備,采集全網(wǎng)數(shù)據(jù),并在此基礎(chǔ)上結(jié)合具體的算法去做展現(xiàn)的。
比如通過(guò)自研的打分形式具象呈現(xiàn)所有設(shè)備的健康度,便于用戶第一時(shí)間發(fā)現(xiàn)、下鉆和解決問(wèn)題;通過(guò)自研的APM 應(yīng)用自動(dòng)埋點(diǎn),實(shí)現(xiàn)交易過(guò)程的透視,并對(duì)相關(guān)數(shù)據(jù)進(jìn)行分析和存儲(chǔ),實(shí)現(xiàn)調(diào)用過(guò)程分解及性能問(wèn)題的快速定位等。真正實(shí)現(xiàn)了隨時(shí)隨地、全網(wǎng)透明的可視化,支持APP、Web工作界面和大屏展示等多屏呈現(xiàn)工作內(nèi)容與價(jià)值。
2自動(dòng)化解放效率
自動(dòng)化解放效率這個(gè)不用說(shuō)了,對(duì)于我們運(yùn)維來(lái)說(shuō),如果我們能多出一些時(shí)間看書(shū)、學(xué)習(xí)、研究,我們自己的技術(shù)能夠有點(diǎn)提高,這個(gè)對(duì)我們來(lái)說(shuō)是最好的事情,而不是說(shuō)一天到晚都在做重復(fù)性的勞動(dòng)。
其實(shí)自動(dòng)化我們一直在做,我相信所有做過(guò)的人都會(huì)知道這中間有很多很多的坑,這些坑我們?cè)趺礃硬冗^(guò)去的呢?自動(dòng)化的主要目的,一是提升效率,二是安全可控,三是降低人員依賴。要做到這三點(diǎn)則必須明白:一切沒(méi)有固化到平臺(tái)的標(biāo)準(zhǔn)化過(guò)程都是無(wú)用功;一切沒(méi)有場(chǎng)景驅(qū)動(dòng)的運(yùn)維平臺(tái)建設(shè)都是假大空。
對(duì)此,我們的做法是:

第一步,落地八大自動(dòng)化運(yùn)維場(chǎng)景,包括自動(dòng)化運(yùn)維操作及自動(dòng)化資源開(kāi)通及部署等,覆蓋90%以上的運(yùn)維工作場(chǎng)景。
第二步,通過(guò)集中式自動(dòng)化運(yùn)維管理,實(shí)現(xiàn)運(yùn)維操作的安全、高效,并形成知識(shí)資產(chǎn),確保知識(shí)的有效傳遞。
第三步,自動(dòng)化運(yùn)維能力支持API開(kāi)放:將自動(dòng)化運(yùn)維能力封裝API,供各系統(tǒng)、各終端調(diào)用,如在手機(jī)端、系統(tǒng)拓?fù)渖峡芍苯舆M(jìn)行運(yùn)維操作。
第四步,構(gòu)建自動(dòng)化運(yùn)維PaaS平臺(tái):支持場(chǎng)景的自定義開(kāi)發(fā),驅(qū)動(dòng)運(yùn)維團(tuán)隊(duì)能力轉(zhuǎn)型。
3.智能化驅(qū)動(dòng)能力
智能化首先要做的就是日志分析,當(dāng)設(shè)備類型越來(lái)越多的時(shí)候,日志分析則變得越來(lái)越重要。從這個(gè)層面出發(fā),我們也是通過(guò)自研的IVORY大數(shù)據(jù)日志分析平臺(tái),采用大數(shù)據(jù)底層框架和拖拽式的獨(dú)家專利切割算法,實(shí)時(shí)聚合海量日志,準(zhǔn)確搜索統(tǒng)計(jì)日志,智能分析日志內(nèi)容,只需簡(jiǎn)單操作就能實(shí)現(xiàn)大數(shù)據(jù)的分析和挖掘工作。

此外,做任何運(yùn)維產(chǎn)品如果沒(méi)有運(yùn)維經(jīng)驗(yàn)其實(shí)只是做一個(gè)框架,想要真正實(shí)現(xiàn)智能化,光有工具是不夠的,還需要結(jié)合實(shí)際運(yùn)維場(chǎng)景,優(yōu)化數(shù)據(jù)價(jià)值,以智能化驅(qū)動(dòng)運(yùn)維能力,最終實(shí)現(xiàn)從發(fā)現(xiàn)、決策分析到問(wèn)題解決的問(wèn)題閉環(huán)解決手段。
這個(gè)是我們整體的敏捷運(yùn)維全站的解決方案框架,以“可視化、自動(dòng)化、智能化”為敏捷運(yùn)維全棧解決方案的核心:通過(guò)“運(yùn)維可視化”實(shí)現(xiàn)隨時(shí)隨地、全網(wǎng)透明的運(yùn)維價(jià)值呈現(xiàn);通過(guò)“運(yùn)維自動(dòng)化”全面提升運(yùn)維服務(wù)效率和質(zhì)量;通過(guò)“運(yùn)維智能化”實(shí)現(xiàn)以智能化驅(qū)動(dòng)運(yùn)維能力。在這個(gè)過(guò)程中,我們通過(guò)運(yùn)維分層構(gòu)建,實(shí)現(xiàn)不同層級(jí)解決不同層次的問(wèn)題。