權(quán)威指南:什么是 AIOps?


過去的工具已無力應(yīng)對當(dāng)今變幻不定的 IT 局勢?;A(chǔ)架構(gòu)模型在持續(xù)快速改革,因此管理也應(yīng)采用動態(tài)的流程和技術(shù)。
商業(yè)環(huán)境正從靜態(tài)且可預(yù)測的物理系統(tǒng)(定義這個(gè)領(lǐng)域數(shù)十年)轉(zhuǎn)變?yōu)榭蓜討B(tài)更改和重新配置的軟件定義資源環(huán)境。此外,隨著網(wǎng)絡(luò)基礎(chǔ)設(shè)施的不斷發(fā)展,基于舊模型的軟件系統(tǒng)要投入越來越多的精力來保持有效性,但仍會越來越落后。
在這場 IT 運(yùn)維 (ITOps) 變革的影響下,數(shù)字化業(yè)務(wù)轉(zhuǎn)型力量迫使傳統(tǒng) IT 管理技術(shù)走上改變之路。因此,現(xiàn)有 ITOps 流程和程序以及 IT 生態(tài)系統(tǒng)的管理結(jié)構(gòu)發(fā)生了重大變化。
1、AIOPS在攜程的探索與實(shí)踐.pdf
2、HPC+AI融合計(jì)算.pdf
3、基于機(jī)器學(xué)習(xí)的智能運(yùn)維.pdf?
4、人工智能在運(yùn)維中的實(shí)踐.pdf?
5、容器下的AIOps架構(gòu)實(shí)踐.pdf?
6、數(shù)據(jù)驅(qū)動的智能運(yùn)維.pdf?
7、為AIOps的普及而重生的基礎(chǔ)監(jiān)控.pdf?
8、由AIOps提供支持的自動化運(yùn)營和更新.pdf
9、中國 IT 基礎(chǔ)架構(gòu)運(yùn)維市場研究報(bào)告.pdf

Gartner在 2017 年為 IT 運(yùn)維或 AIOps 創(chuàng)造了術(shù)語人工智能,深入反映這些變革的精神核心。
AIOps 使用數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)技術(shù)助力 ITOps 團(tuán)隊(duì)實(shí)時(shí)了解影響所管理系統(tǒng)的性能或可用性的問題。
在過去的幾年中,企業(yè)爭先恐后地去了解這種新技術(shù),并試圖走在它前面,AIOps 市場類別呈爆炸式增長,同時(shí) Gartner 領(lǐng)域的咨詢數(shù)量呈指數(shù)級增長。
本權(quán)威指南討論有關(guān) AIOps 的一切須知信息,推動它誕生的市場和技術(shù)變革以及如何應(yīng)對這些挑戰(zhàn)。
AIOps 之路
首先必須了解數(shù)字轉(zhuǎn)型及其如何推動產(chǎn)生 AIOps。
數(shù)字轉(zhuǎn)型涵蓋新技術(shù)的實(shí)施、云應(yīng)用和快速變化。它要求人們將重心轉(zhuǎn)移到開發(fā)人員和應(yīng)用程序上,并加快創(chuàng)新步伐。它還要獲取如下設(shè)施:
物聯(lián)網(wǎng)?(IOT) 設(shè)備
新的數(shù)字用戶-機(jī)器代理
應(yīng)用程序編程接口 (API)
所有這些新用戶和新技術(shù)將傳統(tǒng)的服務(wù)和性能管理工具和戰(zhàn)略擠壓到極限。
成功的數(shù)字轉(zhuǎn)型離不開 AIOps,它賦能 IT 以大多數(shù)現(xiàn)代企業(yè)所需的速度運(yùn)行。因此,AIOps 闡述了應(yīng)對 ITOps 領(lǐng)域數(shù)字轉(zhuǎn)型所需的范式轉(zhuǎn)換。
何為 AIOps?
AIOps 是“IT 人工智能運(yùn)維”的首字母縮寫。它是 ITOps(IT 運(yùn)維)的未來。它結(jié)合了人類和算法智能,全面監(jiān)測公司和企業(yè)在日常運(yùn)營中所依賴的 IT 系統(tǒng)的性能和狀態(tài)。
它是一種高端多層技術(shù)平臺,使用機(jī)器學(xué)習(xí)和分析技術(shù)分析采集自各種 ITOps 設(shè)備和工具的大數(shù)據(jù),以此增強(qiáng)和自動執(zhí)行 IT 流程,從而自動發(fā)現(xiàn)問題并實(shí)時(shí)響應(yīng)問題。
AIOps 要求您將孤立的 IT 數(shù)據(jù)移動到大數(shù)據(jù)平臺中的綜合觀測數(shù)據(jù)(例如,工作日志和監(jiān)控系統(tǒng))和互動數(shù)據(jù)(如工作單、活動或事故記錄中的數(shù)據(jù))。
然后,AIOps 根據(jù)組合的數(shù)據(jù)實(shí)施機(jī)器學(xué)習(xí)和分析。在此基礎(chǔ)上,通過持續(xù)的深入洞察推動不斷改進(jìn)自動化實(shí)施。因此,您可以將 AIOps 視為核心 IT 功能的 CI/CD(持續(xù)集成和持續(xù)部署)。
AIOps 橋接了三個(gè) IT 學(xué)科(自動化、服務(wù)管理和性能管理)以實(shí)現(xiàn)持續(xù)洞察和改進(jìn)的目標(biāo)。人們認(rèn)識到,在新的加速和超大規(guī)模 IT 環(huán)境中,有一種利用機(jī)器學(xué)習(xí)和大數(shù)據(jù)的全新方法,可克服人力和傳統(tǒng)工具限制的問題。
AIOps 工作原理
AIOps 使用組織內(nèi)的現(xiàn)有數(shù)據(jù)源,包括日志事件、傳統(tǒng) IT 監(jiān)控、網(wǎng)絡(luò)性能異常等。從這些來源系統(tǒng)收集的數(shù)據(jù)運(yùn)用數(shù)學(xué)模式進(jìn)行處理,從而自動識別重大事件,無需費(fèi)力的手工預(yù)篩選。
另一層算法可分析事件,并識別存在類似潛在問題癥狀的一群相關(guān)活動。算法過濾可大大降低 ITOps 團(tuán)隊(duì)必須處理的警報(bào)干擾,同時(shí)還可避免不同工作組的工作單冗余路由而產(chǎn)生的重復(fù)情況。
取而代之的是,您可以動態(tài)組建虛擬團(tuán)隊(duì),并分派不同的專家跨部門或技術(shù)邊界的問題?,F(xiàn)有的事件管理和票務(wù)系統(tǒng)可運(yùn)用 AIOps 的功能,直接集成到現(xiàn)有流程中。
AIOps 進(jìn)一步提高了自動化程度。它能夠觸發(fā)工作流程,不管是否有人工干預(yù)。當(dāng)前的 ChatOps 功能在診斷和補(bǔ)救措施的正常協(xié)作過程中,積極利用現(xiàn)有的自動化功能。
隨著機(jī)器學(xué)習(xí)系統(tǒng)變得越來越精確和可靠,現(xiàn)在無需人工干預(yù)即可觸發(fā)易于理解的常規(guī)操作,從而及時(shí)解決問題以免干擾用戶的使用。
AIOps 的要素
以下是構(gòu)成 AIOps 平臺的技術(shù)。
數(shù)據(jù)源。數(shù)據(jù)源廣泛而多樣化,來自于現(xiàn)有孤立的工具和各種 IT 類,包括事件、日志、指標(biāo)、工作單、監(jiān)控和作業(yè)數(shù)據(jù)等。 大數(shù)據(jù)。包括允許實(shí)時(shí)處理的現(xiàn)代化大數(shù)據(jù)平臺。例如,Elastic Stack、Hadoop 2.0 或部分 Apache 技術(shù)。 規(guī)則和模式。AIOps 平臺的規(guī)則應(yīng)用和模式識別加強(qiáng)了杠桿作用,可發(fā)現(xiàn)上下文,同時(shí)發(fā)現(xiàn)數(shù)據(jù)的常態(tài)和規(guī)律。它們可能特定/不特定于某個(gè)域。 機(jī)器學(xué)習(xí)。機(jī)器學(xué)習(xí)技術(shù)可根據(jù)新引入的數(shù)據(jù)和算法分析的輸出結(jié)果自動創(chuàng)建新的算法或修改現(xiàn)有算法。 域算法。利用 IT 域領(lǐng)域的專業(yè)知識智能解釋規(guī)則和模式,并根據(jù)企業(yè)數(shù)據(jù)和期望的結(jié)果進(jìn)行應(yīng)用。域算法有利于組織機(jī)構(gòu)實(shí)現(xiàn) IT 特定的目標(biāo),例如關(guān)聯(lián)非結(jié)構(gòu)化數(shù)據(jù)、消除干擾、針對異常發(fā)出警報(bào)、找出可能的原因以及建立基準(zhǔn)。 自動化。利用機(jī)器學(xué)習(xí)和人工智能產(chǎn)生的結(jié)果,自動創(chuàng)建和應(yīng)用對確定的問題和情況的響應(yīng)。 人工智能 (AI)。人工智能可適應(yīng)環(huán)境中的未知和新事物。?
AIOps的要求和功能
所有 AIOps 平臺都應(yīng)為您的企業(yè)帶來以下三項(xiàng)功能。
自動執(zhí)行日常操作,例如用戶請求或不重要的 IT 系統(tǒng)警報(bào)。例如,AIOps 可以幫助服務(wù)臺系統(tǒng)處理和滿足用戶自動配置資源的請求。它們還可以評估警報(bào)并確定是否需要采取措施,因?yàn)橹С中缘臄?shù)據(jù)和相關(guān)指標(biāo)均在正常參數(shù)范圍內(nèi)。 識別嚴(yán)重問題的速度和準(zhǔn)確性遠(yuǎn)優(yōu)于人工。IT 人員可能會解決非關(guān)鍵系統(tǒng)上的已知惡意軟件事件,但會忽略關(guān)鍵服務(wù)器上啟動的異常下載或進(jìn)程,因?yàn)樗麄儧]有關(guān)注或預(yù)料到這種威脅。AIOps 系統(tǒng)則以完全不同的方式解決這些情況。它們會優(yōu)先處理關(guān)鍵系統(tǒng)上因行為不正常而疑似攻擊或感染的事件,其次是運(yùn)行防病毒軟件處理已知的惡意軟件事件。 簡化數(shù)據(jù)中心團(tuán)隊(duì)之間的互動。AIOps 為所有職能 IT 部門提供相關(guān)數(shù)據(jù)和見解。如果缺少這些支持人工智能的操作,團(tuán)隊(duì)必須通過手動發(fā)送數(shù)據(jù)或召開現(xiàn)場會議來解析和共享信息。AIOps 應(yīng)該從企業(yè)的大量資源指標(biāo)中了解可向每個(gè)組顯示的數(shù)據(jù)。
驅(qū)動 AIOps 的推動因素是什么?它需求背后的理由是什么?
人工智能 (AI) 的前景是承擔(dān)起人類工作,但速度更快、結(jié)果更好、規(guī)模更大。AIOps 可解決數(shù)字轉(zhuǎn)型的規(guī)模、復(fù)雜性和速度難題,讓您實(shí)現(xiàn) ITOps 的這個(gè)目標(biāo)。這些挑戰(zhàn)包括:
ITOps 在手動管理基礎(chǔ)架構(gòu)上面臨的困難 ITOps 要保留越來越龐大的數(shù)據(jù)量 以越來越快的速度解決基礎(chǔ)設(shè)施問題的需求 開發(fā)人員享受更大的權(quán)力和影響力,但責(zé)任仍由 IT 部門承擔(dān) 從網(wǎng)絡(luò)中心轉(zhuǎn)移更多的計(jì)算能力
AIOps 與當(dāng)前工具集成
AIOps 與現(xiàn)有流程和工具相互集成,匯集了實(shí)用信息、功能和見解。企業(yè)當(dāng)下使用不同區(qū)域和不同用途的監(jiān)控工具。每個(gè)工具對特定部門、團(tuán)隊(duì)或公司都有價(jià)值,但其他相關(guān)方無法利用它的價(jià)值。
因此,AIOps 并沒有運(yùn)用費(fèi)力的工具合理化舉措,試圖用一刀切解決方案強(qiáng)行解決個(gè)人獨(dú)特需求,而是跨域、團(tuán)隊(duì)和工具打造無縫可見性,支持特定工具的大力發(fā)展。
同樣,AIOps 還確保只創(chuàng)建真實(shí)可操作的事件,避免事件重復(fù),減輕 IT 服務(wù)團(tuán)隊(duì)管理 (ITSM) 的工作量。IT 基礎(chǔ)結(jié)架構(gòu)庫 (ITIL) 的順序性質(zhì)還決定了 AIOps 可解決和消除大量 ITSM 用戶煩惱。
AIOps 還實(shí)現(xiàn)了自動化。它可集成編排和工作流程,直接以全自動或半自動形式呈現(xiàn)給操作員。IT 部門多年來開發(fā)了大型自動化解決方案庫,因此他們必須確保只有達(dá)到正確的條件才能觸發(fā)。AIOps 不僅可保證這一點(diǎn),而且可將風(fēng)險(xiǎn)控制在最低水平,最大限度發(fā)揮現(xiàn)有自動化投資的價(jià)值。
誰在使用 AIOps?
復(fù)雜的大型企業(yè)非常依賴大數(shù)據(jù)和 IT 云計(jì)算 ?開發(fā)運(yùn)維團(tuán)隊(duì) 數(shù)字化轉(zhuǎn)型
AIOps 的優(yōu)勢
正確實(shí)施的 AIOps 平臺可減少 IT 員工在日常警報(bào)上所花費(fèi)的時(shí)間和精力。在機(jī)器學(xué)習(xí)和算法的運(yùn)用下,IT 員工可訓(xùn)練 AIOps 平臺不斷精進(jìn)。它們可逐漸吸收知識以改進(jìn)軟件的行為和有效性。
AIOps 工具可持續(xù)監(jiān)控狀態(tài),不眠不休。員工可則可集中精力處理嚴(yán)重的復(fù)雜問題,同時(shí)落實(shí)計(jì)劃舉措提高業(yè)務(wù)穩(wěn)定性和績效。
AIOps 系統(tǒng)在對各種數(shù)據(jù)源進(jìn)行整理和歸類過程中,可觀察企業(yè)多個(gè)運(yùn)行、資源和服務(wù)之間的因果關(guān)系。這些機(jī)器學(xué)習(xí)和分析功能促使系統(tǒng)執(zhí)行根本原因分析,從而加快疑難雜癥故障排除,快速實(shí)施補(bǔ)救措施。
AIOps 改善了 IT 組之間以及 IT 部門與其他業(yè)務(wù)部門之間的工作流任務(wù)和協(xié)作。團(tuán)隊(duì)可以使用定制的報(bào)告和控制板快速了解要求和任務(wù)。他們還可以對接其他工作組,但無需學(xué)習(xí)其他工作組要掌握的知識。
AIOps 消除了噪音和干擾,有助于 IT 人員集中應(yīng)對重要問題,不會被無關(guān)緊要的警報(bào)打擾。
AIOps 有助于關(guān)聯(lián)多個(gè)數(shù)據(jù)源之間的信息,不僅打破了信息之間的藩籬,而且能洞察從物理、虛擬到云整個(gè) IT 環(huán)境的全部狀況,包括網(wǎng)絡(luò)、計(jì)算和存儲。
它推動服務(wù)所有者和專家之間的無摩擦協(xié)作。這可極大加快診斷、分析和解決速度,從而最大限度減少對最終用戶的干擾。
AIOps 的缺陷
盡管基本的 AIOps 技術(shù)相對成熟,但要創(chuàng)建和組合技術(shù)以投入實(shí)際生產(chǎn),還有很長一段路要走。以下是它的一些缺點(diǎn):
它的有效性取決于您訓(xùn)練的算法以及它接收的數(shù)據(jù)。因此,終不能超出編程的限制。 實(shí)施、管理和維護(hù) AIOps 平臺可能需要花費(fèi)大量的精力和時(shí)間。 AIOps 系統(tǒng)依賴各種數(shù)據(jù)源以及數(shù)據(jù)保留、保護(hù)和存儲。 AIOps 要求企業(yè)完全信任工具,這是部分企業(yè)不喜歡它的一個(gè)原因。這是因?yàn)?,為了?AIOps 工具能夠自主采取行動,他們必須準(zhǔn)確地跟蹤目標(biāo)環(huán)境中的變化,收集并保護(hù)相關(guān)數(shù)據(jù),形成正確的結(jié)論,確定操作的優(yōu)先級,最終采取適當(dāng)?shù)淖詣踊胧?/span>
在企業(yè)中實(shí)施 AIOps
沒有放之四海而皆準(zhǔn)的成功模式。不過,下文的通用指南可幫助您入門。
立即掌握機(jī)器學(xué)習(xí)和人工智能的基礎(chǔ)知識。
確定企業(yè)中 IT 團(tuán)隊(duì)最耗時(shí)的任務(wù)。尤其注意自動化流程可取代的重復(fù)性任務(wù)。
從小處著手,逐步向外擴(kuò)展。查找 AIOps 可快速解決的最緊急問題。
盡量豐富為系統(tǒng)饋送的數(shù)據(jù)類型。
制定指標(biāo),幫助衡量 AIOps 投資的有效性。
AIOps 在現(xiàn)代化 IT 環(huán)境中的適用點(diǎn)
首次查看 AIOps 時(shí),您可能不會立即想到它如何適合您現(xiàn)有的工具類別。原因是它不能替代當(dāng)前的監(jiān)視、編排、支持服務(wù)或日志管理工具。相反,它牽涉所有領(lǐng)域和工具,在所有領(lǐng)域和工具中集成和使用信息。它輸出的信息還有助于了解每個(gè)工具的同步情況。
這些工具單獨(dú)來說,一個(gè)個(gè)本身都是有價(jià)值的。不過,工具之間的隔斷導(dǎo)致用戶無法適時(shí)訪問正確的信息。AIOps 靈活地將各種不全面視圖整合成綜合性視圖,從而有助于 ITOps 團(tuán)隊(duì)了解整體情況。
盡管 AIOps 與 ITOps 有云泥之別,但它并不是大數(shù)據(jù)和機(jī)器學(xué)習(xí)的首次應(yīng)用。當(dāng)股票經(jīng)紀(jì)人從手工交易轉(zhuǎn)向機(jī)器交易時(shí),他們也采用了類似的機(jī)械學(xué)習(xí)方法。社交媒體還長期在諸如 Google Maps、Yelp 和 Waze 之類的應(yīng)用程序或 eBay 和 Amazon 之類的在線市場中使用機(jī)器學(xué)習(xí)和分析。
這些技術(shù)在要求實(shí)時(shí)響應(yīng)不斷變化的條件和用戶定制需求的環(huán)境中,體現(xiàn)出了高度可靠性和廣泛有效性。
與機(jī)器學(xué)習(xí)技術(shù)相比,人工智能在 AIOps 中的應(yīng)用前景更大有可為。當(dāng)前,簡單的自動化或?qū)⒆詣踊c機(jī)器學(xué)習(xí)結(jié)合就能解決您當(dāng)下緊迫的用例。人工智能及其未來應(yīng)用場景仍在演變,未來可期。無論如何,企業(yè)務(wù)必在當(dāng)前存在的 ITOps 上打下堅(jiān)實(shí)的 AIOps 基礎(chǔ),然后在此基礎(chǔ)上開始實(shí)施人類行為建模。
ITOps 人員由于工作的保守性質(zhì),無法快速適應(yīng) AIOps 環(huán)境。他們的職責(zé)是確保業(yè)務(wù)照常運(yùn)行,維持企業(yè)基礎(chǔ)架構(gòu)的穩(wěn)定性。不過,隨著 AIOps 廣泛應(yīng)用的新興趨勢抬頭,越來越多的 ITOps 工作組不得不在短時(shí)間內(nèi)適應(yīng)新的 AIOps 技術(shù)和戰(zhàn)略。
結(jié)論
這份權(quán)威的 AIOps 指南將幫助您確定它對于貴公司的適用性,以及何時(shí)整合該技術(shù)以及以何種方式使用。除此之外,建議您關(guān)注 AIOps 的最新發(fā)展態(tài)勢。種種跡象表明,這項(xiàng)創(chuàng)新技術(shù)已蓄勢待發(fā)。
下載鏈接:
1、AIOPS在攜程的探索與實(shí)踐.pdf
2、HPC+AI融合計(jì)算.pdf
3、基于機(jī)器學(xué)習(xí)的智能運(yùn)維.pdf?
4、人工智能在運(yùn)維中的實(shí)踐.pdf?
5、容器下的AIOps架構(gòu)實(shí)踐.pdf?
6、數(shù)據(jù)驅(qū)動的智能運(yùn)維.pdf?
7、為AIOps的普及而重生的基礎(chǔ)監(jiān)控.pdf?
8、由AIOps提供支持的自動化運(yùn)營和更新.pdf
9、中國 IT 基礎(chǔ)架構(gòu)運(yùn)維市場研究報(bào)告.pdf
深度報(bào)告:RISC-V異構(gòu)IoT全新架構(gòu)
本號資料全部上傳至知識星球,更多內(nèi)容請登錄智能計(jì)算芯知識(知識星球)星球下載全部資料。

免責(zé)申明:本號聚焦相關(guān)技術(shù)分享,內(nèi)容觀點(diǎn)不代表本號立場,可追溯內(nèi)容均注明來源,發(fā)布文章若存在版權(quán)等問題,請留言聯(lián)系刪除,謝謝。
電子書<服務(wù)器基礎(chǔ)知識全解(終極版)>更新完畢,知識點(diǎn)深度講解,提供182頁完整版下載。
獲取方式:點(diǎn)擊“閱讀原文”即可查看PPT可編輯版本和PDF閱讀版本詳情。
溫馨提示:
請搜索“AI_Architect”或“掃碼”關(guān)注公眾號實(shí)時(shí)掌握深度技術(shù)分享,點(diǎn)擊“閱讀原文”獲取更多原創(chuàng)技術(shù)干貨。

