ITIL4之問(wèn)題管理最佳實(shí)踐
目的和描述
問(wèn)題管理實(shí)踐的目的是通過(guò)查明事件的實(shí)際和潛在原因,以及管理臨時(shí)解決方案和已知錯(cuò)誤,減少事件發(fā)生的可能性及其影響。
沒(méi)有完美的服務(wù)。每個(gè)服務(wù)都存在可能導(dǎo)致事件的錯(cuò)誤或缺陷。錯(cuò)誤可能源于服務(wù)管理四維模型中的任何一個(gè)維度。例如,第三方合同中的錯(cuò)誤與組件故障一樣可能導(dǎo)致事件。許多錯(cuò)誤在服務(wù)上線之前就能被識(shí)別出來(lái),然后在設(shè)計(jì)、開(kāi)發(fā)或測(cè)試期間得到解決。但是,有一些仍未被發(fā)現(xiàn),將存在生產(chǎn)環(huán)境中,它們可能會(huì)導(dǎo)致事件產(chǎn)生。為了管理生產(chǎn)環(huán)境中出現(xiàn)的錯(cuò)誤,組織開(kāi)發(fā)了問(wèn)題管理實(shí)踐。該實(shí)踐旨在識(shí)別和分析組織產(chǎn)品中的錯(cuò)誤,以最大程度地減少其對(duì)所提供服務(wù)的負(fù)面影響。
1.術(shù)語(yǔ)和概念
可能導(dǎo)致(或已經(jīng)導(dǎo)致)事件的錯(cuò)誤稱為問(wèn)題。
定義:?jiǎn)栴}
一個(gè)或多個(gè)事件的原因或潛在原因。
問(wèn)題管理實(shí)踐有三個(gè)不同的階段,如圖2.1中所示。
圖2.1 問(wèn)題管理實(shí)踐的三個(gè)階段
1.1 問(wèn)題識(shí)別
有兩種主要方法來(lái)識(shí)別問(wèn)題。第一種方法是調(diào)查已經(jīng)發(fā)生的事件的原因。這種方法先要了解癥狀,再了解原因。它目的是防止事件再次發(fā)生,也可能有助于解決處于解決中的事件。這稱為被動(dòng)問(wèn)題管理,因?yàn)樗菍?duì)事件的被動(dòng)反應(yīng)。
第二種方法是在問(wèn)題導(dǎo)致事件發(fā)生之前識(shí)別到它,評(píng)估相關(guān)風(fēng)險(xiǎn),并優(yōu)化響應(yīng),以最小化事件發(fā)生的可能性和/或影響。這稱為主動(dòng)問(wèn)題管理,基于有關(guān)問(wèn)題的信息,尤其是在生產(chǎn)環(huán)境中可能存在的問(wèn)題。這些信息來(lái)源可能包括:
供應(yīng)商告知其產(chǎn)品中的漏洞
開(kāi)發(fā)人員、設(shè)計(jì)人員或測(cè)試人員在使用下一版本時(shí)發(fā)現(xiàn)生產(chǎn)版本中的錯(cuò)誤
用戶和專家社區(qū)分享其他組織的經(jīng)驗(yàn)
基礎(chǔ)設(shè)施的監(jiān)控發(fā)現(xiàn)系統(tǒng)性能中的偏差,但這些偏差還不屬于事件
技術(shù)審計(jì)和其他評(píng)估
問(wèn)題管理實(shí)踐總是被動(dòng)的對(duì)問(wèn)題作出反應(yīng):它不能防止問(wèn)題的第一次出現(xiàn)。主動(dòng)與被動(dòng)的區(qū)別是指問(wèn)題調(diào)查與事件之間的關(guān)系:
主動(dòng)問(wèn)題管理有助于預(yù)防事件第一次發(fā)生
被動(dòng)問(wèn)題管理有助于預(yù)防事件再次發(fā)生,并可能有助于解決進(jìn)行中的事件
1.2 問(wèn)題控制
問(wèn)題識(shí)別使得問(wèn)題被登記形成問(wèn)題記錄??赡苄纬梢幌盗写治鰡?wèn)題列表。已記錄的問(wèn)題將根據(jù)其最初的分類和優(yōu)先級(jí)進(jìn)行分析。問(wèn)題完成分析之后,問(wèn)題初始分類很可能會(huì)發(fā)生改變,特別是基于事件(癥狀)信息登記的問(wèn)題。
定義
任務(wù)優(yōu)先級(jí)是一個(gè)任務(wù)相較于其他任務(wù)的重要性。具有更高優(yōu)先級(jí)的任務(wù)應(yīng)優(yōu)先被處理。優(yōu)先級(jí)基于待辦事項(xiàng)中所有任務(wù)的情況來(lái)定義。無(wú)法為待辦事項(xiàng)中所有的任務(wù)分配資源時(shí),通過(guò)優(yōu)先級(jí)排序選擇優(yōu)先要處理的任務(wù)。
問(wèn)題控制專注于問(wèn)題的分析。在被動(dòng)問(wèn)題管理中,問(wèn)題分析可使用關(guān)于產(chǎn)品架構(gòu)和配置的信息來(lái)識(shí)別可能導(dǎo)致相關(guān)事件的配置項(xiàng)(CI)。分析不限于配置項(xiàng),還包括其它因素,例如:用戶行為、人為錯(cuò)誤和規(guī)程錯(cuò)誤等。
主動(dòng)問(wèn)題管理通常從更好地掌握配置項(xiàng)和服務(wù)管理四維模型中所有維度開(kāi)始,這些組件可能導(dǎo)致事件。例如,如果供應(yīng)商將其軟件中的漏洞告知組織,則問(wèn)題控制的任務(wù)將是掌握組織使用該軟件的情況,以便評(píng)估與漏洞相關(guān)的風(fēng)險(xiǎn)以及對(duì)所提供服務(wù)的潛在影響。
對(duì)問(wèn)題完成分析后,將為其分配為“ 已知錯(cuò)誤”狀態(tài)。
定義:已知錯(cuò)誤
已經(jīng)分析過(guò)但尚未解決的問(wèn)題。
問(wèn)題優(yōu)先級(jí)
問(wèn)題很多屬于低緊急度。服務(wù)團(tuán)隊(duì)有一些更緊迫的任務(wù)需要完成,使得緊急度低的問(wèn)題在待辦事項(xiàng)中總處于保持的狀況。但是,確保對(duì)識(shí)別到的問(wèn)題進(jìn)行分析和解決是非常重要的。從中長(zhǎng)期的角度來(lái)看,問(wèn)題既影響所提供的服務(wù)的質(zhì)量,也影響服務(wù)提供者的工作量。
問(wèn)題優(yōu)先級(jí)劃分有許多簡(jiǎn)單的準(zhǔn)則:
評(píng)估問(wèn)題的影響度和緊急度(以及調(diào)查和解決的時(shí)間限制),評(píng)估結(jié)果可用于確定優(yōu)先級(jí)和其他重要的考慮因素,例如,預(yù)估完成工作所需的時(shí)間
只有存在資源沖突時(shí)才需要確定優(yōu)先級(jí)。當(dāng)有足夠的資源在有限的時(shí)間內(nèi)處理每一項(xiàng)任務(wù)時(shí),優(yōu)先級(jí)排序不是必須的
應(yīng)該使用包含其他任務(wù)(計(jì)劃內(nèi)的和計(jì)劃外)的統(tǒng)一待辦事項(xiàng)來(lái)計(jì)劃問(wèn)題處理
優(yōu)先級(jí)排序是為團(tuán)隊(duì)內(nèi)部成員分配任務(wù)的一種工具。如果問(wèn)題由多個(gè)團(tuán)隊(duì)處理,則可根據(jù)每個(gè)團(tuán)隊(duì)的資源可用性、目標(biāo)完成時(shí)間以及預(yù)計(jì)處理時(shí)間來(lái)確定優(yōu)先級(jí)。
資源可用性和預(yù)計(jì)處理時(shí)間由團(tuán)隊(duì)定義。目標(biāo)完成時(shí)間取決于問(wèn)題的影響,當(dāng)問(wèn)題被確定并初步分類時(shí),它可能被定義。隨著問(wèn)題分析過(guò)程中發(fā)現(xiàn)新的信息,問(wèn)題的影響,預(yù)計(jì)完成(解決)時(shí)間可能會(huì)發(fā)生變化
可視化工具(例如,看板和精益原則,限制進(jìn)行中任務(wù)數(shù)量)有助于有效的優(yōu)先級(jí)排序
這些規(guī)則適用于服務(wù)提供者的專業(yè)團(tuán)隊(duì)執(zhí)行的所有類型的工作(計(jì)劃的和計(jì)劃外的)。重要的是,在所有實(shí)踐中涉及組織服務(wù)管理活動(dòng)的每個(gè)人都應(yīng)該同意并遵循它們。
這些規(guī)則適用于服務(wù)提供商的專家團(tuán)隊(duì)執(zhí)行的所有類型的工作(計(jì)劃的和計(jì)劃外的)。重要的是,在所有實(shí)踐中,參與組織服務(wù)管理活動(dòng)的每個(gè)人應(yīng)達(dá)成一致,并遵循它們。
問(wèn)題分析過(guò)程中可能會(huì)發(fā)現(xiàn)錯(cuò)誤已經(jīng)從組織的環(huán)境中消除,或者它們不會(huì)影響所提供的服務(wù)。根據(jù)上面的示例,組織可能未使用該軟件易受攻擊的版本,或者漏洞可能不會(huì)影響組織的服務(wù)。在這些情況下,問(wèn)題記錄經(jīng)過(guò)分析后可以設(shè)置為已關(guān)閉。在其他情況下,它可能保持處理狀態(tài),并啟動(dòng)錯(cuò)誤控制。
問(wèn)題控制其他的重要輸出可能是解決事件的建議。通常,了解導(dǎo)致事件的原因有助于,為處理事件提出更有效的解決方案,包括臨時(shí)解決方案。
定義:臨時(shí)解決方案
減少或消除尚未獲得永久解決方案的事件或問(wèn)題的影響的解決方案。一些臨時(shí)解決方案可以降低事件發(fā)生的可能性。
請(qǐng)注意,從問(wèn)題分析得出的臨時(shí)解決方案通常不會(huì)減少發(fā)生事件的可能性,而是,有助于在事件發(fā)生時(shí),更快、更好地解決事件。有助于防止事件再次發(fā)生的臨時(shí)解決方案通常在錯(cuò)誤控制階段被找到。
1.3 錯(cuò)誤控制
對(duì)問(wèn)題進(jìn)行分析后(如,產(chǎn)品中的錯(cuò)誤對(duì)組織自身服務(wù)的影響已經(jīng)被評(píng)估),應(yīng)該對(duì)其進(jìn)行控制。僅當(dāng)滿足以下條件之一時(shí),問(wèn)題記錄才可能關(guān)閉:
問(wèn)題被解決:與問(wèn)題相關(guān)事件的風(fēng)險(xiǎn)被移除,或降低到可接受的水平。
問(wèn)題不再影響組織。
請(qǐng)注意,盡管“ 已知錯(cuò)誤”是問(wèn)題的狀態(tài),但是某些組織更喜歡使用獨(dú)立的記錄來(lái)進(jìn)行問(wèn)題控制和錯(cuò)誤控制。在這些情況下,當(dāng)問(wèn)題分析完成時(shí),問(wèn)題記錄可能被關(guān)閉,并且隨后的活動(dòng)可能被登記到相關(guān)的已知錯(cuò)誤記錄中。上述關(guān)閉條件適用于已知錯(cuò)誤,無(wú)論它們是否是問(wèn)題。
如果許多已知錯(cuò)誤無(wú)法得到有效解決,并且它們會(huì)繼續(xù)影響服務(wù),那么它們將長(zhǎng)期處于未關(guān)閉狀態(tài)。在這些情況下,組織可能集中精力,最大程度地提高事件處理的效果和效率(有時(shí)達(dá)到完全自動(dòng)檢測(cè)和解決的水平),但問(wèn)題記錄應(yīng)保持未關(guān)閉狀態(tài),并定期進(jìn)行審查。
如果解決問(wèn)題的成本高于處理已知錯(cuò)誤或有效事件管理的成本時(shí),則上述錯(cuò)誤控制方法是有效的。這通常用于與第三方組件相關(guān)的典型問(wèn)題,尤其是在第三方無(wú)響應(yīng)或組件不受支持的情況下。相反,如果組件可用于改進(jìn)并可以進(jìn)行改進(jìn)時(shí)(特別是在組織自己控制下的軟件),則應(yīng)迅速消除已知錯(cuò)誤。
已知錯(cuò)誤是組織技術(shù)債務(wù)的一部分,應(yīng)在合理可行的情況下予以消除。
定義:技術(shù)債務(wù)
選擇臨時(shí)解決方案,而不是需要花費(fèi)更長(zhǎng)的時(shí)間的系統(tǒng)性解決方案。
錯(cuò)誤控制確保組織擁有與其產(chǎn)品相關(guān)的已知錯(cuò)誤有足夠的最新信息,包括它們的狀態(tài)及對(duì)服務(wù)的影響。
錯(cuò)誤控制對(duì)問(wèn)題解決方案進(jìn)行了優(yōu)化,使其成本、負(fù)面影響、正面影響相平衡。
定期檢查已知錯(cuò)誤有助于識(shí)別環(huán)境中的變化(例如,業(yè)務(wù)影響、永久解決方案的可用性和相關(guān)成本,以及資源可用性等),這些變化可能會(huì)導(dǎo)致對(duì)錯(cuò)誤的重新評(píng)估,并啟動(dòng)錯(cuò)誤的解決。
錯(cuò)誤控制的關(guān)鍵輸出是改進(jìn)措施和變更請(qǐng)求,它們啟動(dòng)問(wèn)題的解決。某些解決方案修復(fù)了配置項(xiàng)和其他產(chǎn)品組件中的錯(cuò)誤。其他的可能會(huì)引入永久的變通方法:對(duì)產(chǎn)品配置的更改不會(huì)修復(fù)錯(cuò)誤,但可以將事件發(fā)生的可能性降到最低,相關(guān)的問(wèn)題記錄可能會(huì)被關(guān)閉。保持錯(cuò)誤相關(guān)知識(shí)的可用性是很重要的,這些知識(shí)對(duì)于將來(lái)的服務(wù)設(shè)計(jì)以及規(guī)劃可能非常有價(jià)值。
永久性變通方法通常用于組織無(wú)法修復(fù)的組件(舊系統(tǒng)、第三方提供的工程基礎(chǔ)結(jié)構(gòu)等)。但是,使用永久性變通方法來(lái)防止事件會(huì)增加組織的技術(shù)債務(wù)。因此,應(yīng)盡可能避免使用。
總而言之,表2.1中列出了消減問(wèn)題的可能類型。
表 2.1 問(wèn)題消減的方法
1.4 問(wèn)題模型
不同的問(wèn)題來(lái)源和類型可能需要不同的方法來(lái)識(shí)別和控制問(wèn)題。例如,以下類型問(wèn)題中的一種或多種可能對(duì)問(wèn)題管理實(shí)踐需要特殊的處理方法。這些問(wèn)題包括以下方面:
軟件
硬件
程序
第三方組件
消費(fèi)者的資源
數(shù)據(jù)
數(shù)據(jù)與敏感信息相關(guān)
高度規(guī)范的服務(wù)和系統(tǒng)
為了優(yōu)化這些問(wèn)題和其他類型問(wèn)題的處理與解決,服務(wù)提供者通常定義問(wèn)題模型。問(wèn)題模型有助于有效地管理問(wèn)題,由于應(yīng)用程序相關(guān)的經(jīng)過(guò)驗(yàn)證和測(cè)試的方法,通常可以得到更好的結(jié)果。
定義模型
一種管理特定類型問(wèn)題的可重復(fù)方法。
問(wèn)題模型的創(chuàng)建和使用對(duì)于問(wèn)題管理實(shí)踐中的活動(dòng)很重要。它們將在第3節(jié)中進(jìn)行介紹。
1.5 范圍
問(wèn)題管理實(shí)踐的范圍包括:
問(wèn)題的識(shí)別與分析,包括已知錯(cuò)誤的分析與控制
啟動(dòng)變更以消除或減少問(wèn)題的影響
向干系人提供有關(guān)問(wèn)題信息
監(jiān)控錯(cuò)誤和持續(xù)改進(jìn)解決方法
有一些活動(dòng)和責(zé)任范圍不包括在問(wèn)題管理實(shí)踐中,盡管它們?nèi)匀慌c問(wèn)題密切相關(guān)。表2.2中列出了這些內(nèi)容,以及對(duì)可以找到它們的實(shí)踐的引用。重要的是要記住,ITIL實(shí)踐只是價(jià)值流的背景中使用的工具的集合,應(yīng)根據(jù)情況需要將它們組合在一起。
表2.2 與其他實(shí)踐指南中描述的問(wèn)題管理實(shí)踐相關(guān)的活動(dòng)
實(shí)現(xiàn)價(jià)值 | 實(shí)踐指南 |
事件解決 | 事件管理 |
控制和實(shí)現(xiàn)為解決問(wèn)題而啟動(dòng)的變更 | 變更啟動(dòng)部署管理 |
基礎(chǔ)設(shè)施和平臺(tái)管理發(fā)布管理 | |
軟件開(kāi)發(fā)和管理 | |
其他做法 | |
風(fēng)險(xiǎn)評(píng)估和控制 | 風(fēng)險(xiǎn)管理 |
檢測(cè)和控制產(chǎn)品在部署到運(yùn)行環(huán)境之前的錯(cuò)誤 | 部署管理服務(wù)設(shè)計(jì) |
服務(wù)驗(yàn)證和測(cè)試 | |
軟件開(kāi)發(fā)和管理 | |
溝通事件的解決方法給用戶 | 服務(wù)臺(tái) |
2 實(shí)踐成功因素
定義:實(shí)踐成功因素
達(dá)成實(shí)踐目標(biāo)所必須的一系列復(fù)雜功能組件
實(shí)踐成功因素(PSF)不僅是一個(gè)任務(wù)或活動(dòng),還包含所有服務(wù)管理思維模型組件。實(shí)踐中PSF的活動(dòng)和資源的性質(zhì)可能有所不同,但它們共同確保了實(shí)踐有效。
問(wèn)題管理實(shí)踐包含以下成功因素(PSF):
識(shí)別并了解問(wèn)題及其對(duì)服務(wù)的影響
優(yōu)化問(wèn)題解決和消解措施。
2.1 識(shí)別并理解問(wèn)題及其對(duì)服務(wù)的影響
組織應(yīng)該掌握其產(chǎn)品中的存在錯(cuò)誤。因?yàn)?,它們可能?dǎo)致事件并影響服務(wù)質(zhì)量和客戶滿意度。問(wèn)題管理實(shí)踐確保問(wèn)題被識(shí)別,從而有助于持續(xù)改進(jìn)的產(chǎn)品和服務(wù)。如果是主動(dòng)執(zhí)行而不是被動(dòng)執(zhí)行,這將更加有效。
2.2 優(yōu)化問(wèn)題解決和消解措施
發(fā)現(xiàn)問(wèn)題后,應(yīng)有效和高效地進(jìn)行處理。修復(fù)(消除)組織產(chǎn)品中的所有問(wèn)題幾乎是不可能的,但是,對(duì)于組織及其客戶而言,沒(méi)有解決方案的問(wèn)題識(shí)別,其價(jià)值就會(huì)大大降低。應(yīng)該為問(wèn)題消解定義一種平衡的方法,即一種考慮相關(guān)成本,風(fēng)險(xiǎn)和對(duì)服務(wù)質(zhì)量的影響的方法。
3. 關(guān)鍵指標(biāo)
ITIL實(shí)踐的績(jī)效應(yīng)在每種實(shí)踐所貢獻(xiàn)的價(jià)值流的背景下進(jìn)行評(píng)估。與任何工具的表現(xiàn)一樣,該實(shí)踐的表現(xiàn)只能在其應(yīng)用范圍內(nèi)評(píng)估。但是工具的設(shè)計(jì)和質(zhì)量會(huì)有很大差異,這些差異定義了不同用途下的潛力或能力。有關(guān)度量、績(jī)效(KPI)和其他有助于實(shí)現(xiàn)這一目標(biāo)的其他技術(shù),請(qǐng)參見(jiàn)《度量和報(bào)告實(shí)踐指南》。
問(wèn)題管理實(shí)踐的關(guān)鍵指標(biāo)已映射到其PSF。 它們可以用作價(jià)值流中的KPI,以評(píng)估實(shí)踐對(duì)這些價(jià)值流的有效性和效率的貢獻(xiàn)。 表2.3中給出了一些關(guān)鍵指標(biāo)的示例。
表2.3 實(shí)踐成功因素的關(guān)鍵指標(biāo)示例
將度量指標(biāo)正確匯總到復(fù)雜的指標(biāo)中,才更易于將數(shù)據(jù)用于正在進(jìn)行的價(jià)值流管理,更利于問(wèn)題管理實(shí)踐的定期評(píng)估和持續(xù)改進(jìn)。這并沒(méi)有單一的最佳解決方案。度量標(biāo)準(zhǔn)將基于組織的整體服務(wù)戰(zhàn)略和優(yōu)先級(jí),以及實(shí)踐貢獻(xiàn)的價(jià)值流的目標(biāo)。
4. 價(jià)值流和流程
4.1 價(jià)值流貢獻(xiàn)
與任何其他ITIL 管理實(shí)踐一樣,問(wèn)題管理實(shí)踐也有助于實(shí)現(xiàn)多個(gè)價(jià)值流。請(qǐng)謹(jǐn)記單一實(shí)踐不會(huì)形成價(jià)值流。問(wèn)題管理實(shí)踐與其他實(shí)踐相結(jié)合,可以為消費(fèi)者提供高質(zhì)量服務(wù)。實(shí)踐貢獻(xiàn)的主要價(jià)值鏈活動(dòng)是:
交付和支持
改進(jìn)
問(wèn)題管理實(shí)踐對(duì)服務(wù)價(jià)值鏈的貢獻(xiàn)如下圖片3.1 所示:
圖3.1 問(wèn)題管理實(shí)踐對(duì)價(jià)值鏈的貢獻(xiàn)的熱圖活動(dòng)
4.2 流程
每個(gè)實(shí)踐可能包含一個(gè)或多個(gè)流程和活動(dòng),它們對(duì)于實(shí)現(xiàn)該實(shí)踐的目的可能是必需的。
定義:流程
一組相互關(guān)聯(lián)或交互的活動(dòng),可將輸入轉(zhuǎn)化為輸出。一個(gè)流程接受一個(gè)或多個(gè)已定義的輸入并將其轉(zhuǎn)換為輸出。流程根據(jù)活動(dòng)的順序與依賴性定義次序。
問(wèn)題管理活動(dòng)分為四個(gè)過(guò)程:
主動(dòng)問(wèn)題識(shí)別
被動(dòng)式問(wèn)題標(biāo)識(shí)
問(wèn)題控制
錯(cuò)誤控制
4.2.1 主動(dòng)問(wèn)題識(shí)別
該流程包括表3.1中列出的活動(dòng),并將輸入轉(zhuǎn)換為輸出。
表3.1 主動(dòng)問(wèn)題標(biāo)識(shí)流程的輸入活動(dòng)和輸出
關(guān)鍵輸入 | 活動(dòng) | 關(guān)鍵輸出 |
來(lái)自供應(yīng)商和供應(yīng)商的錯(cuò)誤信息 有關(guān)專家團(tuán)隊(duì)提交的潛在錯(cuò)誤的信息 | 評(píng)審的提交信息 問(wèn)題登記 問(wèn)題的初步分類和分派
| 問(wèn)題記錄反饋給問(wèn)題發(fā)起者 |
外部用戶和專業(yè)團(tuán)體提交的有關(guān)潛在錯(cuò)誤的信息 | ||
用戶提交的有關(guān)潛在錯(cuò)誤的信息監(jiān)控?cái)?shù)據(jù) | ||
服務(wù)配置數(shù)據(jù) |
圖3.2 顯示了流程的工作流程圖。
圖3.2 主動(dòng)問(wèn)題識(shí)別流程的工作流程
主動(dòng)問(wèn)題用于識(shí)別到組織產(chǎn)品中存在的,來(lái)源于事件記錄以外的潛在錯(cuò)誤??梢钥紤]將問(wèn)題的主動(dòng)標(biāo)識(shí)和控制作為風(fēng)險(xiǎn)管理的一種形式執(zhí)行,即重點(diǎn)關(guān)注組織產(chǎn)品中的漏洞,它包括對(duì)漏洞和相關(guān)風(fēng)險(xiǎn)的識(shí)別、評(píng)估和分析。
表3.2 中列出了組織產(chǎn)品相關(guān)錯(cuò)誤可能的信息來(lái)源。
表3.2 主動(dòng)識(shí)別問(wèn)題的信息來(lái)源
主動(dòng)的風(fēng)險(xiǎn)管理活動(dòng)應(yīng)盡可能的專注于對(duì)組織及其客戶具有最大潛在影響的關(guān)鍵系統(tǒng)和組件。
然而,其他系統(tǒng)中錯(cuò)誤的跡象不應(yīng)被忽視。在為提高可用性而設(shè)計(jì)的復(fù)雜技術(shù)環(huán)境中,導(dǎo)致事件可能有多種原因,這些原因通常是各類因素組合后產(chǎn)生的結(jié)果。非核心系統(tǒng)中,看似不重要的錯(cuò)誤可能導(dǎo)致嚴(yán)重事件。主動(dòng)問(wèn)題識(shí)別應(yīng)包括對(duì)已識(shí)別漏洞的發(fā)生概率和影響進(jìn)行仔細(xì)評(píng)估。
表3.3提供了流程活動(dòng)的示例。
表3.3 主動(dòng)問(wèn)題識(shí)別過(guò)程的活動(dòng)
表3.3 主動(dòng)問(wèn)題識(shí)別過(guò)程的活動(dòng)
誰(shuí)可以登記問(wèn)題?
有幾種方法可以分配問(wèn)題登記的職責(zé)。一種方法是鼓勵(lì)每一位專家提出并登記問(wèn)題。這將增加改進(jìn)的數(shù)量,并提高組織產(chǎn)品中錯(cuò)誤的可見(jiàn)性。
但是,這可能會(huì)顯著增加登記問(wèn)題的數(shù)量,沒(méi)有人關(guān)注這些問(wèn)題,或者這些問(wèn)題被錯(cuò)誤地分類了。為防止這種情況發(fā)生,一些組織更愿意讓一個(gè)或多個(gè)角色負(fù)責(zé)對(duì)潛在問(wèn)題的初始篩選并進(jìn)行登記。只要角色中的人員擁有所需的資源,并且可以使來(lái)自各種來(lái)源的流程信息一致且透明地進(jìn)行,此方法就有效。
4.2.2 被動(dòng)問(wèn)題識(shí)別
該流程包括表3.4中列出的活動(dòng),并將輸入轉(zhuǎn)換為輸出。
表3.4 被動(dòng)問(wèn)題識(shí)別過(guò)程的輸入,活動(dòng)和輸出
關(guān)鍵輸入 | 活動(dòng) | 關(guān)鍵輸出 |
有關(guān)持續(xù)事件的信息 事件記錄和報(bào)告監(jiān)控?cái)?shù)據(jù) 服務(wù)配置數(shù)據(jù) 服務(wù)級(jí)別協(xié)議(SLA) | 問(wèn)題登記 問(wèn)題初步分類與分派 | 問(wèn)題記錄 |
被動(dòng)問(wèn)題識(shí)別過(guò)程的工作流程圖如下圖3.3所示:
被動(dòng)問(wèn)題識(shí)別使用過(guò)去或正在發(fā)生事件的相關(guān)信息來(lái)調(diào)查其原因。可能問(wèn)題是在診斷分析發(fā)生中事件的性質(zhì)遇到難題而觸發(fā)的。在這種情況下,問(wèn)題識(shí)別和控制可能很緊急,事件管理和問(wèn)題管理實(shí)踐在同一個(gè)價(jià)值流中,同時(shí),它們需要相同(或重疊)的資源,包括團(tuán)隊(duì),工具和過(guò)程。
基于對(duì)過(guò)去事件的分析時(shí),問(wèn)題的識(shí)別可能包括:基于各種角度的統(tǒng)計(jì)分析、影響分析和趨勢(shì)分析。這是為了識(shí)別具有可能的共同原因或其他相關(guān)性的一組事件。
過(guò)程隨觸發(fā)點(diǎn)不同而略有差異。表3.5中說(shuō)明了這些差異。
表3.5 被動(dòng)問(wèn)題識(shí)別過(guò)程的活動(dòng)
活動(dòng) | 由進(jìn)行中的事件觸發(fā) | 由事件記錄分析觸發(fā) |
問(wèn)題登記 | 處理該事件的團(tuán)隊(duì)確定需要進(jìn)行問(wèn)題調(diào)查。在某些情況下,問(wèn)題記錄與一個(gè)或多個(gè)事件記錄相關(guān)聯(lián),以便于跟蹤調(diào)查。當(dāng)多個(gè)地點(diǎn)的多個(gè)事件由不同的團(tuán)隊(duì)處理時(shí),需要進(jìn)行協(xié)同進(jìn)行問(wèn)題調(diào)查,或者由專門的團(tuán)隊(duì)進(jìn)行問(wèn)題調(diào)查時(shí),這一點(diǎn)可能尤為重要 在其他情況下,處理該事件的團(tuán)隊(duì)可以繼續(xù)調(diào)查事件的原因,并在事件解決后記錄問(wèn)題。這個(gè)問(wèn)題可能仍然需要登記,特別是導(dǎo)致事件的原因在事件解決過(guò)程中沒(méi)有得到消除,可能導(dǎo)致新的事件發(fā)生 | 負(fù)責(zé)系統(tǒng)、服務(wù)或生產(chǎn)的專家團(tuán)隊(duì)會(huì)定期檢查與其職責(zé)范圍相關(guān)的事件記錄。如果他們經(jīng)過(guò)分析發(fā)現(xiàn)了問(wèn)題,并進(jìn)行問(wèn)題記錄的登記。這些情況可能包括:
|
問(wèn)題初步分類與分派 | 登記問(wèn)題過(guò)程中,進(jìn)行問(wèn)題的初步分類。通常包括以下這些內(nèi)容(如果已知或合理假設(shè)):
如果問(wèn)題是在診斷分析之前進(jìn)行登記,則問(wèn)題將被分配給適當(dāng)?shù)膶<医M。 如果問(wèn)題在診斷分析之后登記,則信息應(yīng)用包括所做的步驟、結(jié)果和問(wèn)題的當(dāng)前狀態(tài)。如果在登記時(shí)問(wèn)題還沒(méi)有得到解決,則將其分配給適當(dāng)?shù)慕M。
| 登記問(wèn)題過(guò)程中,進(jìn)行問(wèn)題的初步分類。通常包括以下這些內(nèi)容(如果已知或合理假設(shè)):
根據(jù)初步的分類,將問(wèn)題分派到一個(gè)負(fù)責(zé)相關(guān)的配置、服務(wù)或產(chǎn)品的專家組
|
4.2.3 問(wèn)題控制
該流程專注于問(wèn)題的調(diào)查。它包括表3.6中所示的活動(dòng),并將輸入轉(zhuǎn)換為輸出。
表3.6 問(wèn)題控制過(guò)程的輸入活動(dòng)和輸出
關(guān)鍵輸入 | 活動(dòng) | 關(guān)鍵輸出 |
問(wèn)題記錄 服務(wù)配置數(shù)據(jù) 配置項(xiàng)、產(chǎn)品和服務(wù)等技術(shù)信息 事件記錄 監(jiān)控?cái)?shù)據(jù) | 問(wèn)題調(diào)查 已知錯(cuò)誤溝通 | 問(wèn)題記錄 已知錯(cuò)誤 事件解決方案 |
圖3.4顯示了問(wèn)題控制流程的工作流程圖。
圖3.4 問(wèn)題控制流程的工作流程
表3.7提供了流程活動(dòng)的示例。
表3.7 問(wèn)題控制流程的活動(dòng)
組織使用各種分析技術(shù)進(jìn)行問(wèn)題調(diào)查。這些可能包括:
根本因分析技術(shù),例如5 Whys分析法、K&F分析以及故障分析樹(shù)
影響分析技術(shù),例如組件失效影響分析、業(yè)務(wù)影響分析
風(fēng)險(xiǎn)分析技術(shù)。
記住以下一點(diǎn)很重要。單一根源的情況在復(fù)雜的、不斷發(fā)展的環(huán)境中具有非常有限的適用性。事件常常是由不可預(yù)料的因素經(jīng)過(guò)預(yù)料之外的組合后導(dǎo)致的。因此,對(duì)問(wèn)題的調(diào)查(尤其是在被動(dòng)問(wèn)題管理中)不應(yīng)僅限于確定事件的一項(xiàng)可能原因。問(wèn)題調(diào)查應(yīng)始終考慮整個(gè)服務(wù)管理四維模型??梢栽谘a(bǔ)充ITIL出版物中找到有關(guān)使用特定技術(shù)進(jìn)行問(wèn)題調(diào)查的進(jìn)一步指南。
4.2.4 錯(cuò)誤控制
這一過(guò)程的重點(diǎn)是監(jiān)測(cè)和控制已知錯(cuò)誤(已分析但尚未解決的問(wèn)題)的狀況及其解決方案。它有助于確保已知錯(cuò)誤對(duì)服務(wù)的負(fù)面影響得以掌握并使其最小化;有關(guān)事件的解決方案是有效的;已知錯(cuò)誤的緩解方法是有效的,可行且高效的。
該流程包括表3.8中所示的活動(dòng),并將輸入轉(zhuǎn)換為輸出。
表3.8 錯(cuò)誤控制的輸入活動(dòng)和輸出流程
關(guān)鍵輸入 | 活動(dòng) | 關(guān)鍵輸出 |
問(wèn)題記錄 服務(wù)配置數(shù)據(jù) 配置項(xiàng)、產(chǎn)品和服務(wù)等技術(shù)信息 事件記錄 監(jiān)控?cái)?shù)據(jù) 知識(shí)管理數(shù)據(jù) | 問(wèn)題解決方案開(kāi)發(fā) 問(wèn)題解決啟動(dòng) 已知錯(cuò)誤監(jiān)控和檢查 問(wèn)題關(guān)閉 | 問(wèn)題記錄 問(wèn)題型號(hào) 變更請(qǐng)求 改進(jìn)計(jì)劃 問(wèn)題解決方案 |
圖3.5顯示了流程的工作流程圖。
圖3.5 錯(cuò)誤控制的工作流程
表3.9提供了流程活動(dòng)的示例。
表3.9 錯(cuò)誤控制的活動(dòng)流程
活動(dòng) | 描述 |
問(wèn)題解決方案開(kāi)發(fā) | 團(tuán)隊(duì)(根據(jù)問(wèn)題調(diào)查進(jìn)行分配或重新分配)尋找解決問(wèn)題的方法。這包括定義消解方法(請(qǐng)參見(jiàn)表2.1)和所選方法中的實(shí)際解決方案開(kāi)發(fā)。如果沒(méi)有針對(duì)問(wèn)題的可行解決方案,則會(huì)記錄支持信息,并且定期評(píng)審錯(cuò)誤。 |
啟動(dòng)問(wèn)題解決 | 在大多數(shù)情況下,問(wèn)題需要通過(guò)變更解決。負(fù)責(zé)的團(tuán)隊(duì)按照組織初始化和實(shí)現(xiàn)變更的程序,提交變更請(qǐng)求。 在其他情況下,所需的操作不歸類為變更,可以按照其他過(guò)程來(lái)啟動(dòng)和執(zhí)行。無(wú)論哪種方式,團(tuán)隊(duì)都會(huì)啟動(dòng)已定義(如果需要的話,已批準(zhǔn))問(wèn)題解決所需的操作??赡苄枰韵嚓P(guān)理由支持(包括財(cái)務(wù)、風(fēng)險(xiǎn)、合規(guī)性、技術(shù)和其他注意事項(xiàng))。 |
已知錯(cuò)誤監(jiān)控和評(píng)審 | 如果已知錯(cuò)誤的解決方案得到批準(zhǔn) 使用預(yù)先商定的標(biāo)準(zhǔn)控制和確認(rèn)解決方案的實(shí)施。這通常由發(fā)起解決方案的團(tuán)隊(duì),或其他預(yù)先約定的角色,如由問(wèn)題經(jīng)理來(lái)完成。 對(duì)于被動(dòng)識(shí)別的問(wèn)題,可以根據(jù)事件動(dòng)態(tài)的變化(解決或預(yù)防相關(guān)事件)來(lái)完成。對(duì)于主動(dòng)識(shí)別的問(wèn)題,解決控制基于已發(fā)起變更是否成功,并可能包括一段時(shí)間來(lái)監(jiān)控可能受到錯(cuò)誤影響的服務(wù)。如果問(wèn)題的解決方案沒(méi)有得到確認(rèn),團(tuán)隊(duì)則返回到該過(guò)程的問(wèn)題解決方案開(kāi)發(fā)步驟。 如果找不到針對(duì)已知錯(cuò)誤的可行解決方案 指定專家團(tuán)隊(duì)對(duì)已知錯(cuò)誤進(jìn)行監(jiān)控。這通常是負(fù)責(zé)與已知錯(cuò)誤關(guān)聯(lián)的配置項(xiàng)、服務(wù)或產(chǎn)品的團(tuán)隊(duì)。該團(tuán)隊(duì)按照消解策略中定義的方式的監(jiān)控已知錯(cuò)誤的狀況。監(jiān)控的參數(shù)可能包括:
團(tuán)隊(duì)?wèi)?yīng)定期進(jìn)行問(wèn)題審查(根據(jù)商定的消解方法),或基于監(jiān)控結(jié)果進(jìn)行問(wèn)題審查。 如果評(píng)審確認(rèn)消解方法有效且是最新的(問(wèn)題存在,最新影響評(píng)估,事件解決方案有效,問(wèn)題變通方案有效且沒(méi)有可行的問(wèn)題修復(fù)程序方案可用),那么繼續(xù)進(jìn)行已知錯(cuò)誤的監(jiān)控。 如果消解方法變得無(wú)效,則啟動(dòng)問(wèn)題解決方案開(kāi)發(fā)活動(dòng)來(lái)審查和重新定義消解方法。這可能包括開(kāi)發(fā)和實(shí)現(xiàn)一個(gè)問(wèn)題解決方案或更新相關(guān)事件的事件解決方案。 如果問(wèn)題不再存在(例如,已通過(guò)計(jì)劃的軟件或硬件更新或通過(guò)停用受影響的配置項(xiàng)將其移出),則啟動(dòng)問(wèn)題關(guān)閉。 如果問(wèn)題出現(xiàn)了一個(gè)新?tīng)顩r,建議修改或創(chuàng)建問(wèn)題模型,并將問(wèn)題模型將作為問(wèn)題評(píng)審活動(dòng)的一部分進(jìn)行記錄和交流。 基于監(jiān)控?cái)?shù)據(jù)更新問(wèn)題記錄。 |
問(wèn)題關(guān)閉 | 負(fù)責(zé)問(wèn)題的團(tuán)隊(duì)(或?qū)<遥┯涗泦?wèn)題評(píng)審結(jié)果并正式關(guān)閉問(wèn)題記錄。 如果確認(rèn)解決,則團(tuán)隊(duì)記錄解決控制結(jié)果并正式關(guān)閉問(wèn)題記錄。已關(guān)閉問(wèn)題記錄應(yīng)作為組織的知識(shí)庫(kù)的一部分,尤其是如果有類似的 問(wèn)題可能會(huì)再次發(fā)生。 |
問(wèn)題管理活動(dòng)由服務(wù)提供者執(zhí)行,如表3.3、3.5、3.7和3.9中所述。他們可能涉及供應(yīng)商和合作伙伴,甚至有時(shí)還涉及客戶和用戶。這些活動(dòng)可以利用工具和技術(shù)支持開(kāi)展(有時(shí)甚至是全自動(dòng)化或很高程度的自動(dòng)化)。這些將在以下部分中進(jìn)行闡述。
5. 組織和人員
5.1 角色,能力和責(zé)任
實(shí)踐指南沒(méi)有描述實(shí)踐管理的角色,例如實(shí)踐負(fù)責(zé)人,實(shí)踐主管或?qū)嵺`教練。相反,他們專注于每個(gè)實(shí)踐的專家角色。組織不同,每個(gè)角色的結(jié)構(gòu)和命名也可能不同,因此ITIL中定義的任何角色都不應(yīng)被視為強(qiáng)制性的,甚至不應(yīng)被視為推薦性的。請(qǐng)記住角色不是職務(wù)。一個(gè)人可以擔(dān)任多個(gè)角色,一個(gè)角色也可以分配給多個(gè)人。
角色是關(guān)聯(lián)到流程和活動(dòng)中來(lái)描述的。每個(gè)角色都具有基于表4.1中所示的模型的能力概況特征。
表4.1 能力代碼和描述
能力代碼 | 能力概況(活動(dòng)和技能) |
L | 領(lǐng)導(dǎo)者 決策、授權(quán)、監(jiān)督其他活動(dòng),激勵(lì)團(tuán)隊(duì),提供動(dòng)力以及評(píng)估結(jié)果 |
A | 管理員 分配任務(wù)并確定優(yōu)先級(jí),保留記錄,持續(xù)報(bào)告并啟動(dòng)基本的改進(jìn) |
C | 協(xié)調(diào)員/溝通者 多方協(xié)調(diào),維護(hù)干系人之間的溝通,并負(fù)責(zé)有關(guān)認(rèn)知的宣傳活動(dòng) |
M | 方法和技術(shù)專家 設(shè)計(jì)和實(shí)施技術(shù)工作,編織規(guī)范文檔,提供流程、工作分析和持續(xù)改進(jìn)的咨詢 |
T | 技術(shù)專家 提供技術(shù)(IT)專業(yè)知識(shí),并執(zhí)行基于專業(yè)知識(shí)的任務(wù) |
在組織中可以設(shè)定兩個(gè)實(shí)踐特定的角色:?jiǎn)栴}經(jīng)理和問(wèn)題協(xié)調(diào)人。這些角色通常在問(wèn)題數(shù)量很多的組織中引入。在其他組織中,問(wèn)題管理活動(dòng)由負(fù)責(zé)與問(wèn)題關(guān)聯(lián)配置項(xiàng)的服務(wù)或產(chǎn)品的個(gè)人或團(tuán)隊(duì)協(xié)調(diào)。,可能是資源所有者,服務(wù)負(fù)責(zé)人或產(chǎn)品負(fù)責(zé)人。
5.1.1 問(wèn)題經(jīng)理角色
在定義專門的問(wèn)題經(jīng)理角色的情況下,通常將其分配給專家,這些專家結(jié)合了組織產(chǎn)品(架構(gòu),配置和相互依賴性)的豐富知識(shí)以及扎實(shí)的分析技能(協(xié)調(diào)團(tuán)隊(duì)合作并提供出色風(fēng)險(xiǎn)管理的能力和權(quán)威)。該角色的能力概要是TMAC。角色通常負(fù)責(zé)管理和協(xié)調(diào)問(wèn)題管理流程中的專家活動(dòng),包括:
根據(jù)提交的信息進(jìn)行和協(xié)調(diào)問(wèn)題登記
問(wèn)題的初步分類
與負(fù)責(zé)事件解決和變更實(shí)施的團(tuán)隊(duì)協(xié)調(diào)溝通
開(kāi)發(fā)和交流問(wèn)題模型(如適用)
協(xié)調(diào)已知錯(cuò)誤監(jiān)視和評(píng)審
問(wèn)題規(guī)范的關(guān)閉
5.1.2 問(wèn)題協(xié)調(diào)人角色
在較復(fù)雜的組織中,問(wèn)題管理實(shí)踐的某些職責(zé)可以委托給問(wèn)題協(xié)調(diào)人。問(wèn)題協(xié)調(diào)人專注規(guī)范的問(wèn)題管理,例如,對(duì)提交的關(guān)于可能出現(xiàn)的問(wèn)題的信息評(píng)審、問(wèn)題評(píng)審和問(wèn)題關(guān)閉。
5.2 組織結(jié)構(gòu)和團(tuán)隊(duì)
盡管問(wèn)題管理的角色有時(shí)與正式職稱相關(guān)聯(lián),但問(wèn)題管理實(shí)踐的專用組織結(jié)構(gòu)卻很少見(jiàn)。這對(duì)于具有復(fù)雜官僚機(jī)構(gòu)和大量需要管理的問(wèn)題的組織來(lái)說(shuō)是典型的。許多組織發(fā)現(xiàn)組建臨時(shí)團(tuán)隊(duì)調(diào)查影響度高的問(wèn)題和/或開(kāi)發(fā)解決方案很有用。
在以產(chǎn)品為中心的組織中,通常不采用問(wèn)題管理工作的頭銜和角色。相反,這種實(shí)踐被集成到產(chǎn)品開(kāi)發(fā)和管理團(tuán)隊(duì)的日?;顒?dòng)中。它在任何可能的地方都是自動(dòng)化的。
若需要ITIL4問(wèn)題管理完整實(shí)踐資料,請(qǐng)點(diǎn)擊右上角注冊(cè)賬號(hào)后向客服索?。?/p>
永服科技有限公司(簡(jiǎn)稱“Servicehot”),運(yùn)用ITIL、ISO20000、ITSS等最佳實(shí)踐方法,結(jié)合ServiceHot在國(guó)內(nèi)外眾多行業(yè)客戶的IT服務(wù)管理、信息安全管理方面的成功實(shí)施經(jīng)驗(yàn),協(xié)助客戶梳理并建設(shè)IT管理體系,推動(dòng)企業(yè)數(shù)字化轉(zhuǎn)型,ServiceHot產(chǎn)品在數(shù)以百計(jì)的大型的國(guó)企、制造業(yè)、金融、IT互聯(lián)網(wǎng)等行業(yè)完成了實(shí)際的應(yīng)用和推廣,主要案例包括:XX省農(nóng)信、建信基金、中原銀行、國(guó)信證券、四川長(zhǎng)虹、一汽啟明、中國(guó)移動(dòng)、中國(guó)石化、華為、深信服、中航西飛、中航成飛、深圳航空、富力集團(tuán)、華西醫(yī)院、西南民族大學(xué)、瀘州老窖、天原集團(tuán)等。