7月1日,寧夏銀行核心系統(tǒng)數(shù)據(jù)庫(kù)出現(xiàn)故障,導(dǎo)致該行存取款、轉(zhuǎn)賬支付、借記卡、網(wǎng)上銀行、ATM和POS業(yè)務(wù)中斷37小時(shí)40分鐘。16日,工商銀行由于網(wǎng)絡(luò)設(shè)備發(fā)生硬件故障導(dǎo)致銀證系統(tǒng)異常,部分銀證轉(zhuǎn)賬交易出現(xiàn)單邊賬現(xiàn)象。人們不禁要問(wèn),為何在信息化技術(shù)相對(duì)發(fā)達(dá)、一向重視安全的金融行業(yè)中,仍會(huì)頻頻出現(xiàn)宕機(jī)等問(wèn)題呢? 到底是什么阻礙了金融行業(yè)業(yè)務(wù)系統(tǒng)的高效運(yùn)行?我們又該如何去應(yīng)對(duì)?
銀行面臨運(yùn)維難題
金融機(jī)構(gòu)在搶占市場(chǎng)份額、擴(kuò)大客戶(hù)基礎(chǔ)、創(chuàng)新產(chǎn)品和業(yè)務(wù)模式的過(guò)程中,整個(gè)業(yè)務(wù)系統(tǒng)的組成也變得愈發(fā)復(fù)雜,從前端的網(wǎng)銀、外部系統(tǒng)到核心前置,乃至跟第三方的相連,其中涉及的服務(wù)器、主機(jī)、應(yīng)用、網(wǎng)絡(luò)系統(tǒng)越來(lái)越龐大,系統(tǒng)之間的耦合也越來(lái)越復(fù)雜,運(yùn)維難度明顯加大。另一方面,大集中給總行數(shù)據(jù)中心帶來(lái)的不僅是數(shù)據(jù)的大集合,還包括技術(shù)、人力,甚至業(yè)務(wù)的集合,由此帶來(lái)的運(yùn)維壓力可想而知。而金融機(jī)構(gòu)面向激烈的市場(chǎng)競(jìng)爭(zhēng)不得不做出應(yīng)用和業(yè)務(wù)變更,也成為了業(yè)務(wù)運(yùn)維低效的原因之一。
從運(yùn)維能力和運(yùn)維手段來(lái)看,系統(tǒng)之間業(yè)務(wù)上相互獨(dú)立,但維護(hù)上需要相互關(guān)聯(lián),而銀行目前的運(yùn)維是割裂的,不難想象各家自?huà)唛T(mén)前雪的結(jié)果將是網(wǎng)絡(luò)、應(yīng)用、數(shù)據(jù)庫(kù)、主機(jī)等“各自為陣”,一旦出現(xiàn)故障,各個(gè)系統(tǒng)之間的配合難以協(xié)調(diào)。從運(yùn)維人員來(lái)看,他們受制于缺乏業(yè)務(wù)知識(shí),排查故障往往需要首先弄清業(yè)務(wù)的網(wǎng)絡(luò)路徑,再挨個(gè)篩查對(duì)業(yè)務(wù)產(chǎn)生影響的應(yīng)用,導(dǎo)致故障處置周期長(zhǎng)、效率低,不能很好地滿(mǎn)足監(jiān)管機(jī)構(gòu)、銀行客戶(hù),乃至銀行自身的要求。由此看來(lái),支撐核心業(yè)務(wù)系統(tǒng)的網(wǎng)絡(luò)系統(tǒng)的運(yùn)維工作,包括網(wǎng)絡(luò)基礎(chǔ)設(shè)施、相關(guān)的應(yīng)用系統(tǒng)、數(shù)據(jù)庫(kù)以及安全保障系統(tǒng)的運(yùn)維已經(jīng)變成一個(gè)至關(guān)重要的工作,網(wǎng)絡(luò)系統(tǒng)的運(yùn)維必須和企業(yè)的核心業(yè)務(wù)活動(dòng)完全融合起來(lái)。金融機(jī)構(gòu)網(wǎng)絡(luò)運(yùn)維需要一種基于業(yè)務(wù)網(wǎng)絡(luò)的性能管理系統(tǒng),能讓網(wǎng)絡(luò)的運(yùn)維和業(yè)務(wù)的保障緊密結(jié)合起來(lái),幫助用戶(hù)提升以業(yè)務(wù)為核心的主動(dòng)網(wǎng)絡(luò)運(yùn)維能力,提升業(yè)務(wù)保障工作和故障處置的效率。
形勢(shì)嚴(yán)峻 亟需更專(zhuān)業(yè)的運(yùn)維手段
銀行要保證業(yè)務(wù)持續(xù)、高效運(yùn)行,有效的運(yùn)維平臺(tái)和工具必不可少。各個(gè)網(wǎng)絡(luò)設(shè)備廠商雖然在其網(wǎng)絡(luò)設(shè)備產(chǎn)品中集成了網(wǎng)絡(luò)管理的功能,但這些功能僅限于對(duì)自家產(chǎn)品進(jìn)行管理,對(duì)于其他廠家的設(shè)備則“愛(ài)莫能助”。面對(duì)現(xiàn)代眾多金融行業(yè)用戶(hù)的期望和需求,僅是對(duì)網(wǎng)絡(luò)設(shè)備進(jìn)行管理的網(wǎng)管系統(tǒng)已經(jīng)不合時(shí)宜,將服務(wù)器、網(wǎng)絡(luò)設(shè)備、中間件、數(shù)據(jù)庫(kù)等納入統(tǒng)一監(jiān)控才是用戶(hù)所需要的。另外,在我國(guó)強(qiáng)調(diào)自主可控的大論調(diào)下,國(guó)內(nèi)廠商跟國(guó)外廠商相比,能夠給用戶(hù)更多安心。但不論是國(guó)外廠商,還是國(guó)內(nèi)廠商,他們目前所提供的運(yùn)維產(chǎn)品內(nèi)容主要集中在ITIL流程管理、自動(dòng)化和綜合監(jiān)控等方面,其中綜合監(jiān)控主要是對(duì)應(yīng)用的監(jiān)控,需要開(kāi)發(fā),只能做到淺層次的結(jié)合??傮w來(lái)說(shuō),主要是以物理網(wǎng)絡(luò)作為運(yùn)行維護(hù)對(duì)象,而缺乏以業(yè)務(wù)網(wǎng)絡(luò)為對(duì)象的運(yùn)行維護(hù)模式??苼?lái)的業(yè)務(wù)性能管理解決方案則是圍繞業(yè)務(wù)系統(tǒng)進(jìn)行的主動(dòng)分析,能夠做到對(duì)業(yè)務(wù)網(wǎng)絡(luò)的實(shí)時(shí)監(jiān)控及迅速定位故障點(diǎn),幫助金融機(jī)構(gòu)建立高效的運(yùn)維系統(tǒng)。
當(dāng)金融機(jī)構(gòu)發(fā)生業(yè)務(wù)故障,它的根本需求即提高發(fā)現(xiàn)問(wèn)題、分析問(wèn)題、解決問(wèn)題的效率。根據(jù)《銀行業(yè)重要信息系統(tǒng)突發(fā)事件應(yīng)急管理規(guī)范(銀監(jiān)辦發(fā)【2008】53號(hào))》規(guī)定,銀行業(yè)金融機(jī)構(gòu)在一個(gè)省無(wú)法正常開(kāi)展業(yè)務(wù)半小時(shí)(含)以上便算作較大突發(fā)事件。“這意味著3個(gè)10分鐘,即第一個(gè)10分鐘內(nèi)知道是什么問(wèn)題,第二個(gè)10分鐘進(jìn)行討論、做出決策,最后10分鐘采取行動(dòng)。但實(shí)際情況往往是10分鐘內(nèi)不能發(fā)現(xiàn)問(wèn)題點(diǎn),最后10分鐘領(lǐng)導(dǎo)決定是否進(jìn)行切換或者重啟,而在不清楚問(wèn)題源頭的情況下就做出決定是非常冒險(xiǎn)的。”科來(lái)技術(shù)總監(jiān)高彥剛告訴記者,“科來(lái)的業(yè)務(wù)性能管理解決方案能做到在5分鐘內(nèi)定位故障點(diǎn),這對(duì)之后快速、準(zhǔn)確地解決問(wèn)題至關(guān)重要。”據(jù)悉,至今國(guó)外各大廠商的標(biāo)準(zhǔn)維護(hù)合同中絕大部分都沒(méi)有承諾修復(fù)時(shí)間。
科來(lái)業(yè)務(wù)性能管理 為業(yè)務(wù)運(yùn)維“保駕護(hù)航”
2009年,某銀行核心業(yè)務(wù)系統(tǒng)出現(xiàn)問(wèn)題,分行發(fā)生訪(fǎng)問(wèn)速度緩慢、交易堵塞等現(xiàn)象。在找不到問(wèn)題點(diǎn)的情況下,銀行決定進(jìn)行切備,根據(jù)切換后的結(jié)果,銀行判斷是主機(jī)出現(xiàn)了問(wèn)題,這時(shí),距離問(wèn)題發(fā)生早已超過(guò)了半小時(shí)。據(jù)相關(guān)人員介紹,科來(lái)進(jìn)行排查分析發(fā)現(xiàn),問(wèn)題在于數(shù)據(jù)中心的核心交換機(jī)的傳輸鏈路上出現(xiàn)丟包,針對(duì)此問(wèn)題的解決過(guò)程幾乎只用了“一杯茶”的時(shí)間。而銀行經(jīng)驗(yàn)主義的做法導(dǎo)致之前的整個(gè)決策鏈出現(xiàn)錯(cuò)誤,無(wú)法準(zhǔn)確、快速地定位問(wèn)題,解決問(wèn)題更是“無(wú)據(jù)可依”。
不同于其他廠商以物理網(wǎng)絡(luò)為對(duì)象的運(yùn)行維護(hù)模式,科來(lái)業(yè)務(wù)性能管理解決方案最大特色之一是以業(yè)務(wù)網(wǎng)絡(luò)為運(yùn)維對(duì)象。在部署之后系統(tǒng)會(huì)預(yù)先梳理各業(yè)務(wù)邏輯關(guān)系,建立支撐業(yè)務(wù)的應(yīng)用服務(wù)、主機(jī)系統(tǒng)、網(wǎng)絡(luò)路徑之間的關(guān)聯(lián)關(guān)系,再?lài)@業(yè)務(wù)系統(tǒng)部署分析設(shè)備,制定針對(duì)性的監(jiān)控分析策略和警報(bào)策略。數(shù)據(jù)上報(bào)至UPM分析中心后,對(duì)業(yè)務(wù)網(wǎng)絡(luò)的應(yīng)用響應(yīng)性能、主機(jī)服務(wù)性能、網(wǎng)絡(luò)傳輸性能和交易處理性能進(jìn)行智能化分析,提供集成的業(yè)務(wù)網(wǎng)絡(luò)性能監(jiān)控視圖(見(jiàn)圖1),把所有與業(yè)務(wù)相關(guān)聯(lián)的分析結(jié)果(如性能異常警報(bào)、關(guān)鍵性能指標(biāo)、多段數(shù)據(jù)對(duì)比等)集成到一起,進(jìn)行圖形化顯示和關(guān)聯(lián)挖掘,一旦發(fā)生異常,即使是不熟悉業(yè)務(wù)知識(shí)的運(yùn)維人員也能根據(jù)視圖快速定位問(wèn)題點(diǎn)?!邦A(yù)先的業(yè)務(wù)邏輯梳理和針對(duì)性的監(jiān)控分析,相當(dāng)于為金融機(jī)構(gòu)提供了定制化的解決方案?!备邚﹦傔@樣告訴記者。
圖 1
科來(lái)作為一家專(zhuān)注于網(wǎng)絡(luò)分析技術(shù)和產(chǎn)品研發(fā)10多年的企業(yè),其業(yè)務(wù)性能管理解決方案以最大提升業(yè)務(wù)網(wǎng)絡(luò)的運(yùn)維效率和故障處置能力為研發(fā)目標(biāo),在國(guó)內(nèi)多家大型金融機(jī)構(gòu)都有成功案例??苼?lái)的網(wǎng)絡(luò)分析技術(shù)服務(wù)于全球97個(gè)國(guó)家和地區(qū),超過(guò)87家財(cái)富500強(qiáng)企業(yè)都選擇了科來(lái)的產(chǎn)品。
在最后,高彥剛表示,“幫助客戶(hù)迅速、準(zhǔn)確地定位故障點(diǎn),保證業(yè)務(wù)持續(xù)高效運(yùn)行是科來(lái)帶來(lái)的價(jià)值,我們的產(chǎn)品和服務(wù)體現(xiàn)了科來(lái)‘為客戶(hù)創(chuàng)造價(jià)值’的理念?,F(xiàn)在金融機(jī)構(gòu)的業(yè)務(wù)系統(tǒng)和網(wǎng)絡(luò)的集成度越來(lái)越高。我們的目標(biāo)是融入用戶(hù)的業(yè)務(wù)網(wǎng)絡(luò)里(包括基礎(chǔ)網(wǎng)絡(luò)架構(gòu)、應(yīng)用、主機(jī)等),使用戶(hù)能夠?qū)γ恳粋€(gè)影響業(yè)務(wù)系統(tǒng)的網(wǎng)絡(luò)運(yùn)行環(huán)境進(jìn)行實(shí)時(shí)化、智能化分析,這是科來(lái)業(yè)務(wù)性能管理系統(tǒng)的基礎(chǔ),也是金融業(yè)網(wǎng)絡(luò)運(yùn)維的未來(lái)?!?/p>