1  信息孤島的形成與弊端

  所謂的“信息孤島”,是指相互之間在功能上不關聯(lián)互助、信息不共享互換以及信息與業(yè)務流程和應用相互脫節(jié)的計算機應用系統(tǒng)。應當看到,在整個信息技術產業(yè)飛速發(fā)展過程中,企業(yè)的IT應用也伴隨著技術的發(fā)展而前進。但與企業(yè)的其它變革明顯不同的是,IT應用的變化速度更快,也就是說,企業(yè)進行的每一次局部的IT應用都可能與以前的應用不配套,也可能與以后的“更高級”的應用不兼容。因此,從產業(yè)發(fā)展的角度來看,信息孤島的產生有著一定的必然性。

  從企業(yè)的自身原因分析,前期的信息化建設大多缺乏長遠與統(tǒng)籌規(guī)劃,不同階段只考慮各種局部需求,造成了各種不同應用系統(tǒng)的盲目引進,如其中有上級部門下發(fā)推廣的,也有自行開發(fā)或合作開發(fā)引進的等渠道。由于大多數應用系統(tǒng)之間沒有統(tǒng)一的技術和數據標準,數據不能自動傳遞,缺乏有效的關聯(lián)和共享,從而形成一個個彼此隔離的信息孤島。

  信息孤島有“單項孤島”和“系統(tǒng)孤島”之分,它們的存在所帶來的弊端是顯而易見的。首先是導致信息的多口采集、重復輸入以及多頭使用和維護,信息更新的同步性差,從而影響了數據的一致性和正確性,并使企業(yè)的信息資源拆亂分散和大量冗余,信息使用和管理效率低下,且失去了統(tǒng)一的、準確的依據。其次是由于缺乏業(yè)務功能交互與信息共享,致使企業(yè)的物流、資金流和信息流的脫節(jié),結果造成賬賬不符、賬物不符,不僅難以進行準確的財務核算,而且難以對業(yè)務過程及業(yè)務標準實施有效監(jiān)控,導致不能及時發(fā)現經營管理過程中的問題,造成計劃失控、庫存過量、采購與銷售環(huán)節(jié)的暗箱操作等現象,給企業(yè)帶來無效勞動、資源浪費和效益流失等嚴重后果。再次是孤立的信息系統(tǒng)無法有效地提供跨部門、跨系統(tǒng)的綜合性信息,各類數據不能形成有價值的信息,局部的信息不能提升為管理知識,以致對企業(yè)的決策支持只能流于空談。同時由于企業(yè)信息孤島的存在,還將影響信息化的集團化、行業(yè)化應用。

  2  信息整合

  2.1信息整合的含義

  信息整合就是通過各種有效的手段和工具將已有信息集合在一起,生成滿足不同用戶需求的新的信息集合體,在已有信息的基礎上實現信息價值的增值。信息整合的目標是融合外部信息、消滅信息孤島、實現信息增值,提高信息的利用率。

  2.2 信息整合的作用與目標

 ?。?)信息整合可以使企業(yè)內分散的文件、技術資料、工程圖紙、設備圖片、新聞素材、音像資料、日常宣傳資料、規(guī)章制度等信息資源都被有效地管理起來,經過不斷的積累將成為企業(yè)資源,方便企業(yè)員工查詢。

 ?。?)信息整合可以使企業(yè)對有用信息資源實施有效管理;實現員工協(xié)同工作、應用系統(tǒng)協(xié)同工作;綜合、統(tǒng)一利用現有信息資源,提高數據使用率;為每個員工提供個性化信息平臺,管理自己需要的信息,提高工作效率。在不增加應用系統(tǒng)的前提下,提高信息系統(tǒng)的綜合效能。

 ?。?)信息整合以后,企業(yè)不必擔心不同應用系統(tǒng)、異構數據庫間的集成問題,可以分步推進企業(yè)信息化建設,在此進程中逐步提高企業(yè)自身的信息技術水平,進而增加對企業(yè)信息化建設的操控能力,選擇優(yōu)秀的產品和資質信譽好的集成商不斷推進企業(yè)信息化建設,避免一次性大量投資給企業(yè)帶來損失。另外,利用信息整合技術可以將企業(yè)已經建成的應用系統(tǒng)與新建成的應用系統(tǒng)集成到統(tǒng)一的企業(yè)信息平臺,不必因其軟件技術落后而淘汰它們,不必因更換應用軟件而再進行培訓,保護原有投資。

 ?。?)利用信息整合技術,可以將企業(yè)的信息資源有效管理和綜合利用,從而為企業(yè)領導提供定制信息、提供綜合經營報表、提供多種數據展現方式,為企業(yè)領導決策提供依據。

  通過信息整合,可以達到如下目標:

  (1)消除信息孤島,使企業(yè)信息系統(tǒng)形成互通互聯(lián)的整體

  (2)形成了各個應用系統(tǒng)的統(tǒng)一訪問入口

  (3)提供滿足信息安全的統(tǒng)一數據發(fā)布平臺

  (4)提供了已有業(yè)務系統(tǒng)升級的新手段

  (5)為建立企業(yè)決策系統(tǒng)提供了數據準備

  (6)解決了數據不規(guī)范、編碼不一致等問題

  (7)規(guī)范了信息模型,遵循國際標準

  (8)形成了“按需定制”的企業(yè)信息架構

  2.3信息整合的三個層面

 ?。?)數據整合

  數據是組成信息的基本元素,各種原始數據的積累與集中是一個組織機構開展業(yè)務的底層基礎,而這些數據大多數是由各種應用系統(tǒng)所生成的結構化數據。企業(yè)的結構化數據存放在各種不同的數據庫中,新增加的每個企業(yè)應用系統(tǒng)都會帶來一系列新的結構化數據。數據整合就是對分散異構的多數據源實現統(tǒng)一的訪問,實時地、智能地將有價值的數據傳遞給分析系統(tǒng)或其他應用系統(tǒng),進行信息的進一步加工。數據整合的目的是將不同的數據庫集成起來,提供一種單一的虛擬數據庫,這樣就不會出現與核心業(yè)務不一致的多個數據庫,保持應用軟件數據相互一致并與企業(yè)實際情況相符。

 ?。?)內容整合

  內容是指非結構化的信息,例如電子表格、文本文件、圖像、圖表、報告、音頻文件和視頻文件等。這類信息通常占企業(yè)信息的80%左右。在進行內容整合時,企業(yè)可以建立一個內容管理平臺,以提供對非結構化信息的管理功能。公司的文件、圖片、多媒體等辦公信息,搜索軟件搜索整理的信息,翻譯系統(tǒng)翻譯的信息等非結構化信息可以進入內容管理系統(tǒng)。內容管理系統(tǒng)對各類信息進行編、審、校等步驟,對各類信息進行分類管理,并控制信息的發(fā)布與訪問權限。

 ?。?)過程整合

  在數據整合與內容整合的基礎上,企業(yè)可以尋求業(yè)務過程的整合。過程整合能將企業(yè)規(guī)則和過程轉移到企業(yè)應用軟件以外,變成一種外在的過程和規(guī)則引擎。過程和企業(yè)規(guī)則的這種外在轉移增加了靈活性,從而可以對過程的改善或者新的商業(yè)機會做出更加有效的反應。最終,通過提高外在的和內在的過程自動化水平,可以提高過程執(zhí)行的整體效率,達到優(yōu)化過程的目的。

  信息整合主要的建設任務、用時估算及它們之間關系如圖1-1及其相關文字說明。

  

  Ⅰ:這個階段要做的是:對企業(yè)的業(yè)務、管理活動中發(fā)生的數據進行調研、分析、整理、提煉、描述出數據的構成。數據間層次結構、數據間相互關系,建立體系化數據資源體系的過程。是從企業(yè)數據流的視角對數據結構進行一個全面、系統(tǒng)的看待,最終形成標準總體框架(詳見后續(xù)章節(jié)的描述)、業(yè)務數據分類及數據管理技術架構等。主要解決“有哪些數據”、“數據之間什么關系”、采取怎樣的技術、方法和架構進行數據管理、共享的問題(這也反過來對標準框架的涉及產生影響)。 

  這部分工作一般是通過前期的咨或者可行性研究工作來完成。而且,只有在這部分工作完成后,后續(xù)工作才有了依據,招標中才可以明確地告訴投標人需要做什么。例如,如果在前期的工作中未形成標準總體框架,那么在招標中也就無法清晰地告訴投標人招標人具體地需要那些標準。投標人就會根據自己的經驗及對招標項目的理解給出解決方案—這往是不能達到用戶要求。投標報價也會相差較大,給評標帶來很大困難。

  Ⅱ:這個階段要做的是相關標準的制訂階段(詳細過程見后續(xù)章節(jié)),是一個相對規(guī)范的過程。這個階段的關鍵要點是:

  ? 在編制前面標準體系的基礎上,明確急需制定的一系列關鍵技術標準,包括數據管理的總體標準、數據標準、交換標準、技術規(guī)范和管理規(guī)范等

  ? 實現互聯(lián)互通、信息共享、業(yè)務協(xié)同、安全可靠運行的前提和基礎。這句話可以是所完成的標準化內容應達到驗收目標。判斷本項目工程標準質量好壞的唯一準則是該標準是否能夠正確地指導項目建設和運營維護,達到項目的建設目標。因此要把數據能否正確地進行共享與交換,業(yè)務處理是否正常,管理標準是否能夠確實指導、約束承建單位的行為,運營維護標準的實用性等方面作為質量標準,結合使用標準的參建單位和專家評審意見,最終確認工程標準的質量是否達到合同要求。

  ? 標準是否能夠正確地指導項目建設和運營維護,可以通過測試或者試點的方式進行,這兩種方式各有優(yōu)勢,可以根據用戶的實際情況進行選擇。

 ?、螅涸谇懊鎯蓚€階段的工作成果基礎上,根據標準規(guī)范中規(guī)定的總體框架和技術架構,建立統(tǒng)一的信息共享平臺,從技術層面上為整合各個部門的數據資源提供保證。信息共享平臺的建設可以在標準建設進行到一定階段(例如草案基本完成)的時候即可啟動,而不一定要等到標準經過評審甚至驗證后再進行—可以根據用戶的需要進行安排。

 ?、簦罕臼菍⑿枨笞?yōu)閷嶋H系統(tǒng)的最重要的部分,也是數據整合的關鍵點之一。在這里,共享數據庫(操作型數據)和數據倉庫建模和設計是重點,數據倉庫的建模和設計需要投入大量的技術經驗。數據倉庫內部的模型分為不同的層次,每個層次又采用不同的數據模型進行存儲。大體來說,數據倉庫基本分為兩個層次,一是數據登臺區(qū),二是星型模型區(qū),在這兩個區(qū)域用不同的數據模型進行存儲。一般數據登臺區(qū)基本采用和數據源相同的結構,也就是傳統(tǒng)的范式數據結構,而在星型模型區(qū)一般都是采用由維表和事實表構建的星型結構。

  將數據從原始的數據源之中抽取、轉換和加載也是在這個過程中進行的。ETL的設計開發(fā)就是用于對數據進行清洗,數據源有可能來至于各種業(yè)務系統(tǒng),也可能是系統(tǒng)之外的數據,這些數據以各種形式存儲,ETL的功能就是要將這些不同的數據源進行清洗流程整合到一個統(tǒng)一的數據倉庫中。

  數據清洗又稱為合并/凈化問題(merge/purge ):它涉及到記錄聯(lián)接(recordlinkage)、語義集成(semantic integration)、實例標識(instance identification),對象識別問題,數據清理目的就是要在數據中消除錯誤和不一致,并解決對象識別的問題。重復數據清理的公認的方法:對合并/凈化問題用基本的排序冷fl居方法進行解決的過程。

  清洗主要是針對系統(tǒng)的各個環(huán)節(jié)可能出現的數據二義性、重復、不完整、違反業(yè)務規(guī)則等問題,允許通過試抽取,將有問題的紀錄先剔除出來,根據實際情況調整相應的清洗操作。

  客戶數據清理的六個步驟:

  ? ? 元素化((elementizing):將數分解為最小的原子單元

  ? ? 標準化((standardizing):將縮寫,大小寫等都轉換為同一格式

  ? ? 校驗((verifying):利用規(guī)則或已有的數據集合驗證數據的有效性

  ? ? 匹配((matching):主要是判別冗余數據

  ? ? 戶主化((householding):主要是確定數據之間的聯(lián)系

  ? ? 文檔化(documenting):將清洗好的數據以同一的標準格式保存

 ?、酰哼@個階段對數據進行整體集成、在共享數據的基礎上,實現應用集成(操作型應用),對于分析型的應用,主要是設計和開發(fā)前端展現的程序,也就是要使用這個程序具將數據倉庫和多維數據庫中的數據展現出來。這個應用程序基本上分為兩種構架,一是CS方式,通過客戶端安裝軟件,server進行數據的存取,二是BS方式,通過瀏覽器如IE,對服務器的數據進行瀏覽分析。在數據倉庫開發(fā)的期初,數據倉庫主要應用于企業(yè)的內部,所以CS的方式應用較多,在隨著數據倉庫的發(fā)展,BS構架的應用越來越多應用于企業(yè)的商業(yè)分析之中。

責任編輯:admin