2017年2月15日國(guó)脈發(fā)布了數(shù)據(jù)基因系統(tǒng),旨在為政府建立數(shù)據(jù)管理體系提供便捷、可靠的工具支撐,幫助政府梳理數(shù)據(jù)資產(chǎn)清單、統(tǒng)一數(shù)據(jù)口徑、建立數(shù)據(jù)標(biāo)準(zhǔn)、定位數(shù)據(jù)資源、分析資源關(guān)系、設(shè)計(jì)管理模型,從而更加有效的提升數(shù)據(jù)資產(chǎn)管理能級(jí),實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)服務(wù)創(chuàng)新。

 
  那么該如何理解數(shù)據(jù)基因?數(shù)據(jù)基因系統(tǒng)能解決哪些問(wèn)題??jī)r(jià)值究竟在哪里?本文從概念到問(wèn)題再到實(shí)際應(yīng)用場(chǎng)景,為大家詳細(xì)介紹數(shù)據(jù)基因系統(tǒng)。
 
  如何理解數(shù)據(jù)基因?
 
  DIKW體系認(rèn)為數(shù)據(jù)(Data)、信息(Information)、知識(shí)(Knowledge)和智慧(Wisdom)之間是層層遞進(jìn)的關(guān)系,從數(shù)據(jù)里挖到信息,從信息里得到知識(shí),從知識(shí)里獲取智慧。
 
表1.數(shù)據(jù)、信息、知識(shí)、智慧四者比較
 
  在這個(gè)金字塔體系中,我們認(rèn)為數(shù)據(jù)基因位于數(shù)據(jù)層和信息層,它賦予數(shù)據(jù)特定的含義,與數(shù)據(jù)一起構(gòu)成了我們認(rèn)知信息的基礎(chǔ)。
 
圖1.數(shù)據(jù)基因在DIKW體系中的位置
 
  實(shí)際上,我們認(rèn)為數(shù)據(jù)基因系統(tǒng)是管理系統(tǒng)的系統(tǒng),從業(yè)務(wù)出發(fā),到應(yīng)用系統(tǒng)、再到數(shù)據(jù)庫(kù)、數(shù)據(jù)表,甚至到驅(qū)動(dòng)服務(wù),是數(shù)據(jù)大管家,實(shí)現(xiàn)從管網(wǎng)絡(luò)、系統(tǒng)到管數(shù)據(jù)的躍遷。
 
  解決哪些問(wèn)題?
 

       · 缺乏完整、統(tǒng)一的信息資源體系

 
  目前各個(gè)地方開(kāi)展信息資源目錄體系建設(shè)工作,往往存在部門(mén)提供什么梳理什么,部門(mén)中很少存在某個(gè)人員完全掌握該部門(mén)信息資源,需不同科室之間進(jìn)行調(diào)研、梳理,通常存在不清楚自己部門(mén)到底有哪些、不清楚其他部門(mén)有哪些信息資源,缺乏完整、統(tǒng)一的信息資源體系。
 

      · 應(yīng)用系統(tǒng)建設(shè)分散、數(shù)據(jù)關(guān)系混雜

 
  各級(jí)地方政府和部門(mén)在開(kāi)展信息化建設(shè)時(shí)往往各自為政,各自建設(shè)應(yīng)用系統(tǒng),沒(méi)有構(gòu)建統(tǒng)一的基礎(chǔ)信息平臺(tái),形成了許多信息孤島。由于缺乏統(tǒng)一的信息系統(tǒng)建設(shè)標(biāo)準(zhǔn),造成各個(gè)信息系統(tǒng)的數(shù)據(jù)口徑不一致,系統(tǒng)、數(shù)據(jù)之間的關(guān)系不清楚,使整個(gè)信息系統(tǒng)構(gòu)架中數(shù)據(jù)的采集、存儲(chǔ)、交換、加工、利用等各部分間不能循環(huán)互動(dòng),系統(tǒng)中的數(shù)據(jù)無(wú)法有效共享,造成了信息資源利用率低。
 

         · 數(shù)據(jù)不一致、不準(zhǔn)確

 
  在以數(shù)據(jù)交換共享時(shí),遇到的最大問(wèn)題就是數(shù)據(jù)不一致和不準(zhǔn)確,舉幾個(gè)實(shí)際例子:
 
  1、某系統(tǒng)個(gè)人信息的姓名是20位,另一系統(tǒng)的姓名是30位,在數(shù)據(jù)同步的時(shí)候就會(huì)出現(xiàn)無(wú)法同步的問(wèn)題;
 
  2、一個(gè)系統(tǒng)數(shù)字0代表男、數(shù)字1代碼女、數(shù)字2是未知,另一個(gè)系統(tǒng)字母M代表男、字母F代碼女,這是一個(gè)代碼不一致問(wèn)題;
 
  3、在不同系統(tǒng)中存在“機(jī)構(gòu)名稱”、“單位名稱”、“公司名稱”,不知道是否為同一個(gè)含義;
 
  4、如果是同一個(gè)企業(yè),某個(gè)系統(tǒng)里面編碼是0001,另一個(gè)系統(tǒng)里是0002,其實(shí)代表的是同一條數(shù)據(jù)。
 

      · 數(shù)據(jù)標(biāo)準(zhǔn)管理框架缺失

 
  目前很多部門(mén)的應(yīng)用系統(tǒng)一般是建立在數(shù)據(jù)倉(cāng)庫(kù)或基礎(chǔ)數(shù)據(jù)庫(kù)基礎(chǔ)上,數(shù)據(jù)積累已有一定的規(guī)模。但由于缺乏統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范,同時(shí)缺乏數(shù)據(jù)基于業(yè)務(wù)的理解,導(dǎo)致新建或改造升級(jí)的系統(tǒng)建設(shè)缺乏標(biāo)準(zhǔn)先行的原則,難以實(shí)現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)“循序漸進(jìn)、不斷完善”的要求。
 
  數(shù)據(jù)基因系統(tǒng)的價(jià)值在哪里?

      · 快速建立信息資源體系
 
  數(shù)據(jù)基因系統(tǒng)對(duì)比篩選出城市核心業(yè)務(wù)部門(mén)的核心業(yè)務(wù)的信息資源建立整個(gè)信息資源體系建設(shè)的模板庫(kù),通過(guò)模板庫(kù)城市各單位可直接查閱相關(guān)數(shù)據(jù)元、信息資源模板,以直接沿用或是自定義修改的方式對(duì)模板進(jìn)行選擇性的編目,達(dá)到各部門(mén)政務(wù)信息資源快速梳理、信息資源體系快速架構(gòu)的目標(biāo)。

圖2.模板設(shè)計(jì)
 

          · 建立數(shù)據(jù)資產(chǎn)地圖

 
  數(shù)據(jù)基因系統(tǒng)通過(guò)對(duì)城市機(jī)房、服務(wù)器、應(yīng)用系統(tǒng)、數(shù)據(jù)庫(kù)等數(shù)據(jù)資產(chǎn)的梳理,建立部門(mén)數(shù)據(jù)資產(chǎn)清單,通過(guò)系統(tǒng)建立之間的相互關(guān)系,理清楚系統(tǒng)與系統(tǒng)之間、系統(tǒng)與數(shù)據(jù)庫(kù)、表之間、數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系,實(shí)現(xiàn)數(shù)據(jù)-數(shù)據(jù)表-數(shù)據(jù)庫(kù)-應(yīng)用系統(tǒng)-服務(wù)器-機(jī)房(云)的關(guān)系展現(xiàn),建立部門(mén)數(shù)據(jù)資產(chǎn)地圖。

圖3.資源關(guān)系分析
 

      · 輔助數(shù)據(jù)質(zhì)量問(wèn)題分析

 
  通過(guò)數(shù)據(jù)基因系統(tǒng)數(shù)據(jù)元池的建立,梳理分析各部門(mén)、各應(yīng)用系統(tǒng)中出現(xiàn)的相同的、近義的數(shù)據(jù)字段,通過(guò)分析其頻率、數(shù)據(jù)定義及數(shù)據(jù)相互之間關(guān)系(數(shù)據(jù)來(lái)源、數(shù)據(jù)流向等),了解各應(yīng)用系統(tǒng)之間數(shù)據(jù)標(biāo)準(zhǔn)體系的建設(shè)情況,輔助數(shù)據(jù)質(zhì)量問(wèn)題分析。

圖4.數(shù)據(jù)元關(guān)系分析
 

      · 輔助數(shù)據(jù)標(biāo)準(zhǔn)的落地

 
  通過(guò)對(duì)各部門(mén)、各應(yīng)用系統(tǒng)數(shù)據(jù)元池的清洗比對(duì),篩選出各部門(mén)共性、關(guān)鍵的主數(shù)據(jù),建立涉及核心數(shù)據(jù)的標(biāo)準(zhǔn)字段池,對(duì)字段的命名、格式、長(zhǎng)度等屬性進(jìn)行規(guī)范,依托標(biāo)準(zhǔn)數(shù)據(jù)元池進(jìn)行信息資源信息項(xiàng)的編目,嚴(yán)格控制新增字段,實(shí)現(xiàn)共性數(shù)據(jù)元的統(tǒng)一標(biāo)準(zhǔn)規(guī)范,推動(dòng)數(shù)據(jù)規(guī)范的落地執(zhí)行,建立數(shù)據(jù)模型標(biāo)準(zhǔn)化定義映射,推進(jìn)數(shù)據(jù)標(biāo)準(zhǔn)化規(guī)范的落地實(shí)施。

圖5.數(shù)據(jù)元池管理
 

      · 輔助系統(tǒng)開(kāi)發(fā)運(yùn)維

 
  數(shù)據(jù)基因系統(tǒng)提供相關(guān)數(shù)據(jù)庫(kù)、基礎(chǔ)庫(kù)、主題的模型設(shè)計(jì)功能,實(shí)現(xiàn)不同系統(tǒng)建設(shè)需求、應(yīng)用場(chǎng)景下,通過(guò)標(biāo)準(zhǔn)數(shù)據(jù)元池、信息資源的組合構(gòu)建應(yīng)用模型,圍繞構(gòu)建的模型可以實(shí)現(xiàn)快速構(gòu)建應(yīng)用系統(tǒng)數(shù)據(jù)表結(jié)構(gòu)設(shè)計(jì)。當(dāng)各部門(mén)新增需求或者系統(tǒng)上線維護(hù)后提出修改時(shí),可通過(guò)數(shù)據(jù)基因系統(tǒng)查看現(xiàn)有系統(tǒng)的結(jié)構(gòu),設(shè)計(jì)新的數(shù)據(jù)結(jié)構(gòu)或修改數(shù)據(jù)結(jié)構(gòu)來(lái)輔助系統(tǒng)開(kāi)發(fā)運(yùn)維。

圖6.模型設(shè)計(jì)服務(wù)
 
  總結(jié)
 
  目前隨著政務(wù)大數(shù)據(jù)的發(fā)展,政府對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化管理的需求正日益增加,未來(lái)數(shù)據(jù)基因系統(tǒng)將是連接業(yè)務(wù)、數(shù)據(jù)、系統(tǒng)與服務(wù)的核心基礎(chǔ)設(shè)施,可擴(kuò)展的數(shù)據(jù)基因系統(tǒng)將能夠產(chǎn)生更多更有價(jià)值的應(yīng)用場(chǎng)景。

作者:國(guó)脈信息資源研發(fā)中心副主任 王路燕
責(zé)任編輯:admin