2017年7月26日下午,“2017政務(wù)數(shù)據(jù)治理與創(chuàng)新高端研討會(huì)”在北京梅地亞中心多功能廳隆重召開。本次研討會(huì)由中國(guó)信息通信研究院、中國(guó)社科院信息化研究中心、國(guó)脈數(shù)據(jù)研究院聯(lián)合主辦。國(guó)脈海洋常務(wù)副總經(jīng)理王路燕出席會(huì)議并發(fā)布了《國(guó)脈數(shù)據(jù)基因3.0產(chǎn)品》,這也是本次研討會(huì)的一大亮點(diǎn),她提出數(shù)據(jù)基因3.0能夠?qū)崿F(xiàn)資源匹配、事項(xiàng)標(biāo)準(zhǔn)化、考核評(píng)估扥功能,同時(shí)通過(guò)配置事實(shí)目錄,更新理想目錄,促進(jìn)政務(wù)數(shù)據(jù)治理與創(chuàng)新。

image.png

國(guó)脈海洋常務(wù)副總經(jīng)理王路燕

  以下是會(huì)議現(xiàn)場(chǎng)發(fā)言實(shí)錄:

  尊敬的各位來(lái)賓下午好,在這里分享一下國(guó)脈政府?dāng)?shù)據(jù)資產(chǎn)管理的經(jīng)驗(yàn),剛才也聽了多位專家關(guān)于大數(shù)據(jù)具體應(yīng)用的觀點(diǎn),數(shù)據(jù)基因產(chǎn)品作為底層基礎(chǔ)性工作,主要做信息資源梳理、規(guī)范化等工作。

  先解釋下“數(shù)據(jù)基因”名字的由來(lái)。該詞來(lái)源于生物上的基因,生物學(xué)中的基因是由四個(gè)堿基構(gòu)成,這些堿基可以形成復(fù)雜的DNA,而數(shù)據(jù)基因是由0和1構(gòu)成,通過(guò)不同組合,可以表達(dá)很多不同的信息,這就是生物基因與數(shù)據(jù)基因的共同之處。

  數(shù)據(jù)基因,一方面表達(dá)了數(shù)據(jù)的具體特性,另一方面描述了不同數(shù)據(jù)之間的關(guān)聯(lián)以及從舊數(shù)據(jù)到新數(shù)據(jù)的進(jìn)化。

  在數(shù)據(jù)基因產(chǎn)品從1.0(2017年2月15日正式發(fā)布)到3.0的發(fā)展過(guò)程中,國(guó)家不斷推出新的政策文件,并開展了政務(wù)信息資源目錄國(guó)家試點(diǎn)工作。我們緊緊圍繞這些變化并結(jié)合實(shí)踐工作來(lái)完善數(shù)據(jù)基因產(chǎn)品。數(shù)據(jù)基因產(chǎn)品從1.0到2.0只用了短短兩個(gè)月,而3.0 是隔了半年才推出的,我們充分結(jié)合了各地的實(shí)踐工作,該產(chǎn)品不是僅僅提出概念化的東西,還有各地經(jīng)驗(yàn)的匯總。

  一、三個(gè)版本發(fā)展歷程

  (1)數(shù)據(jù)基因1.0:資源模板、資產(chǎn)登記。我們首次提出“資源模板”。

  (2)數(shù)據(jù)基因2.0:資產(chǎn)普查、數(shù)據(jù)元標(biāo)準(zhǔn)化、資產(chǎn)地圖、公共數(shù)據(jù)字段池、數(shù)據(jù)模型。

  (3)數(shù)據(jù)基因3.0:數(shù)據(jù)元標(biāo)注、事項(xiàng)梳理、數(shù)據(jù)治理、理想目錄與事實(shí)目錄。“理想目錄與事實(shí)目錄”是數(shù)據(jù)基因3.0的新特點(diǎn)。

  二、應(yīng)用案例

 ?。?)淮安市信息資源梳理

  這是第一個(gè)落地應(yīng)用的數(shù)據(jù)基因案例。借助信息資源模板,在一個(gè)月內(nèi)快速梳理出淮安全市82個(gè)部門的信息資源,通過(guò)數(shù)據(jù)基因系統(tǒng),由各部門進(jìn)行核實(shí)、確認(rèn),快速建立全市信息資源體系。

 ?。?)浙江省全口徑公共數(shù)據(jù)資源梳理

  這也叫“公共數(shù)據(jù)資源梳理”,因?yàn)樗€包括企事業(yè)單位,并非只包括政府單位,其范圍很大。依托17年電子政務(wù)項(xiàng)目預(yù)審的工作,開展全省項(xiàng)目獨(dú)立預(yù)審單位的信息系統(tǒng)普查、“全省最多跑一次”事項(xiàng)普查(責(zé)任清單、權(quán)力清單)、信息系統(tǒng)實(shí)有數(shù)據(jù)普查等,同時(shí)借助系統(tǒng)開展事項(xiàng)標(biāo)準(zhǔn)、數(shù)據(jù)標(biāo)準(zhǔn)等工作。

  (3)貴州省數(shù)據(jù)資產(chǎn)登記

  根據(jù)《貴州省政府?dāng)?shù)據(jù)資產(chǎn)管理登記暫行辦法》,開展貴州數(shù)據(jù)資產(chǎn)登記工作,對(duì)信息系統(tǒng)、硬件資產(chǎn)、軟件資產(chǎn)、數(shù)據(jù)資產(chǎn)(圍繞管理、保存、存儲(chǔ)等角度)進(jìn)行梳理,同時(shí)建立系統(tǒng)、硬件、軟件、數(shù)據(jù)之間的關(guān)系圖譜。除此之外,還有海南、四川、廣東、寧夏等省。

  三、數(shù)據(jù)基因3.0新功能和新價(jià)值

  1.資源匹配

  這也是數(shù)據(jù)基因3.0不同于數(shù)據(jù)基因2.0的地方。其應(yīng)用主要包括模板匹配、數(shù)據(jù)元標(biāo)注、標(biāo)簽化、預(yù)設(shè)模型等四個(gè)方面。

 ?。?)模板匹配

  系統(tǒng)上擁有豐富的模板資源,現(xiàn)在有省、市級(jí)部門各70個(gè),標(biāo)準(zhǔn)化數(shù)據(jù)元10000項(xiàng),核心數(shù)據(jù)集2000個(gè)?;谶@些模板資源,部門登錄后,系統(tǒng)可進(jìn)行自定匹配,推送本部門的資源模板。用戶也可以采用訂閱模式,訂閱某類資源模板。

  借助關(guān)聯(lián)導(dǎo)入功能,以任何一個(gè)結(jié)點(diǎn)為單位,能夠建立數(shù)據(jù)元、數(shù)據(jù)集、業(yè)務(wù)事項(xiàng)之間的管理,并能以任何一個(gè)為單位進(jìn)行關(guān)聯(lián)。

 ?。?)數(shù)據(jù)元標(biāo)注

  從業(yè)務(wù)、系統(tǒng)抽取過(guò)來(lái)的數(shù)據(jù)項(xiàng),可進(jìn)行匹配設(shè)置,根據(jù)匹配規(guī)則在數(shù)據(jù)元模板中依據(jù)中英文名稱進(jìn)行快速精準(zhǔn)匹配。完全匹配上的可直接填充模板中的數(shù)據(jù)元相關(guān)內(nèi)容,明確數(shù)據(jù)元數(shù)據(jù)類型、長(zhǎng)度、精度等描述。具體包括以下幾點(diǎn):

  一是規(guī)則制定。模板資源中擁有數(shù)據(jù)元近20000條,采集了公安、衛(wèi)生、交通、民政等領(lǐng)域的數(shù)據(jù)元標(biāo)準(zhǔn)。

  二是精準(zhǔn)匹配。對(duì)業(yè)務(wù)、系統(tǒng)產(chǎn)生的數(shù)據(jù)元進(jìn)行匹配設(shè)置,可快速在模板庫(kù)中找到匹配的數(shù)據(jù)元。

  三是快速填充。對(duì)數(shù)據(jù)元的中文名稱、數(shù)據(jù)類型、數(shù)據(jù)長(zhǎng)度等進(jìn)行描述并快速填充。

 ?。?)標(biāo)簽化

  目前在做政務(wù)信息資源梳理時(shí),最困難的是數(shù)據(jù)分級(jí)分類問題,國(guó)家政務(wù)信息資源分類為國(guó)家基礎(chǔ)信息資源、主題政務(wù)信息資源、部門政務(wù)信息資源。小的數(shù)據(jù)元可以做標(biāo)簽,未來(lái)做某一專題時(shí),可以在這些標(biāo)簽基礎(chǔ)上設(shè)計(jì)主題,如輸入“教育”,關(guān)于此專題的內(nèi)容就可以全部檢索出來(lái)。

  可以從三個(gè)方面進(jìn)行標(biāo)簽化:

  一是按照業(yè)務(wù)條線進(jìn)行標(biāo)簽化,包括教育、科技、司法、農(nóng)業(yè)、地稅、海漁、工商、旅游、綜合治理等業(yè)務(wù)條線;

  二是按照數(shù)據(jù)領(lǐng)域進(jìn)行標(biāo)簽化,包括經(jīng)濟(jì)建設(shè)、環(huán)境資源、城市建設(shè)、道路交通、教育科技、文化休閑、民生服務(wù)、機(jī)構(gòu)團(tuán)體等數(shù)據(jù)領(lǐng)域;

  三是按照資源主題進(jìn)行標(biāo)簽化,包括人口、法人、空間地理、信用、證照等資源主題。

 ?。?)預(yù)設(shè)模型

  數(shù)據(jù)基因3.0產(chǎn)品預(yù)設(shè)模型有人口庫(kù)模型和法人庫(kù)模型。

  一是人口庫(kù)模型,圍繞人的生命周期,預(yù)設(shè)人口庫(kù)信息資源模型,涵蓋人的基本信息、學(xué)籍信息、婚姻信息、死亡信息、資產(chǎn)信息、殘疾信息、住宿信息、宗教信息、生活信息、參保信息、文化信息、交通信息等。

  二是法人庫(kù)模型,圍繞法人的生命周期,涵蓋法人基本信息、財(cái)務(wù)信息、資質(zhì)信息、法人及股東信息、稅務(wù)信息、業(yè)務(wù)信息、榮譽(yù)信息、監(jiān)管信息等。

  2.事項(xiàng)標(biāo)準(zhǔn)化

  做事項(xiàng)標(biāo)準(zhǔn)化的原因是為了要把事項(xiàng)做具體,每個(gè)數(shù)據(jù)項(xiàng)權(quán)威來(lái)源部門是哪里?表格數(shù)據(jù)項(xiàng)是什么?字段來(lái)源是哪里?要將每一事項(xiàng)追蹤到源部門。

  實(shí)現(xiàn)事項(xiàng)標(biāo)準(zhǔn)化,首先需要部門、事項(xiàng)規(guī)范性編碼,其次要做到證照、批文的規(guī)范化、材料的規(guī)范化等,最后是確認(rèn)數(shù)據(jù)源部門。我們提供基礎(chǔ)字段池,如人口、法人的權(quán)威字段,能夠做到所有的材料規(guī)范化并確認(rèn)材料來(lái)源部門等。

  3.數(shù)據(jù)治理

  數(shù)據(jù)基因3.0產(chǎn)品提供數(shù)據(jù)治理功能,主要體現(xiàn)在考核評(píng)估、診斷、項(xiàng)目管理三個(gè)方面。

 ?。?)考核評(píng)估

  資源梳理是一個(gè)長(zhǎng)期過(guò)程,對(duì)共享方式、置機(jī)方式(前置機(jī)方式、EXCEL方式等)、報(bào)送范圍、指標(biāo)設(shè)計(jì)等都有要求。數(shù)據(jù)基因系統(tǒng)提供數(shù)據(jù)治理模塊,針對(duì)不同地方實(shí)際需求,設(shè)計(jì)數(shù)據(jù)治理評(píng)估考核體系,通過(guò)人工與系統(tǒng)評(píng)估相結(jié)合的模式,對(duì)各部門信息資源情況進(jìn)行考核,從數(shù)據(jù)管理的不同維度出發(fā),促進(jìn)數(shù)據(jù)資源管理可持續(xù)發(fā)展。

  (2)診斷

  審查信息系統(tǒng),對(duì)字段設(shè)置、租用機(jī)房、系統(tǒng)未上云、僵尸系統(tǒng)(依據(jù)適用范圍而定)、數(shù)據(jù)未歸集系統(tǒng)(數(shù)據(jù)點(diǎn)對(duì)點(diǎn)共享)、孤島系統(tǒng)等進(jìn)行診斷。根據(jù)診斷規(guī)則的設(shè)定,系統(tǒng)自動(dòng)對(duì)所有部門信息系統(tǒng)進(jìn)行診斷,并給出診斷意見,同時(shí),診斷意見可以為數(shù)據(jù)管理部門在進(jìn)行信息化新建項(xiàng)目、運(yùn)維項(xiàng)目審批時(shí),提供參考性意見。

image.png

 ?。?)項(xiàng)目管理

  項(xiàng)目管理主要包括兩類:一是新建項(xiàng)目,需提供新建項(xiàng)目的數(shù)據(jù)說(shuō)明、新增數(shù)據(jù)等。二是延續(xù)項(xiàng)目,要關(guān)聯(lián)相對(duì)應(yīng)的應(yīng)用系統(tǒng)名稱,讀取該應(yīng)用系統(tǒng)的診斷報(bào)告,診斷該項(xiàng)目目前不適合延續(xù)或再提供運(yùn)維費(fèi)用(設(shè)置考核指標(biāo))。

  4.理想目錄-事實(shí)目錄

  理想目錄是按照部門的職能要求應(yīng)該具有的數(shù)據(jù),事實(shí)目錄是最終體現(xiàn)在共享交換平臺(tái)上的數(shù)據(jù),事實(shí)目錄是基于理想目錄對(duì)接過(guò)來(lái)的,二者是相互補(bǔ)充、相互融合的過(guò)程。數(shù)據(jù)字段是根據(jù)理想目錄進(jìn)行勾選并細(xì)化,最終會(huì)出現(xiàn)理想目錄與事實(shí)目錄的對(duì)比表,通過(guò)該表格,可以看出事實(shí)目錄中沒有的理想目錄,主動(dòng)找出原因。

  四、下一步計(jì)劃

  一是建設(shè)數(shù)據(jù)元服務(wù)平臺(tái),整合現(xiàn)有的模板、標(biāo)準(zhǔn)化的資源,由各個(gè)用戶參與數(shù)據(jù)元標(biāo)準(zhǔn)化工作;

  二是開放知識(shí)圖譜研究工作,目前在研究探討中;

  三是開展多領(lǐng)域應(yīng)用,研發(fā)應(yīng)用不同行業(yè)的版本。

  五、優(yōu)勢(shì)

  國(guó)脈擁有“咨詢+產(chǎn)品”的優(yōu)勢(shì),在信息化咨詢服務(wù)中可以提供最好的產(chǎn)品,在產(chǎn)品中可以提供最好的咨詢服務(wù)。

責(zé)任編輯:lihui