2017年7月26日下午,“2017政務(wù)數(shù)據(jù)治理與創(chuàng)新高端研討會”在北京梅地亞中心多功能廳隆重召開。本次研討會由中國信息通信研究院、中國社科院信息化研究中心、國脈數(shù)據(jù)研究院聯(lián)合主辦。中國信息通信研究院高級工程師、大數(shù)據(jù)發(fā)展促進(jìn)委員會辦公室主任韓涵出席會議并發(fā)表了《政務(wù)大數(shù)據(jù)--技術(shù)發(fā)展與標(biāo)準(zhǔn)化》的主題演講,闡釋了“政府戰(zhàn)略轉(zhuǎn)型→業(yè)務(wù)轉(zhuǎn)變→數(shù)據(jù)應(yīng)用變革→云化大數(shù)據(jù)服務(wù)”的政務(wù)大數(shù)據(jù)驅(qū)動路線以及“數(shù)據(jù)采集→數(shù)據(jù)開放→數(shù)據(jù)共享→統(tǒng)籌匯聚”的政務(wù)大數(shù)據(jù)建設(shè)流程,針對數(shù)據(jù)開放共享存在的問題,她建議建立數(shù)據(jù)分級/分類機(jī)制和數(shù)據(jù)共享負(fù)責(zé)人制度。

image.png

中國信息通信研究院高級工程師、大數(shù)據(jù)發(fā)展促進(jìn)委員會辦公室主任韓涵

  以下是會議現(xiàn)場發(fā)言實錄:

  非常感謝主辦方提供的機(jī)會,今天分享中國信通院在大數(shù)據(jù),尤其是政府大數(shù)據(jù)領(lǐng)域的研究進(jìn)展。中國信通院是工信部直屬事業(yè)單位,是國家《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016-2020)》編制單位,也是《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》編制主要職能單位,信通院在大數(shù)據(jù)產(chǎn)業(yè)發(fā)展、標(biāo)準(zhǔn)制定、地方政府產(chǎn)業(yè)規(guī)劃、頂層設(shè)計、系統(tǒng)建設(shè)方面有一定經(jīng)驗,今天把這些經(jīng)驗分享給各位嘉賓。

  一、我國大數(shù)據(jù)發(fā)展基本狀況

  第一,領(lǐng)導(dǎo)層高度重視大數(shù)據(jù)發(fā)展,國家密集出臺政務(wù)數(shù)據(jù)開放共享相關(guān)政策。從大數(shù)據(jù)的發(fā)展來看,最高級的指示是習(xí)總書記提到建設(shè)全國一體化的大數(shù)據(jù)中心,目前網(wǎng)信辦在具體討論該建設(shè)方案,中國信通院也是該方案的主要支撐單位。在去年的兩會上李克強(qiáng)總理提到大數(shù)據(jù)是"鉆石礦",將大數(shù)據(jù)技術(shù)放在了很高的關(guān)鍵位置上。

  政府部門對于政務(wù)數(shù)據(jù)開放、共享和使用,這十幾年一直都在陸續(xù)推進(jìn)相關(guān)政策,包括《政務(wù)信息系統(tǒng)整合共享實施方案》、去年底發(fā)布的《"互聯(lián)網(wǎng)+政務(wù)服務(wù)"技術(shù)體系建設(shè)指南》、6月份落地的《政務(wù)信息資源目錄編制指南》,文件發(fā)布很密集,相關(guān)的文件有5個。同時,2004年中辦發(fā)〔2004〕34號《中共中央辦公廳 國務(wù)院辦公廳關(guān)于加強(qiáng)信息資源開發(fā)利用工作的若干意見》中提出了以信息化帶動工業(yè)化、以工業(yè)化促進(jìn)信息化,充分發(fā)揮信息資源開發(fā)利用在信息化建設(shè)中的重要作用,推進(jìn)經(jīng)濟(jì)結(jié)構(gòu)調(diào)整和經(jīng)濟(jì)增長方式轉(zhuǎn)變,實現(xiàn)經(jīng)濟(jì)社會全面協(xié)調(diào)可持續(xù)發(fā)展,主要的理念與政務(wù)信息的發(fā)展如出一轍,因此數(shù)據(jù)資源的使用,十幾年以來在國家的政策中始終都沒有變過,這也可以證明大數(shù)據(jù)發(fā)展過程中的一些核心問題依然存在,面對這些問題我們?nèi)绾伍_展工作,是需要我們產(chǎn)業(yè)界探討的一個方向。

  第二,政府?dāng)?shù)據(jù)共享開放標(biāo)準(zhǔn)化進(jìn)程不斷加快。從標(biāo)準(zhǔn)的層面,2007年國家發(fā)布了《政務(wù)信息資源目錄體系》和《政務(wù)信息資源交換體系》;2007年國務(wù)院頒布《中華人民共和國政府信息公開條例》條例,其中要求行政機(jī)關(guān)應(yīng)當(dāng)主動公開政府信息,還詳細(xì)規(guī)定了信息公開的方式、程序、監(jiān)督和保障措施等。至今十年,沒有其它新的電子政務(wù)標(biāo)準(zhǔn)發(fā)布,不過,國家也成立了大數(shù)據(jù)領(lǐng)域的機(jī)構(gòu),陸續(xù)的標(biāo)準(zhǔn)正在制定和研討中,比如正在制定的大數(shù)據(jù)資源開放目錄和信息資源共享交換國家標(biāo)準(zhǔn)正在研討當(dāng)中,但落地標(biāo)準(zhǔn)仍是2007年的這套標(biāo)準(zhǔn)。從這個層面來看,電子政務(wù)標(biāo)準(zhǔn)化進(jìn)程十分緩慢,總結(jié)出的一些實際困難和問題也和十幾年前一樣。在各行業(yè)層面,陸續(xù)也有一些行業(yè)標(biāo)準(zhǔn),比如交通、公安,它們的標(biāo)準(zhǔn)在行業(yè)體系內(nèi)都比較成熟。國家層面非常重視信息化標(biāo)準(zhǔn)的建設(shè),由網(wǎng)信辦牽頭,聯(lián)合質(zhì)監(jiān)總局和國家標(biāo)準(zhǔn)委發(fā)布了《"十三五"信息化標(biāo)準(zhǔn)工作指南》,為信息化標(biāo)準(zhǔn)建設(shè)、標(biāo)準(zhǔn)評估等提供一些明確的意見。

  第三,大數(shù)據(jù)上升為國家戰(zhàn)略,全國多片區(qū)布局綜合試驗區(qū)。從大數(shù)據(jù)的視角,國家已將大數(shù)據(jù)作為國家戰(zhàn)略,列入了國家"十三五"規(guī)劃編制的內(nèi)容中,工業(yè)信息化部發(fā)布了《大數(shù)據(jù)產(chǎn)業(yè)規(guī)劃建設(shè)2016-2020》文件,大數(shù)據(jù)最頂級的三部委批復(fù)貴州建設(shè)國家大數(shù)據(jù)(貴州)綜合試驗區(qū),批準(zhǔn)7個區(qū)域建設(shè)國家大數(shù)據(jù)綜合試驗區(qū),試驗區(qū)注重創(chuàng)新和突破,注重新技術(shù)的應(yīng)用,注重新的產(chǎn)業(yè)發(fā)展的培育。目前擁有包括京津冀、珠三角和省一級內(nèi)蒙古、河南、上海和重慶等在內(nèi)的區(qū)域性試驗區(qū)。

image.png

全國多片區(qū)布局綜合試驗區(qū)

  第四,全國各地陸續(xù)制訂大數(shù)據(jù)發(fā)展政策規(guī)劃,開展大數(shù)據(jù)建設(shè)項目。前后有31個省市發(fā)布了大數(shù)據(jù)相關(guān)文件,近6個月來,文件發(fā)布更頻繁,包括地方大數(shù)據(jù)整體的設(shè)計指導(dǎo)意見、促進(jìn)本地大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的規(guī)劃以及推動具體項目落地的行動計劃。最近也有很多落實一些公開指導(dǎo)意見的地方性文件,關(guān)于落實國家政務(wù)信息系統(tǒng)統(tǒng)籌共享的文件以及關(guān)于國家信息資源體系的目錄文件也在頻繁發(fā)布中。因此,對于具體的大數(shù)據(jù)項目來說,政府在這一兩年里來,大數(shù)據(jù)建設(shè)項目數(shù)量增長非??欤恼急纫苍谠黾?,尤其是在從中央到地級文件的推動之下,大數(shù)據(jù)建設(shè)已從規(guī)劃戰(zhàn)略層面走向項目落地層面。

image.png

  最后,當(dāng)前政務(wù)大數(shù)據(jù)建設(shè)模式與問題。今天談到的政務(wù)大數(shù)據(jù),把政務(wù)數(shù)據(jù)資源管理和數(shù)據(jù)治理作為一個重要角度,對于地方政府來說,政府發(fā)展大數(shù)據(jù)的目標(biāo)非常清楚,主要面向三大政府需求:領(lǐng)導(dǎo)決策、政府治理和公共服務(wù)。數(shù)據(jù)資源發(fā)揮著重大價值,主要的手段就是資源的匯聚統(tǒng)籌和數(shù)據(jù)的共享。如何從技術(shù)的視角來促進(jìn)政府大數(shù)據(jù)的建設(shè),技術(shù)評價方案可以總結(jié)為真實、大量、快速、靈活、全面。從政府的角度,建設(shè)大數(shù)據(jù)系統(tǒng),利用數(shù)據(jù)資源,整理政務(wù)信息資源目錄,提高政務(wù)數(shù)據(jù)質(zhì)量,能夠滿足這些基本要求,從而使得數(shù)據(jù)的價值發(fā)揮更大,部署更加靈活,響應(yīng)更加迅速,同時數(shù)據(jù)覆蓋維度更加全面。

  同時,政府大數(shù)據(jù)的應(yīng)用問題也非常顯著,2004年中辦34號文所提出的相關(guān)問題,比如數(shù)據(jù)孤島、數(shù)據(jù)互通、數(shù)據(jù)增值利用等,這些年也依然存在,物理層集中相對容易,真正的數(shù)據(jù)資源匯聚很難,從業(yè)務(wù)層面打通數(shù)據(jù),實現(xiàn)協(xié)同和聯(lián)動則是難上加難。

  二、政務(wù)大數(shù)據(jù)建設(shè)步驟

  首先是數(shù)據(jù)采集。數(shù)據(jù)采集主要存在以下幾個問題:一是基層數(shù)據(jù)采集很困難,主要體現(xiàn)在業(yè)務(wù)部門太小,要求復(fù)雜,口徑又不一致,沒有管理規(guī)范,質(zhì)量也沒有把控的體系。為了實現(xiàn)建設(shè)政府大數(shù)據(jù)的基礎(chǔ),對基層數(shù)據(jù)的共享和校核是一個非常重要的步驟。目前各地都在建設(shè)基礎(chǔ)庫或者共享主題庫的一些基本原則,提倡編制動態(tài)、靈活和可變的信息資源目錄體系,而不是靜態(tài)的目錄。二是屬地化數(shù)據(jù)管理困難,在數(shù)據(jù)采集層面信息系統(tǒng)縱強(qiáng)橫弱,區(qū)域機(jī)構(gòu)難以留存數(shù)據(jù),難以建設(shè)區(qū)域統(tǒng)一的數(shù)據(jù)平臺,基層數(shù)據(jù)難以形成體系。有些區(qū)域級的政府對數(shù)據(jù)掌握能力比較弱,政務(wù)信息資源系統(tǒng)整合的目的以及建設(shè)政務(wù)信息資源目錄的目的也是加強(qiáng)區(qū)域級的政府對數(shù)據(jù)的掌控,同時在政務(wù)信息資源目錄編制的過程中,后續(xù)會采用屬地化的分層,而不是采用縱向的行業(yè)信息資源系統(tǒng)主題。三是歷史珍貴數(shù)據(jù)不夠重視。最后是實時數(shù)據(jù)獲取困難。

  第二是數(shù)據(jù)開放。數(shù)據(jù)開放已經(jīng)成為重要的工程,目前中央網(wǎng)信辦正在編制數(shù)據(jù)開放試點指導(dǎo)文件。從2009年美國建設(shè)大數(shù)據(jù)項目開始,在世界范圍內(nèi),政府?dāng)?shù)據(jù)開放成為一個比較重要的工作。政府信息開放是政府和企業(yè)之間資源共享的主要手段,政府?dāng)?shù)據(jù)共享是政府和政府之間數(shù)據(jù)共享的主要方法,政府和企業(yè)之間是主要的共享手段,企業(yè)和企業(yè)之間的共享融合主要靠交易,這也是大數(shù)據(jù)發(fā)展并推動數(shù)據(jù)資源價值利用的主要手段。

  從開放的角度,政府信息公開、政務(wù)信息共享和資源目錄編制并不是完全一致的,目錄包括開放目錄、共享目錄和服務(wù)目錄。對數(shù)據(jù)開放來說,本身是有利的,更多的是政府和企業(yè)以及公眾之間共享層面的具體工作。數(shù)據(jù)資源希望流向社會,流向產(chǎn)業(yè)從而發(fā)揮更大的價值,而美國數(shù)據(jù)項目的初衷也是希望這些數(shù)據(jù)最終能流向產(chǎn)業(yè),繁榮產(chǎn)業(yè)發(fā)展。因此,數(shù)據(jù)開放目前也是國家層面政府信息建設(shè)的主要方向。

  在政府?dāng)?shù)據(jù)開放中存在的問題主要有以下幾點:一是“不愿開”,信息資源被視為獨家壟斷資源,擔(dān)心開放后部門權(quán)力削弱、經(jīng)濟(jì)利益受損,并可能暴露部門業(yè)務(wù)問題;二是“不敢開”,尚缺乏保障數(shù)據(jù)開放的配套制度,缺少具有可操作性的強(qiáng)制性規(guī)定,與政府信息公開、保密法、檔案法等相關(guān)法律法規(guī)銜接不到位,各地對政府?dāng)?shù)據(jù)開放的范圍和潛在風(fēng)險存在“后顧之憂”;三是“不能開”,數(shù)據(jù)基礎(chǔ)不牢,公共部門尚未建立一套完整的數(shù)據(jù)資源采集、管理、加工和開發(fā)利用的體系,很多信息資源缺乏數(shù)字化,數(shù)據(jù)資源多頭采集、重復(fù)建設(shè)、成本高昂,很多數(shù)據(jù)無人維護(hù)、不可持續(xù),數(shù)據(jù)的質(zhì)量和準(zhǔn)確性也存在問題,有哪些數(shù)據(jù)資源也不清楚;四是“不會開”,開放質(zhì)量不高,可利用性差,網(wǎng)站數(shù)據(jù)的質(zhì)量問題突出,包括可機(jī)讀性差、數(shù)據(jù)更新頻率不高、數(shù)據(jù)互動性差等,網(wǎng)站缺乏標(biāo)準(zhǔn)化,增加了使用者成本。這也是從技術(shù)視角來探討數(shù)據(jù)開放不得不克服的一些問題。

  第三是數(shù)據(jù)共享。主要通過共享交換平臺來實現(xiàn),但是傳統(tǒng)的數(shù)據(jù)共享交換體系在大數(shù)據(jù)時代面臨一些問題:首先,在政策制約方面,一是政府?dāng)?shù)據(jù)共享缺乏全國統(tǒng)籌機(jī)制,協(xié)同不足,二是政府共享數(shù)據(jù)時,保護(hù)部門利益的本位思想較重;其次,在基礎(chǔ)制約方面,一是數(shù)據(jù)交換共享機(jī)制問題導(dǎo)致數(shù)據(jù)不落地,難以滿足大數(shù)據(jù)時代對多維度數(shù)據(jù)的需求,二是缺乏中心交換的政府?dāng)?shù)據(jù)共享技術(shù),沒有數(shù)據(jù)融合的統(tǒng)一平臺。政府大數(shù)據(jù)共享交換體系與大數(shù)據(jù)時代未來發(fā)展更多維的數(shù)據(jù)融合以及以人工智能為基礎(chǔ)的智能型政府應(yīng)用之間存在一些矛盾。總結(jié)國內(nèi)各級政府發(fā)布的大數(shù)據(jù)政策中的重點任務(wù)要求,可以看到,開放平臺、共享平臺、目錄體系、基礎(chǔ)數(shù)據(jù)庫和管理中心是各級政府發(fā)展大數(shù)據(jù)的五項抓手。

image.png

各地方發(fā)展大數(shù)據(jù)的主要工作

  第四是統(tǒng)籌匯聚。在數(shù)據(jù)中心層面,目前各地前期建設(shè)的很多數(shù)據(jù)中心在物理層是分離的,既擁有第三方數(shù)據(jù)中心、運營商數(shù)據(jù)中心,也有政府建設(shè)的數(shù)據(jù)中心,在區(qū)域級、行業(yè)級,根據(jù)不同的需求,歷史的數(shù)據(jù)中心都建設(shè)起來了。目前國家政策要求建設(shè)綠色、集約、節(jié)能、共享的數(shù)據(jù)中心,如何發(fā)揮大量的分散的數(shù)據(jù)中心的價值?需要實現(xiàn)各種資源整合共享利用,同時對新增的數(shù)據(jù)中心的管理要嚴(yán)格。關(guān)于數(shù)據(jù)中心建設(shè),國家發(fā)改委也多次提出要統(tǒng)籌整合、共享利用已有的資源。在信息平臺層面,要統(tǒng)籌利用已有的資源,各地發(fā)展大數(shù)據(jù)時要徹底地整合政府?dāng)?shù)據(jù)。各級政府擁有很多信息平臺以及落地的政府項目,為實現(xiàn)融合貫通,需要采用一些技術(shù)手段來爬取一些信息資源,建設(shè)智慧型的統(tǒng)一共享公共平臺。但是對于已建成的分散的信息資源平臺,包括網(wǎng)站、信息系統(tǒng)等,不可能再推翻重建,對于落地的政府級項目也不可能把歷史的系統(tǒng)都拋棄掉,一般采取的措施是打通既有的舊的平臺,抓取相關(guān)的平臺資源來進(jìn)行融合貫通,需要考慮到很多具體的實現(xiàn)方案,是采用爬取手段還是與既有平臺進(jìn)行互動等,在“互聯(lián)網(wǎng)+政務(wù)服務(wù)”文件中都有所提及。在數(shù)據(jù)資源層面,目前各地都在建設(shè)共享較多的基礎(chǔ)數(shù)據(jù)庫,但是承擔(dān)的部門差異是很大的。數(shù)據(jù)資源層面同樣存在很多割裂的現(xiàn)象,如何真正地推動數(shù)據(jù)共享融合,提高政府?dāng)?shù)據(jù)的質(zhì)量,形成資產(chǎn)化管理?除了加強(qiáng)舊的系統(tǒng),整合既有數(shù)據(jù)以外,還要提高數(shù)據(jù)治理,建立數(shù)據(jù)管理的技術(shù)手段和規(guī)則以及業(yè)務(wù)流程。此外,社會普遍在探討政府和產(chǎn)業(yè)界的數(shù)據(jù)融合建設(shè)問題,比如采集部分互聯(lián)網(wǎng)數(shù)據(jù)資源,與企業(yè)共享一些相關(guān)數(shù)據(jù)。同時,對于大型機(jī)構(gòu)掌握的核心數(shù)據(jù),探討從防壟斷的角度來打破數(shù)據(jù)壁壘,這也是數(shù)據(jù)資源整合方面非常重要的一點。

  三、中國信通院開展的主要工作

  在《“互聯(lián)網(wǎng)+政務(wù)服務(wù)”技術(shù)體系建設(shè)指南》中,技術(shù)層面提出深化大數(shù)據(jù)和云計算等技術(shù)應(yīng)用,大數(shù)據(jù)主要實現(xiàn)清洗比對、數(shù)據(jù)挖掘和數(shù)據(jù)開放等,云計算主要實現(xiàn)集約建設(shè)、共享利用等。政務(wù)數(shù)據(jù)資源的利用離不開以大數(shù)據(jù)和云計算為代表的技術(shù)手段,政務(wù)信息資源目錄文件的落地實施也需要新的信息技術(shù)支持。技術(shù)領(lǐng)域如何服務(wù)于政府,如何實現(xiàn)國家政策文件中提出的政務(wù)數(shù)據(jù)資源整合共享利用的目標(biāo),這是在研究層面需要探討的問題。我們希望進(jìn)一步整理出目前面臨的實際問題,然后給出非常清晰的標(biāo)準(zhǔn)化的技術(shù)語言,讓各級政府部門來推動,在實際工作中作為參考。中國信通院開展的主要工作包括以下幾個方面:

  一是技術(shù)應(yīng)用白皮書,匯編各領(lǐng)域研究成果,集合業(yè)界經(jīng)驗案例并對外發(fā)布。

image.png

《政務(wù)大數(shù)據(jù)建設(shè)標(biāo)準(zhǔn)體系》主要內(nèi)容

  二是政府大數(shù)據(jù)建設(shè)標(biāo)準(zhǔn)體系,首先,在技術(shù)層面建設(shè)大數(shù)據(jù),要在多個視角進(jìn)行體現(xiàn),研究下一步的數(shù)據(jù)采集如何搭建目錄,數(shù)據(jù)爬蟲如何實現(xiàn),如何滿足不同接口的需求;其次,在存儲和計算領(lǐng)域,要形成一個政府的數(shù)據(jù)化系統(tǒng)。數(shù)據(jù)量是否足夠大?技術(shù)要求是否足夠高?跨度或者傳統(tǒng)數(shù)據(jù)庫是否足夠?在這些層面,目前缺少一些明確的技術(shù)指標(biāo)來作為參考;再次,在數(shù)據(jù)治理層面,我們在質(zhì)量管理、評估、清洗方面提煉出一些技術(shù)標(biāo)準(zhǔn)來供大家作為參考;在數(shù)據(jù)分析層面,面向政府級的應(yīng)用也比較復(fù)雜,我們希望能夠提煉出一些基礎(chǔ)性的數(shù)據(jù)分析參考模型以及面向大眾的、普適性的應(yīng)用來作為導(dǎo)向標(biāo)準(zhǔn);可視化主要問題是影響決策,希望出臺一些指導(dǎo)性意見,更好地引入外部數(shù)據(jù);這是數(shù)據(jù)服務(wù)需要討論的內(nèi)容,希望在具體領(lǐng)域與業(yè)界專家共同探討服務(wù)政府、服務(wù)產(chǎn)業(yè)界的標(biāo)準(zhǔn)體系,為產(chǎn)業(yè)發(fā)展做貢獻(xiàn)。以上是中國信通院前期的研究內(nèi)容。

責(zé)任編輯:lihui