本文為國家信息中心原副主任胡小明授權發(fā)布。
原標題:政府數(shù)據(jù)整合問題研究
NO1數(shù)據(jù)應用存在的問題
信息共享的效益難題
國內電子政務建設一直強調信息共享,十五年后還在強調信息共享,只能說明信息共享建設始終缺乏成效,使我們不得不考慮是目標有誤還是路徑不對。電子政務建設的成績大都集中在政府業(yè)務處理自動化方面而非信息共享,只有理清信息共享的效益難題,數(shù)據(jù)整合才能避免重蹈覆轍。
信息共享迷信導致了思維停滯
缺少質疑精神使信息共享反省始終不到位,長期過度的宣傳使人不敢對信息化常識有一點懷疑,信息共享已成為一種迷信,在信息資源稀缺時代強調信息共享尚有一定道理,但在全球信息爆炸之后還持同樣的看法就不合理了,只強調增加數(shù)據(jù)的信息共享只能使資料過剩愈加嚴重。對信息共享價值的迷信使思維停滯,任憑無效的信息共享蔓延。
工具變成了目標必然導致效益喪失
信息共享效益不好的重要原因是把信息共享當成終極目標,而忘記共享效益才是目標,以為信息共享就是效益,其實信息共享只是工具,工具與效益是兩回事,真正有效益的信息共享只是少數(shù),多數(shù)信息共享對政府工作并無幫助,效益也無法聚集,有效益的信息共享都是精心設計的結果。
信息共享的效益均來自最終目標實現(xiàn)產生的總效益,有效的信息共享應能降低最終目標實現(xiàn)成本、加快實現(xiàn)進度、提升最終價值。只有對最終成果有貢獻的信息共享才是有效的,在信息化建設中稀缺的不再是資料而是最終效益目標,目標導向是提升效益之路。
數(shù)據(jù)整合理念需要認真反思
一窩蜂的智慧城市建設最容易出現(xiàn)概念不清決心大,事前不想清楚為什么是粗放文化的通病,粗放文化使國內信息化建設缺乏效益。信息化使政府積累的數(shù)據(jù)資料越來越多,數(shù)據(jù)整合問題已經(jīng)提上日程,但是對于什么是數(shù)據(jù)整合、數(shù)據(jù)整合的效益如何產生并沒有充分討論,粗放的數(shù)據(jù)整合與粗放的信息共享都不會產生效益,認真研究政府數(shù)據(jù)整合的理論與方法已是當務之急。
NO2數(shù)據(jù)來源、使用方式二維矩陣
精細分類的重要性
電子政務信息共享出現(xiàn)的諸多問題均來自粗放的概念思維,例如系統(tǒng)業(yè)務之間的數(shù)據(jù)共享與決策研究用的信息共享并沒有區(qū)分,用統(tǒng)一的信息共享交換平臺解決兩方面的問題其結果是一個都做不好,建設大數(shù)據(jù)管理中心如果仍舊采用粗放的思維方式,不對數(shù)據(jù)來源與應用模式的細分只能亂上加亂。面對不斷增加的數(shù)據(jù)復雜性只靠決心大是不行的,方法必須科學,精細分類是降低復雜性的手段,對數(shù)據(jù)來源與使用方式分類有助于問題的清晰化。
兩類數(shù)據(jù)來源:人工數(shù)據(jù)與自動化數(shù)據(jù)
政府工作常用的數(shù)據(jù)資源一種來自人工,另一種來自自動化設備。人工填報的數(shù)據(jù)不論是統(tǒng)計調查還是業(yè)務記錄,都是人腦生產的數(shù)據(jù),人工填報數(shù)據(jù)不可能很快也不能做到精準,人工數(shù)據(jù)都屬于小數(shù)據(jù)范圍,其優(yōu)點是收集容易處理簡單。
自動化設備可以是各種傳感器也可以是互聯(lián)網(wǎng),當然并不是說數(shù)據(jù)只要經(jīng)過互聯(lián)網(wǎng)就是互聯(lián)網(wǎng)數(shù)據(jù),而是指利用互聯(lián)網(wǎng)機制自動收集的數(shù)據(jù),自動化數(shù)據(jù)也可稱為電腦數(shù)據(jù),電腦數(shù)據(jù)精準而客觀且數(shù)據(jù)生產的效率非常高,遠遠超過人工數(shù)據(jù)的規(guī)模,所以被稱為大數(shù)據(jù)。小數(shù)據(jù)與大數(shù)據(jù)的區(qū)別不只是規(guī)模更是來源不同。
兩類數(shù)據(jù)應用:系統(tǒng)業(yè)務與專家應用
系統(tǒng)業(yè)務應用是業(yè)務流程對數(shù)據(jù)的使用,大量出現(xiàn)在政府系統(tǒng)化業(yè)務之中,如政府行政許可審批、辦理出入境手續(xù)、各種網(wǎng)上辦事等等,這些服務是精準地按照當事人相關的數(shù)據(jù)進行操作,其結果是由制度與數(shù)據(jù)決定而與操作者無關,系統(tǒng)應用只認數(shù)據(jù),沒有信息概念。
專家應用是在信息層次上使用數(shù)據(jù),要從數(shù)據(jù)中提取信息,與自己的知識經(jīng)驗相結合來進行分析判斷,形成新的見解,這是人腦使用數(shù)據(jù)的模式,常見于政府的決策研究,決策使用信息而非數(shù)據(jù),數(shù)據(jù)要抽象出信息才能應用。
數(shù)據(jù)應用的四大類型
將兩類數(shù)據(jù)來源(人工數(shù)據(jù)、自動化數(shù)據(jù))與兩類應用(系統(tǒng)業(yè)務模式、專家應用模式)組合起來,即可得到四種數(shù)據(jù)的收集與使用狀況:
數(shù)據(jù)操作業(yè)務:人工數(shù)據(jù)——系統(tǒng)業(yè)務;
搜索監(jiān)管業(yè)務:自動化數(shù)據(jù)——系統(tǒng)業(yè)務;
信息決策應用:人工數(shù)據(jù)——專家應用;
優(yōu)化改進應用:自動化數(shù)據(jù)——專家應用。
數(shù)據(jù)整合的四種模式形成如下的2×2矩陣:

▲數(shù)據(jù)來源——數(shù)據(jù)使用矩陣圖
類型一:數(shù)據(jù)操作業(yè)務
數(shù)據(jù)操作業(yè)務特點
數(shù)據(jù)操作業(yè)務常見于政府的系統(tǒng)化業(yè)務,為提高工作效率業(yè)務都設計成規(guī)范化操作系統(tǒng),工作人員按標準化流程操作,系統(tǒng)運行結果與操作人無關,是系統(tǒng)在使用數(shù)據(jù)而非操作人員使用。
政府大多數(shù)網(wǎng)上服務均屬此類模式,發(fā)改委等十部委提出的“一號一窗一網(wǎng)”的服務方案所指的都是此類業(yè)務,業(yè)務使用的是與服務對象相關的數(shù)據(jù),如辦理戶口、簽證等只使用與個人相關的數(shù)據(jù),處理結果由數(shù)據(jù)及規(guī)則決定,操作者沒有自由量裁空間,其結果是按規(guī)范產生的,誰操作都一樣。
數(shù)據(jù)操作型業(yè)務質量要求
數(shù)據(jù)精準:這種業(yè)務完全是依據(jù)與當事人有關的數(shù)據(jù)操作,數(shù)據(jù)不準確就會出錯,保證數(shù)據(jù)的準確是第一位的。
調用迅速:調用迅速是提高效率的關鍵,要能夠跨部門使用政府數(shù)據(jù),減少用戶跑腿,不僅方便用戶、方便工作人員還能減少數(shù)據(jù)欺騙。
業(yè)務數(shù)據(jù)整合要點
數(shù)據(jù)操作業(yè)務是政府基層服務的主要形式,其使用的數(shù)據(jù)是用戶填報數(shù)據(jù)與業(yè)務流程積累的數(shù)據(jù),不同類的業(yè)務數(shù)據(jù)是由不同的業(yè)務部門收集的,數(shù)據(jù)并沒有鏈接,不同部門的數(shù)據(jù)必然會存在不一致問題,雖然數(shù)據(jù)都已入庫,但未經(jīng)磨合的跨部門調用是不可能通暢的,數(shù)據(jù)整合的任務就是要使之流暢化。不同部門業(yè)務數(shù)據(jù)進行整合并不需要數(shù)據(jù)集中存儲,主要是提升按主題標識碼調用不同數(shù)據(jù)庫的速度,要統(tǒng)一各部門的主題標識碼,要能夠核對數(shù)據(jù)并及時更正錯誤,排除數(shù)據(jù)的相互矛盾,使業(yè)務數(shù)據(jù)跨部門查詢流暢化。
類型二:搜索監(jiān)測業(yè)務
搜索監(jiān)測業(yè)務的應用場景
搜索監(jiān)測業(yè)務屬于大數(shù)據(jù)資源微觀應用業(yè)務,常用于案件偵破、危險分子查詢、反恐、反欺詐等工作,其關注的焦點是個體信息,目的在于發(fā)現(xiàn)異常的個體行為而非普遍性規(guī)律。類似于常見的“人肉搜索”。利用各種信息痕跡追蹤懷疑目標,也用于對環(huán)境的監(jiān)管,發(fā)現(xiàn)超標信號進行預警。
搜索監(jiān)測型業(yè)務使用者主要是安全機構,如公安部門、金融保險部門、政府補貼欺詐防范部門(政府醫(yī)療費、困難補助每年都有大量騙費行為)、反恐反洗錢部門等,交通安全部門、環(huán)保部門,也包括用戶信用服務機構。
搜索監(jiān)管業(yè)務的數(shù)據(jù)處理要求
搜索監(jiān)測型業(yè)務使用的數(shù)據(jù)源包括記錄人們信息痕跡的大數(shù)據(jù)資源,如互聯(lián)網(wǎng)查詢記錄、移動電話記錄、ETC車輛行動記錄、視頻畫面、信用卡使用記錄等等,很多數(shù)據(jù)源涉及到個人隱私,使用必須謹慎,要依法辦事。
對于重要的社會安全治理,政府會建設城市感知網(wǎng)收集數(shù)據(jù)進行安全監(jiān)管,例如人流危險監(jiān)管、公共設施安全監(jiān)管、環(huán)境保護監(jiān)管、食品、藥品監(jiān)管等,這些數(shù)據(jù)的整合主要措施是壓縮內容、實現(xiàn)可視化展示,提高數(shù)據(jù)的利用效率。
搜索監(jiān)測數(shù)據(jù)整合關鍵
搜索監(jiān)管業(yè)務使用的大數(shù)據(jù)資源非常專業(yè)化,對原始數(shù)據(jù)整合是不可能的,因此數(shù)據(jù)整合主要是在結果層次上,這種應用要從大數(shù)據(jù)中搜索特殊的個體數(shù)據(jù),數(shù)據(jù)整合主要是整合搜索出的結果數(shù)據(jù),建立特殊目標的數(shù)據(jù)庫,例如建立違規(guī)黑名單、收集欺詐洗錢懷疑目標等等,減少服務風險等。
對感知網(wǎng)渠道獲取的監(jiān)管大數(shù)據(jù)資源的整合主要是建立可視化圖形系統(tǒng)及建立監(jiān)管預警的標準,提升系統(tǒng)的自動化預警、報警能力,可視化系統(tǒng)可以提升環(huán)境安全態(tài)勢的直觀性,有助于管理人員更方便地理解態(tài)勢。
記錄用戶的金融行為可以建立用戶的征信數(shù)據(jù)庫,記錄用戶的交通駕駛行為可以建立用戶交通風險數(shù)據(jù)庫。
類型三:信息決策應用
信用決策應用特點
信息決策應用模式主要用于政府和企業(yè)的領導層決策,政府宏觀決策需要多方面的信息,政府不會靠數(shù)據(jù)直接決策,先要從數(shù)據(jù)集提取信息,并與已有的信息、經(jīng)驗結合起來進行判斷,進而制定出帶有普遍性的政策。高層決策信息更多來自小數(shù)據(jù),小數(shù)據(jù)宏觀性好,容易看懂,而很少會利用大數(shù)據(jù),大數(shù)據(jù)處理復雜,只有經(jīng)專家處理后濃縮的信息可供領導層決策參考。
大數(shù)據(jù)對政府高層決策貢獻不大,因為數(shù)據(jù)量越大其涉及的信息面反而越窄,政府決策需要依賴很多不能數(shù)字化的信息,如社會經(jīng)濟發(fā)展態(tài)勢,重大的國際國內事件,社會公眾的情緒意見等,宏觀決策使用數(shù)據(jù)的規(guī)模并不大,主要是掌握趨勢,而這些數(shù)據(jù)主要來自統(tǒng)計數(shù)據(jù)。
領導層信息來源
城市領導的主要工作是解決城市發(fā)展中的一些棘手的問題,監(jiān)督與激勵部門領導做好分管的工作,領導干部的決策能力是長期工作積累的結果,數(shù)據(jù)與信息的作用是潛移默化的,很少出現(xiàn)利用數(shù)據(jù)資源對某項決策進行輔助決策的局面。領導層的洞察力主要在于平時對數(shù)據(jù)與信息的利用。
領導層的信息來源更多是通過人際渠道,數(shù)據(jù)利用主要是統(tǒng)計數(shù)據(jù),會更多利用專家們研究的成果,領導層會非常關心其它地區(qū)的做法,特別是規(guī)模相當城市的數(shù)據(jù)及采取的一些舉措。
信息整合關鍵是少而精
領導層最關注的是整體的態(tài)勢,包括全球、全國、本省、本市的基本數(shù)據(jù),這些數(shù)據(jù)主要是統(tǒng)計數(shù)據(jù),數(shù)據(jù)量不需要很大但查詢要方便,尤其本地區(qū)數(shù)據(jù)是工作匯報的重要內容。對領導層而言查詢方便比數(shù)據(jù)完整更重要。
除了關注宏觀統(tǒng)計數(shù)據(jù)之外,領導層通常很關注類似規(guī)模地區(qū)的發(fā)展數(shù)據(jù)、相關政策措施,地區(qū)數(shù)據(jù)中心要多收集此類數(shù)據(jù)供領導層參閱,經(jīng)濟專家對形勢的分析也為領導關注,專家的文章往往太長,領導時間稀缺看不下來,數(shù)據(jù)中心可整理出摘要供領導查閱。
類型四:經(jīng)營優(yōu)化應用
經(jīng)營優(yōu)化應用場景
經(jīng)營優(yōu)化主要適用于企業(yè)應用特別是企業(yè)自用大數(shù)據(jù)資源的應用。亞馬遜利用自己積累的數(shù)據(jù)來分析用戶的購買喜好,成功地向用戶推薦新書,電信運營商利用大數(shù)據(jù)挖掘用戶的使用習慣定向推薦服務套餐,大型商場利用自動收款機分析用戶的消費心理,這些大數(shù)據(jù)的使用方法都是圍繞著公司業(yè)務進行的,旨在改進公司銷售,互聯(lián)網(wǎng)公司利用大數(shù)據(jù)改進廣告收益,金融公司使用大數(shù)據(jù)降低金融風險。
政府本身并沒有太多的大數(shù)據(jù)資源,政府數(shù)據(jù)還是以小數(shù)據(jù)為主,即使把眾多小數(shù)據(jù)整合起來還是小數(shù)據(jù)規(guī)模,用好小數(shù)據(jù)應是政府數(shù)據(jù)整合的重點。但是政府可以與擁有大數(shù)據(jù)的企業(yè)合作,利用企業(yè)的數(shù)據(jù)資源與信息渠道改進政府工作。國家信息中心與螞蟻金服和騰訊網(wǎng)絡合作,共同收集各地智慧城市公眾反映大數(shù)據(jù)來評價智慧城市發(fā)展水平取得了很好的效果。
經(jīng)營優(yōu)化數(shù)據(jù)應用特點
企業(yè)大數(shù)據(jù)資源主要來自本公司業(yè)務,這種大數(shù)據(jù)資源最適合改進本公司業(yè)務,目前發(fā)展得也最快。政府利用企業(yè)的大數(shù)據(jù)資源有一定難度,企業(yè)原始數(shù)據(jù)不愿意給政府,因企業(yè)需要保護公司用戶的隱私及公司的商業(yè)秘密。政府不必非要企業(yè)的原始數(shù)據(jù),可以訂購企業(yè)的分析成果與可視化數(shù)據(jù)產品,這類數(shù)據(jù)產品不侵害企業(yè)利益因而企業(yè)愿意配合。
社會大數(shù)據(jù)資源的整合
企業(yè)利用大數(shù)據(jù)資源改進業(yè)務有自身的需求,政府并不需要進行管理,企業(yè)向社會開放大數(shù)據(jù)資源是市場行為政府也不需要干預。政府可以采購企業(yè)大數(shù)據(jù)資源的加工成果,如大數(shù)據(jù)分析報告、大數(shù)據(jù)可視化產品等,政府可以規(guī)劃城市所需的多種大數(shù)據(jù)產品,向社會開放數(shù)據(jù)產品采購清單,向企業(yè)系統(tǒng)采購,不僅政府自用還將向社會開放,使大數(shù)據(jù)資源物盡其用。
NO3需求導向創(chuàng)造效益
信息爆炸與數(shù)據(jù)價值
信息資源爆炸時代數(shù)據(jù)資源早已不再稀缺,信息會通過各種方式向外泄漏,想回避都不容易。按照經(jīng)濟學理論,供應增加必然帶來邊際效用下降,數(shù)據(jù)價值下降是不可避免的趨勢。
數(shù)據(jù)價值下降是競爭的結果,以提供信息為目的的數(shù)據(jù)價值下降最快,因為類似的數(shù)據(jù)太多了,政府內部的數(shù)據(jù)資源會受到外部資源的激烈競爭。以提供信息為主要目的的數(shù)據(jù)中心會喪失原有的重要性。
政府的業(yè)務數(shù)據(jù)卻不會受到外部競爭,業(yè)務數(shù)據(jù)是用戶辦事過程記錄的數(shù)據(jù),是繼續(xù)辦事的依據(jù)不可被替代,在政府服務精細化改進中會有更大作用,整合的業(yè)務數(shù)據(jù)會不斷增值,這應當是數(shù)據(jù)中心今后工作的重點。
數(shù)據(jù)整合不需要面面俱到
數(shù)據(jù)整合是提升應用效益的工具,數(shù)據(jù)整合本身并不是目標,工具并不是效益的來源,恰當?shù)哪繕诉x擇才是效益的來源,選擇就是在增添智慧。政府數(shù)據(jù)整合既然不是終極目標就不必整合全部數(shù)據(jù),只需整合有用的數(shù)據(jù),要選擇那些使用頻率高、使用價值高的數(shù)據(jù)入手,放棄使用率不高的數(shù)據(jù)整合,集中精力將有用的數(shù)據(jù)整合做得更好。
數(shù)據(jù)整合要從具體目標起步
信息共享做不好的原因之一是捆綁了通用平臺,想靠信息共享交換平臺來解決不同的信息共享問題,結果與設想大相庭經(jīng),在沒有積累大量具體經(jīng)驗之前開發(fā)通用系統(tǒng)是不會成功的,數(shù)據(jù)整合工作要吸取這一教訓,先從具體項目入手,特殊目標效益未實現(xiàn)之前,不要搞普遍性解決方案。
現(xiàn)在國家發(fā)改委、網(wǎng)信辦等十部委聯(lián)合提出了“一號、一窗、一網(wǎng)”的惠民服務要求,這已經(jīng)是一項非常具體的要求,能夠實現(xiàn)上述服務需要的跨部門數(shù)據(jù)使用已不容易了,即使在該任務中,也要挑選最重要、最有影響、使用頻率高而無重大難點的任務先做,以用戶滿意率提升為中心,完成任務是當務之急。通用平臺讓軟件公司去想,政府不必自找麻煩。
大數(shù)據(jù)整合更不必操之過急
國內大數(shù)據(jù)應用才剛剛開始,很多地方還處于既無經(jīng)驗又無資源的階段,建設大數(shù)據(jù)中心實在勉為其難,不如集中精力把小數(shù)據(jù)應用做好,大數(shù)據(jù)應用可讓大企業(yè)和大城市多試,待他們成功了再學不遲。政府應用大數(shù)據(jù)沒有競爭性,早做晚做沒有差別,政府不必學企業(yè)爭先恐后地大數(shù)據(jù),把公眾急需的小數(shù)據(jù)服務做好就是成功之路。