“數(shù)據(jù)治國”的三個(gè)關(guān)鍵理念
——從互聯(lián)網(wǎng)思維到未來治理圖景
【摘要】大數(shù)據(jù)因其規(guī)模巨大、類型復(fù)雜、產(chǎn)生速度快、價(jià)值密度低等特點(diǎn),對現(xiàn)有信息技術(shù)構(gòu)成巨大挑戰(zhàn)。運(yùn)用新理念、新技術(shù)、新方法對大數(shù)據(jù)進(jìn)行全生命周期的創(chuàng)新管理和應(yīng)用,是推動(dòng)國民經(jīng)濟(jì)轉(zhuǎn)型和社會(huì)管理創(chuàng)新的重要契機(jī),也是提升國家綜合競爭力的重要趨勢。支撐這場大數(shù)據(jù)革命的底層力量,不僅僅是技術(shù)革命,更是涉及領(lǐng)導(dǎo)意識(shí)、組織文化和行為方式的思維革命。在國家治理層面,尤其需要形成“數(shù)據(jù)治國”的治理理念,掌握用數(shù)據(jù)思考和解決社會(huì)問題的新方法,最重要的是樹立數(shù)據(jù)思維、互聯(lián)網(wǎng)思維和計(jì)算思維這三種思維方式。
大數(shù)據(jù)是因信息技術(shù)特別是數(shù)據(jù)獲取技術(shù)的革命性進(jìn)步而形成的信息爆炸現(xiàn)象,因其規(guī)模巨大、類型復(fù)雜、產(chǎn)生速度快、價(jià)值密度低等特點(diǎn),對現(xiàn)有信息技術(shù)構(gòu)成巨大挑戰(zhàn)。運(yùn)用新理念、新技術(shù)、新方法對大數(shù)據(jù)進(jìn)行全生命周期的創(chuàng)新管理和應(yīng)用,是推動(dòng)國民經(jīng)濟(jì)轉(zhuǎn)型和社會(huì)管理創(chuàng)新的重要契機(jī),也是提升國家綜合競爭力的重要趨勢。支撐這場大數(shù)據(jù)革命的底層力量,不僅是技術(shù)革命,更是涉及領(lǐng)導(dǎo)意識(shí)、組織文化和行為方式的思維革命。在國家治理層面,尤其需要形成“數(shù)據(jù)治國”的理念,掌握用數(shù)據(jù)思考和解決社會(huì)問題的新方法,最重要的是樹立三種思維方式。
數(shù)據(jù)思維
數(shù)據(jù)在經(jīng)濟(jì)社會(huì)運(yùn)行中的地位從未像今天這樣重要。之所以要重視大數(shù)據(jù),是因?yàn)樗且环N更好的工具,是信息時(shí)代堪比人、財(cái)、物要素的資源,是對未來具有戰(zhàn)略意義的資產(chǎn)。但實(shí)際上,大數(shù)據(jù)的價(jià)值并不止于此,它正在“成為這個(gè)世界上最重要的土壤和基礎(chǔ)”(涂子沛語)(1),成為一切管理和決策的依據(jù)。與之相應(yīng)的,大數(shù)據(jù)治理首先要樹立的是數(shù)據(jù)思維。
量化思維:先有數(shù),再做事?!耙磺薪钥闪炕!边@是斯蒂芬·貝克(Stephen Beck)在《當(dāng)我們變成一堆數(shù)字》一書中提出的觀點(diǎn)。(2)在這本匯聚數(shù)字報(bào)告和分析的力作里,斯蒂芬·貝克展示了我們正在進(jìn)入一個(gè)鮮活的量化世界:每一天,我們的身后都拖著一條由個(gè)人信息組成的長長的“尾巴”,我們點(diǎn)擊網(wǎng)頁、切換電視頻道、駕車穿過自動(dòng)收費(fèi)站、用信用卡購物、使用手機(jī)等行為——這些過去完全被忽略的信息——都通過各種方式被數(shù)據(jù)化地記錄下來。
放眼宏觀,我們看到物聯(lián)網(wǎng)傳感器數(shù)據(jù)、互聯(lián)網(wǎng)用戶生成(UGC)數(shù)據(jù)、業(yè)務(wù)系統(tǒng)運(yùn)行數(shù)據(jù)、信息系統(tǒng)日志數(shù)據(jù)、科學(xué)儀器產(chǎn)生的數(shù)據(jù)……這些數(shù)據(jù)源源不斷地產(chǎn)生,把物理世界的萬事萬物一一映射成一個(gè)數(shù)據(jù)世界,從而形成大數(shù)據(jù)時(shí)代的全貌。
數(shù)據(jù)的延伸,就是管理的延伸?!安粫?huì)量化就無法管理”(3)的思想已成為管理學(xué)界的共識(shí)。借助“一切皆可量化”的技術(shù)背景與思維方式,政府可以獲得更多基于管理和服務(wù)對象的信息,做到更加精準(zhǔn)的洞察和預(yù)測,從而大大豐富治理的手段和方式。
美國政府已經(jīng)在著手進(jìn)行追蹤恐怖分子的大數(shù)據(jù)挖掘計(jì)劃。他們認(rèn)為,如果恐怖分子要計(jì)劃一次襲擊活動(dòng),必定會(huì)在各種角落留下某種痕跡,通過對這些“數(shù)據(jù)足跡”進(jìn)行挖掘,就能發(fā)現(xiàn)和追蹤恐怖分子。這些做法,對于我國邊疆地區(qū)維穩(wěn)和預(yù)防暴力事件都是一種有益的啟示。
紐約市為了恢復(fù)哈德森河的生態(tài),在河的沿岸都安裝了傳感器,傳感器把河水的鹽度、濁度、葉綠素、顆粒物粒徑以及河面風(fēng)向等數(shù)據(jù)收集起來,實(shí)時(shí)地傳遞到后臺(tái)。在計(jì)算中心,各種數(shù)據(jù)匯成了一條虛擬的哈德森河,流水何時(shí)被污染,化學(xué)、物理、生物成分發(fā)生了什么變化,一看便知。(4)接下來,數(shù)據(jù)科學(xué)家便可以利用這些信息建立一個(gè)哈德森河的環(huán)境模型,評估不同的治理方案和人類干預(yù)對哈德森環(huán)境的多種影響,以保證在實(shí)際治理時(shí)的效率和效果。
很多國家和地區(qū),包括中國的一些地區(qū),正在給數(shù)以千萬計(jì)的家庭安裝智能電表。這些電表每隔幾秒鐘或幾分鐘就讀取一次用電數(shù)據(jù),電力公司據(jù)此每個(gè)月向每戶家庭提供一份個(gè)性化報(bào)告,以鼓勵(lì)節(jié)約用電。在美國,智能電表工程預(yù)計(jì)每年能為全國消費(fèi)用電節(jié)省5億美元。大數(shù)據(jù)成為政府節(jié)能減排的千里眼、萬只手,并且做到了深入每一戶家庭、量身定制解決方案,這在入戶抄電表的傳統(tǒng)工作方式下根本是無法想象的事情!
量化只是第一步。量化的目的是建設(shè)數(shù)據(jù)平臺(tái),涉及數(shù)據(jù)捕獲、數(shù)據(jù)傳輸、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)消亡等動(dòng)態(tài)過程。要在國家和社會(huì)治理層面建立這樣一個(gè)完整的數(shù)據(jù)生命周期,需要做大量的基礎(chǔ)性工作,更要在政府部門普遍形成“先有數(shù),再做事”的組織文化和行為風(fēng)尚。
決策思維:讓數(shù)據(jù)說話。隨著信息技術(shù)的進(jìn)步,硬件的重要性正在急速下降,數(shù)據(jù)的重要性正在不斷提升。以前都是先有應(yīng)用后有數(shù)據(jù),現(xiàn)在是先有數(shù)據(jù)再說應(yīng)用。數(shù)據(jù)具有獨(dú)立存在的價(jià)值,軟件是為數(shù)據(jù)服務(wù)的。在大數(shù)據(jù)時(shí)代,我們需要樹立以數(shù)據(jù)為中心的新思維。具體到政府層面,應(yīng)當(dāng)盡快將已有的管理決策模式變?yōu)椤皵?shù)據(jù)驅(qū)動(dòng)”新模式,在領(lǐng)導(dǎo)意識(shí)、組織文化和工作流程上經(jīng)歷一次從內(nèi)而外的蛻變。
一般來說,決策可以由三種方式分別或混合地驅(qū)動(dòng):直覺、經(jīng)驗(yàn)和邏輯。雖然有時(shí)直覺和經(jīng)驗(yàn)在決策過程中是無可替代的,例如喬布斯對蘋果產(chǎn)品需求的直覺把握,但經(jīng)驗(yàn)和直覺往往容易產(chǎn)生偏差。比如,決策的出發(fā)點(diǎn)或許并不差,但由于缺乏民主基礎(chǔ)和科學(xué)依據(jù),其結(jié)果往往不能令民眾滿意;決策過程可能很粗放,完全是“一言堂”,根本不聽取社會(huì)上方方面面的意見,結(jié)果在實(shí)施過程中,漏洞百出。
中國領(lǐng)導(dǎo)者的決策往往更傾向于依賴經(jīng)驗(yàn)和直覺,有時(shí)候甚至僅迫于眼前的境遇與狀況,缺乏依靠數(shù)字管理的習(xí)慣。在政府的會(huì)議室里,一件似乎經(jīng)過了理智討論的事情,可能是在沒有什么實(shí)際標(biāo)準(zhǔn)的情況下做出的決定。這種現(xiàn)象并不少見。個(gè)別領(lǐng)導(dǎo)干部把決斷誤認(rèn)為武斷和盲斷,由于決策失誤給國家和人民造成損失,被群眾戲稱為“三拍”干部,即“事前拍腦袋決策、事中拍胸脯保證、出事后拍屁股走人”。
在過去,受數(shù)據(jù)獲取以及分析的限制,依靠決策人的經(jīng)驗(yàn)“拍腦袋”決策是不得已而為之。在大數(shù)據(jù)時(shí)代,各行各業(yè)都在學(xué)習(xí)如何利用數(shù)據(jù)進(jìn)行預(yù)測、作出決策,政府領(lǐng)導(dǎo)者們?nèi)绻荒芘c時(shí)俱進(jìn),做到凡事“心中有數(shù)”,很難想象如何做一個(gè)稱職的“當(dāng)家人”。此外,隨著公共管理事務(wù)的日益復(fù)雜,僅憑個(gè)人感知,已經(jīng)很難全面地了解所有正在發(fā)生的事情,并給出正確的判斷。這就要求政府部門提高改革決策的科學(xué)性,把大數(shù)據(jù)技術(shù)與思維運(yùn)用到管理與決策中,掌握決策依據(jù)、優(yōu)化決策過程、跟蹤決策實(shí)施;要求管理者改變“差不多先生”(胡適語)的作風(fēng)(5),養(yǎng)成“用數(shù)據(jù)來說話、用數(shù)據(jù)來管理、用數(shù)據(jù)來決策、用數(shù)據(jù)來創(chuàng)新”的思維習(xí)慣。
有志于引領(lǐng)組織實(shí)現(xiàn)大數(shù)據(jù)轉(zhuǎn)型的管理者們,可以從兩個(gè)最簡單的技巧開始。首先,要養(yǎng)成問“數(shù)據(jù)怎么說”的習(xí)慣。大數(shù)據(jù)驅(qū)動(dòng)下的管理,重要的不是“我們怎么想”,而應(yīng)該是“我們知道什么”。遇到重大決策的時(shí)候,還要緊跟著這個(gè)問題進(jìn)一步問:“這些數(shù)據(jù)從哪兒來的?”“這些數(shù)據(jù)能得出什么結(jié)論?”“我們對結(jié)果有多大信心?”決策者對于數(shù)據(jù)與客觀證據(jù)的尊重是大數(shù)據(jù)發(fā)揮價(jià)值的重要保證。當(dāng)管理層的思維發(fā)生了這樣的變化,員工就能從中迅速接收到信息,得到重視數(shù)據(jù)的激勵(lì)。其次,要允許數(shù)據(jù)做主。數(shù)據(jù)得出的結(jié)論,有的能夠支持既有的經(jīng)驗(yàn),有些則可能與之相悖。當(dāng)結(jié)論與經(jīng)驗(yàn)不符時(shí),數(shù)據(jù)說了算還是經(jīng)驗(yàn)說了算?這將對數(shù)據(jù)在組織中的地位形成考驗(yàn)。如果決策者不愿意根據(jù)數(shù)據(jù)調(diào)整自己的經(jīng)驗(yàn),甚至有選擇地“看到”那些和自己經(jīng)驗(yàn)相一致的數(shù)據(jù),那么無論搜集了多么海量的數(shù)據(jù),無論引入了何種高深的算法,這些數(shù)據(jù)與算法都只是為了支持與粉飾決策者既有的決定,不能帶來新的知識(shí)與價(jià)值。相反,如果員工用來自一線的大數(shù)據(jù)分析結(jié)果,讓經(jīng)驗(yàn)豐富的領(lǐng)導(dǎo)推翻了自己原先的直覺判斷,放手讓“大數(shù)據(jù)說話”,這將是改變組織決策文化的最大力量!
整合思維:打破信息孤島。政府掌握著社會(huì)方方面面的大數(shù)據(jù),人口、交通、衛(wèi)生、社保、稅收、城市規(guī)劃……雖然大多數(shù)政府部門都建成了比較完備的信息化平臺(tái),但是各個(gè)部門間的數(shù)據(jù)沒有進(jìn)行高效的整合,大量部門的數(shù)據(jù)如一個(gè)個(gè)信息孤島,給政府調(diào)度和公眾辦事帶來了不便,也制約了數(shù)據(jù)活力的激發(fā)。
例如,購買一套住房,需要填報(bào)十幾張表格,每張表格可能1/3以上的內(nèi)容是重復(fù)的,這些都是政府擁有的基礎(chǔ)數(shù)據(jù),完全可以根據(jù)身份證號(hào)碼自動(dòng)生成。北漂小伙為了辦一張護(hù)照,返鄉(xiāng)6次,補(bǔ)5張證明,多跑3000公里。而只要實(shí)現(xiàn)了綜合數(shù)據(jù)聯(lián)網(wǎng),這5張證明的相關(guān)信息(無犯罪證明、公司在職證明、公司營業(yè)執(zhí)照、公司外派人員資格證明、本地身份證),完全可以由政府部門內(nèi)部調(diào)取,而不必讓老百姓為此急斷腸、跑斷腿。(6)
信息孤島是行業(yè)信息化的階段性產(chǎn)物,而要打破條塊分割,實(shí)現(xiàn)不同政府部門、不同層級(jí)之間數(shù)據(jù)的集中共享也非一日之功。一方面,需進(jìn)行縱向信息系統(tǒng)整合,在相同的上下級(jí)政府部門之間,利用多級(jí)網(wǎng)絡(luò)和中心數(shù)據(jù)庫,構(gòu)建統(tǒng)一的信息平臺(tái)。例如,流動(dòng)人口在我國是一個(gè)較大的問題。誰在流動(dòng)?能不能從傳統(tǒng)的戶籍系統(tǒng)里找出一些規(guī)律以利于更好地管理?比如,能不能把勞動(dòng)力輸出省安徽的戶籍?dāng)?shù)據(jù)與輸入省廣東的戶籍?dāng)?shù)據(jù)整合起來?這既需要自上而下的部署,也需要自下而上的實(shí)驗(yàn)。另一方面,還需進(jìn)行水平的電子政務(wù)信息系統(tǒng)整合,實(shí)現(xiàn)跨部門的政府信息資源共享和政務(wù)協(xié)同。例如,在社保(市民)卡辦理的時(shí)候,以共享信息的方式使用二代身份證照片,可減少市民照相和出行成本;企業(yè)報(bào)備辦理港澳商務(wù)通行證,通過共享國稅地稅相關(guān)信息,可以免去到市國地稅局開設(shè)納稅額度證明步驟;稅務(wù)質(zhì)檢登記復(fù)用工商信息,可以減少辦事人員等待時(shí)間等。
數(shù)據(jù)之網(wǎng)縱橫交錯(cuò),才能激發(fā)活力。我國財(cái)政部門以互聯(lián)網(wǎng)門戶網(wǎng)站建設(shè)和財(cái)政專網(wǎng)系統(tǒng)建設(shè)為抓手,全面打造財(cái)政政務(wù)公開的“陽光平臺(tái)”,形成縱向聯(lián)通國家、省、市、縣財(cái)政部門、橫向連接同級(jí)人民銀行國庫、代理銀行、國地稅部門以及所有預(yù)算單位的橫縱結(jié)合的網(wǎng)絡(luò)系統(tǒng)。這些舉措不斷塑造著“財(cái)—金—企—社”信息資源網(wǎng)絡(luò)化的雛形。
要徹底打破信息孤島,還需要從內(nèi)部管理觀念和行政體制上著手。雖然說“信息孤島”形成的表面原因是信息存儲(chǔ)格式不一致的問題,但目前更深層次的原因其實(shí)是管理上的孤島現(xiàn)象。觀念和態(tài)度不變,即使手握利器,行政效率和服務(wù)質(zhì)量也難提高。誰都知道“九龍治水”弊端多,即使現(xiàn)在大數(shù)據(jù)有辦法讓“九龍”成天“坐在一起”,但如果互相誰也不理誰,水還是治不好。
互聯(lián)網(wǎng)思維
凱文·凱利指出,云計(jì)算時(shí)代的最大文化動(dòng)向就是永遠(yuǎn)在線。(7)人與人、人與設(shè)備、設(shè)備與設(shè)備時(shí)時(shí)刻刻的連接,將以7×24小時(shí)的方式源源不斷地產(chǎn)生數(shù)據(jù)。特別是web2.0之后的用戶生成內(nèi)容(UGC),包括社交網(wǎng)絡(luò)(SN),是大數(shù)據(jù)形成的重要原因之一。因此,要做好大數(shù)據(jù)治理,還必須深入理解互聯(lián)網(wǎng)思維。
關(guān)聯(lián)思維:萬物皆相關(guān)。在氣象經(jīng)濟(jì)學(xué)界流行這樣一條“德爾菲氣象定律”,即氣象投入與產(chǎn)出比為1:98,也就是說,在氣象信息方面每投入1元,就可以得到98元的經(jīng)濟(jì)回報(bào)。一個(gè)典型的例子是,氣溫每降低1℃,北京市燃?xì)夤┡到y(tǒng)日消耗天然氣將增加約200萬立方米。如果提高氣象預(yù)報(bào)的精度,實(shí)時(shí)對供暖系統(tǒng)進(jìn)行合理調(diào)度,無疑將有效降低能源消耗,節(jié)省很大一筆經(jīng)費(fèi)開支。
這就是大數(shù)據(jù)的價(jià)值所在。通過挖掘海量數(shù)據(jù),呈現(xiàn)一個(gè)充滿關(guān)聯(lián)的世界。誠如舍恩伯格所預(yù)言的那樣:“將世界看作信息,看作可以理解的數(shù)據(jù)的海洋,為我們提供了一個(gè)從未有過的審視現(xiàn)實(shí)的視角。它是一種可以滲透到所有生活領(lǐng)域的世界觀。”(8)
在商業(yè)案例中,你可能聽說過啤酒與尿布、搜索詞與流感趨勢、女兒懷孕與廣告?zhèn)鲉蔚墓适?;在國家與社會(huì)治理中,也有很多運(yùn)用數(shù)據(jù)相關(guān)性的成功案例。例如,紐約市警方開發(fā)了一款電子數(shù)據(jù)地圖——CompStat,通過分析案件發(fā)生歷史與發(fā)薪日、體育賽事、天氣變化、假日等變量的相關(guān)性,預(yù)測最可能發(fā)生罪案的“熱點(diǎn)”地區(qū),并預(yù)先在這些地區(qū)部署警力。應(yīng)用這套系統(tǒng)后的次年,該市犯罪率就出現(xiàn)了明顯的下降,兇殺案發(fā)生數(shù)量創(chuàng)下了50年來最低。(9)
中國海關(guān)的“電子口岸”整合了工商、稅務(wù)、海關(guān)、外貿(mào)、外匯、銀行、公安、交通、鐵路、民航、國檢等十幾家部門的數(shù)據(jù)。數(shù)據(jù)之間實(shí)時(shí)的聯(lián)網(wǎng)分析,使“電子口岸”在加快報(bào)關(guān)速度、高效打擊不法分子的同時(shí),更成為中國經(jīng)濟(jì)的“氣象預(yù)報(bào)臺(tái)”,能夠?yàn)閲液暧^經(jīng)濟(jì)調(diào)控提供非常精細(xì)、全面的決策支持。
大數(shù)據(jù)之所以能發(fā)掘規(guī)律、作出預(yù)測,靠的是對相關(guān)關(guān)系的把握。我們常說“清明時(shí)節(jié)雨紛紛”,這個(gè)結(jié)論并不是邏輯推導(dǎo)出來的,而是人們通過多年觀察,發(fā)現(xiàn)以往每年這幾天總是下雨比較多,于是總結(jié)出了這樣一個(gè)樸素的規(guī)律。同樣的道理,計(jì)算機(jī)可以在海量的數(shù)據(jù)上運(yùn)用數(shù)據(jù)挖掘等辦法,自動(dòng)地發(fā)現(xiàn)一些相關(guān)性,然后通過相關(guān)關(guān)系來預(yù)測事情發(fā)生的可能性。例如,從公交車輛運(yùn)行的點(diǎn)數(shù)據(jù)推斷一個(gè)路段發(fā)生擁堵的可能性,從納稅人的異常數(shù)據(jù)特征發(fā)現(xiàn)偷稅漏稅的可能性,從人們上網(wǎng)檢索的關(guān)鍵詞推斷流感爆發(fā)的可能性,等等。
盡管因果關(guān)系是最深刻的一類聯(lián)系,但是我們很多時(shí)候并不能獲得。這種情況下,我們是無所作為呢,還是也可以有所作為?答案是明顯的,只要我們知道一些相關(guān)關(guān)系,我們也可以進(jìn)行預(yù)測。相關(guān)關(guān)系也許不能準(zhǔn)確地告知我們某件事情為何會(huì)發(fā)生,但是它會(huì)提醒我們這件事情正在發(fā)生。在許多情況下,這種提醒的幫助已經(jīng)足夠大了。如果電子醫(yī)療記錄顯示橙汁和阿司匹林的特定組合可以治療癌癥,那么找出具體的致病原因就沒有這種治療方法本身來得重要。同樣,只要我們知道什么時(shí)候是買機(jī)票的最佳時(shí)機(jī),就算不知道機(jī)票價(jià)格瘋狂變動(dòng)的原因也無所謂了。因此,我們常常說在大數(shù)據(jù)時(shí)代,“是什么”比“為什么”更重要,相關(guān)關(guān)系比因果關(guān)系更重要。[page]

去中心思維:走向網(wǎng)狀社會(huì)?;ヂ?lián)網(wǎng)時(shí)代最鮮明的特征是去中心化、平等化。因?yàn)榛ヂ?lián)網(wǎng)在本質(zhì)上是反壟斷的:開源軟件社區(qū)的發(fā)展打破了少數(shù)大企業(yè)對技術(shù)的壟斷,信息公開和開放數(shù)據(jù)打破了信息壟斷,云計(jì)算等租賃業(yè)務(wù)的普及打破了資源壟斷。
尤其在傳播領(lǐng)域,我們可以非常清楚地看到這樣一個(gè)去中心化的趨勢。在報(bào)刊、廣播、電視流行的傳統(tǒng)媒體時(shí)期,人們只能聽到中心的一個(gè)聲音。后來,博客的誕生使得每個(gè)人都可以發(fā)表自己的想法。較之于傳統(tǒng)媒體,這是個(gè)巨大的飛躍。但是個(gè)人的想法能讓多少人聽到,卻依然取決于門戶網(wǎng)站的編輯(即自己發(fā)表的博客是否被精選)。隨著微博的興起,所有人可以在一個(gè)統(tǒng)一的公共討論空間討論,更重要的是這個(gè)討論空間,不再依靠一個(gè)中心,而是靠著興趣、關(guān)系的鏈條自動(dòng)生成、壯大,編輯的力量被前所未有地削弱了。
數(shù)據(jù)的生產(chǎn)和流動(dòng)也遵循這樣一個(gè)去中心化的趨勢。涂子沛在《大數(shù)據(jù)》一書中指出(10),在大數(shù)據(jù)時(shí)代,基于層級(jí)的社會(huì)控制手段將不再適用,基于流程的管理方法也有很大局限性。這是因?yàn)?,在大?shù)據(jù)時(shí)代,信息和數(shù)據(jù)是最重要的資源,一旦信息自由、數(shù)據(jù)開放,就意味著信息和每一個(gè)公民之間都是等距的,而且中間沒有層級(jí)的過濾。數(shù)據(jù)的開放和流動(dòng),就代表著知識(shí)的開放和流動(dòng)、代表著權(quán)力的開放和流動(dòng),這種開放和流動(dòng)是多中心的、水平的。在這個(gè)時(shí)代,社會(huì)的主體結(jié)構(gòu)將從分層轉(zhuǎn)向“結(jié)網(wǎng)”,在網(wǎng)狀傳播力量的不斷沖擊下,個(gè)人的主體價(jià)值將得到前所未有地張揚(yáng),集中在政府的權(quán)力將開始分散,權(quán)力的最終流向是社會(huì)、是大眾、是一個(gè)個(gè)獨(dú)立的公民個(gè)體。大數(shù)據(jù)時(shí)代正在呼喚下一波社會(huì)化的浪潮:一個(gè)更開放的社會(huì),一個(gè)權(quán)力更分散的社會(huì),一個(gè)網(wǎng)狀的大社會(huì)。
這會(huì)形成一種什么樣的國家和社會(huì)治理圖景?一個(gè)可以預(yù)見的前景是,政府的組織形態(tài)必將越來越開放,從條塊分割、封閉的架構(gòu)向開放、協(xié)同、合作的方向邁進(jìn)。傳統(tǒng)的決策過程是線性的、自上而下的,而伴隨互聯(lián)網(wǎng)和大數(shù)據(jù)浪潮而來的,將是一個(gè)非線性的、去中心化的、自下而上的、發(fā)現(xiàn)群體智慧的決策模式。
美國一位程序員發(fā)明了一款應(yīng)用軟件——SeeClickFix,居民可以通過手機(jī)拍照,向該軟件舉報(bào)亂涂亂畫、交通燈損壞或者排水管堵塞事件,這些投訴被自動(dòng)記錄在案,并被發(fā)送到公共事業(yè)部門的卡車儀表盤上,相關(guān)問題也得到了很快的解決。(11)SeeClickFix自2008年3月研發(fā)以來,目前已在美國上千個(gè)城市和社區(qū)中使用,其中既有舊金山、華盛頓、達(dá)拉斯等大城市,也包括麻州西部和康州的許多小鎮(zhèn)。
SeeClickFix是政府2.0理念的典型代表。在我國“社區(qū)網(wǎng)格化”管理系統(tǒng)實(shí)踐中,類似系統(tǒng)也得到了普遍應(yīng)用?!罢?.0”的實(shí)質(zhì),就是平臺(tái)的政府、服務(wù)導(dǎo)向的政府、開放的政府,從以政府為主體的管治轉(zhuǎn)向以協(xié)同共治、公共服務(wù)為導(dǎo)向的公共價(jià)值塑造。通過這種開放的平臺(tái),公眾能夠參與政府提供公共服務(wù)產(chǎn)品的全過程,包括公共服務(wù)產(chǎn)品的設(shè)計(jì)、生產(chǎn)、供給等各個(gè)環(huán)節(jié);而政府也能打開更為深入和廣泛了解民情民意的“政策窗口”,疏通促進(jìn)社會(huì)和諧的民意渠道,找到不斷優(yōu)化公共決策的新機(jī)遇。
人本思維:政務(wù)人性化。互聯(lián)網(wǎng)思維的核心在于以用戶需求為主導(dǎo),將用戶思考和用戶體驗(yàn)做到極致是關(guān)鍵所在。政府的核心職能就是為人民服務(wù),以人為本是貫徹落實(shí)科學(xué)發(fā)展觀的核心要求。在這個(gè)層面上,我們的執(zhí)政理念與互聯(lián)網(wǎng)精神是非常契合的。
以人為本的前提是全面了解與服務(wù)對象有關(guān)的情況與需求,只有建立在這種數(shù)據(jù)基礎(chǔ)上的判斷,才能保證政府落地的政策能實(shí)實(shí)在在地使每一個(gè)公民受益。如果搞“長官意志”,不能很好地把握民情民意,這種服務(wù)就會(huì)陷入想當(dāng)然的境地。
在大數(shù)據(jù)的輔助下,政府一方面能夠?qū)崟r(shí)、全面感知和預(yù)測公眾所需的各類服務(wù)和信息,及時(shí)發(fā)現(xiàn)需求熱點(diǎn),為用戶提供更加智能化的辦事、便民服務(wù);另一方面,對公民需求的多維度多層次細(xì)分,把從面上的需求判斷變?yōu)閷π枨蠹?xì)節(jié)的感知,使政府服務(wù)提供更精準(zhǔn)、更個(gè)性化。人本思維的樹立,有助于使政府改變傳統(tǒng)的“指令導(dǎo)向”的公共管理模式和“供給導(dǎo)向”的公共服務(wù)模式,開啟“需求導(dǎo)向”的公共管理與服務(wù)新模式。(12)
北京市公交部門于2013年9月推出“定制公交”平臺(tái)。市民可在該平臺(tái)上提出自己的出行需求。公交集團(tuán)則根據(jù)乘客提出的出行需求和客流情況,設(shè)計(jì)商務(wù)班車線路,然后在定制公交平臺(tái)上招募乘客、預(yù)訂座位、在線支付。根據(jù)約定的時(shí)間、地點(diǎn)、方向開行商務(wù)班車,保證一人一座,每日出行費(fèi)用也將遠(yuǎn)遠(yuǎn)低于自駕車和乘坐出租車。
大數(shù)據(jù)的創(chuàng)新運(yùn)用和實(shí)時(shí)分析,還被認(rèn)為能夠推動(dòng)失業(yè)、饑餓、疾病爆發(fā)等社會(huì)問題的解決,對于發(fā)展中國家的發(fā)展而言尤其具有特殊意義。近些年全球糧食、能源和金融危機(jī)的經(jīng)驗(yàn)告訴人們,盡管當(dāng)今世界信息技術(shù)非常發(fā)達(dá),但決策者得到有用信息并及時(shí)采取行動(dòng)以保護(hù)弱勢人群的速度,卻總是滯后于危機(jī)的出現(xiàn)。為了改變這種狀況,2009年,聯(lián)合國啟動(dòng)“全球脈動(dòng)”(Global Pulse)計(jì)劃(13),旨在為各國提供實(shí)時(shí)數(shù)據(jù)分析,以便更準(zhǔn)確地了解人類福祉狀況,降低全球性危機(jī)對人類生活的影響。與傳統(tǒng)的統(tǒng)計(jì)僅能有效跟蹤中長期發(fā)展趨勢相比,“全球脈動(dòng)”旨在發(fā)現(xiàn)新的數(shù)字化指標(biāo),實(shí)時(shí)了解情況,并及時(shí)為決策者提供反饋。
聯(lián)合國秘書長潘基文說:“我們事實(shí)上是在一個(gè)實(shí)時(shí)信息的海洋中游泳,手機(jī)和數(shù)據(jù)服務(wù)的爆炸式增長意味著世界各地的人們在為全球知識(shí)庫作出海量的信息貢獻(xiàn)。他們還通過交流、購買、出售和其他日常生活活動(dòng)以免費(fèi)的方式提供著信息。私營部門正在研究這些新數(shù)據(jù)以便實(shí)時(shí)了解顧客。聯(lián)合國也必須為自己的服務(wù)對象——全世界那些失去工作、生病、難以養(yǎng)活自己和家人的人們做同樣的事情?!保?4)
在2014年“兩會(huì)”上,“大數(shù)據(jù)”一詞首次被寫入《政府工作報(bào)告》。不少代表委員舉起“數(shù)據(jù)治國”的大旗:小米總裁雷軍呼吁將大數(shù)據(jù)上升為國家戰(zhàn)略,百度總裁李彥宏提議用大數(shù)據(jù)解決教育資源不平等問題,還有多位代表委員提出成立國家大數(shù)據(jù)戰(zhàn)略委員會(huì),用大數(shù)據(jù)破解“十面霾伏”、“舌尖上的安全”、“人在證途”、反恐、房價(jià)調(diào)控等民生難題。誠如涂子沛在《數(shù)據(jù)之巔》中所言:“人類的地平線上出現(xiàn)了一些新方法來解決一些老問題,這些方法用的不是鋼筋和水泥,而是軟件和數(shù)據(jù)。”(15)
計(jì)算思維
“大數(shù)據(jù)”現(xiàn)象是由于信息技術(shù)的進(jìn)步而產(chǎn)生的,大數(shù)據(jù)時(shí)代就是大計(jì)算時(shí)代,無處不在的計(jì)算標(biāo)志著一個(gè)計(jì)算型社會(huì)的興起。因此可以說,沒有計(jì)算技術(shù)的發(fā)展,就沒有大數(shù)據(jù)。但是,常常聽到有人說“技術(shù)不重要”,這種輕視技術(shù)的思想對于大數(shù)據(jù)應(yīng)用的良性發(fā)展只會(huì)帶來傷害。大數(shù)據(jù)應(yīng)用就是一種基于計(jì)算機(jī)信息技術(shù)的解決問題的辦法,因此也需要計(jì)算思維。
計(jì)算思維是運(yùn)用計(jì)算機(jī)科學(xué)的基礎(chǔ)概念進(jìn)行問題求解、系統(tǒng)設(shè)計(jì)以及人類行為理解等涵蓋計(jì)算機(jī)科學(xué)之廣度的一系列思維活動(dòng)。計(jì)算思維,簡單地說是指人們利用計(jì)算機(jī)解決問題的普遍方法。計(jì)算思維的提出者周以真(Jeannette M. Wing)教授認(rèn)為,計(jì)算思維同算術(shù)能力、語言能力等一樣,是每一個(gè)現(xiàn)代人需要具備的基本能力。(16)從計(jì)算機(jī)解決問題的角度分析,我們認(rèn)為以下兩個(gè)方面最為重要:
算法思維:把工作交給機(jī)器。大數(shù)據(jù)應(yīng)用是一個(gè)極為復(fù)雜的系統(tǒng),大數(shù)據(jù)系統(tǒng)包括數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)傳輸、數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)展示等許多環(huán)節(jié),其中任何一項(xiàng)工作都是人力所難以勝任的,一定要借助計(jì)算機(jī)的力量,通過事先編寫好的程度自動(dòng)完成。
我們在日常工作中也常常會(huì)做些調(diào)查研究、數(shù)據(jù)統(tǒng)計(jì)分析等,都是手工完成的,最多采用一些數(shù)據(jù)處理的工具,例如excel等。在大數(shù)據(jù)時(shí)代,我們面臨的是TB級(jí)、PB級(jí)的數(shù)據(jù),這遠(yuǎn)超出了人力所能處理的范疇。
算法思維的關(guān)鍵是要回答以下幾個(gè)問題:我們面對的問題是否可計(jì)算?計(jì)算復(fù)雜度有多大?是否存在在合理的時(shí)間和資源條件下可完成計(jì)算任務(wù)的有效的計(jì)算算法?這些問題有些專業(yè),并非管理人員能回答,具體答案可以交給技術(shù)人員去完成,但是管理人員在決策時(shí)需要考慮到這些問題。
基于大數(shù)據(jù)的求解問題的算法不能太復(fù)雜,需要比較簡單才可行。舉個(gè)智能翻譯的例子。(17)傳統(tǒng)翻譯軟件設(shè)定了很多語法規(guī)則,用這些僵化的規(guī)則拆解每個(gè)句子,再逐字翻譯生成不同的語句。但這往往使翻譯出來的語句生硬拗口,甚至錯(cuò)誤率很高。谷歌的翻譯軟件卻不是這么做,他們從大量已存的翻譯文章中對比,找出最合適的翻譯的文字。事實(shí)證明雖然網(wǎng)上搜集來的翻譯文章有不少是錯(cuò)誤的,或者質(zhì)量不高,但由于數(shù)據(jù)量極大,這些錯(cuò)誤可以通過排序被過濾掉,這種方法大大提高了翻譯的質(zhì)量和準(zhǔn)確性。也就是說,不精確的大數(shù)據(jù)用簡單算法,比精確的小數(shù)據(jù)用復(fù)雜算法要有效得多!以大數(shù)據(jù)方式做翻譯的另一個(gè)好處是,系統(tǒng)會(huì)隨著數(shù)據(jù)的積累而不斷改善。如果您看到某條譯文不太合適,可以點(diǎn)擊相關(guān)詞組查看備選翻譯結(jié)果。當(dāng)您點(diǎn)擊更好的備選譯文時(shí),Google翻譯會(huì)記下您的反饋,并在日后繼續(xù)改進(jìn)。谷歌翻譯目前能夠支持71種語言的互譯,2012年用戶的使用次數(shù)達(dá)到2億次。
用簡單的算法,在大數(shù)據(jù)上能夠創(chuàng)造出復(fù)雜的人工智能,使計(jì)算機(jī)代替人類完成動(dòng)態(tài)監(jiān)測、語音咨詢、作業(yè)批改乃至醫(yī)療診斷、法律文書處理等專業(yè)任務(wù)。這種處理不僅是實(shí)時(shí)的、大批量的,更是科學(xué)的、精準(zhǔn)的。
美國郵政(USPS)的計(jì)算機(jī)系統(tǒng)能夠自動(dòng)掃描郵件的相關(guān)數(shù)據(jù)(存放位置、派送路線、重量、體積等信息),通過與數(shù)據(jù)庫中近4千億條數(shù)據(jù)的比較,甄別出“郵資欺詐”的郵件。掃描一封郵件只需要50~100毫秒。一旦檢測出了“異?!?mdash;—比如包裹郵資不足或者郵票重復(fù)使用等情況,系統(tǒng)就會(huì)對信件實(shí)施實(shí)時(shí)攔截,再由分揀人員對其進(jìn)行特殊處理。有趣的是,該項(xiàng)目竟然由此形成了“威懾效應(yīng)”。自從2006年開始實(shí)施此計(jì)劃起,“郵資欺詐”行為減少了很多。(18)
把工作交給機(jī)器,讓機(jī)器替代或輔助人工,不僅是科技的未來,更是政務(wù)大數(shù)據(jù)的未來。
平臺(tái)思維:給工作搭一個(gè)舞臺(tái)?!捌脚_(tái)”指計(jì)算機(jī)硬件或軟件的操作環(huán)境,泛指進(jìn)行某項(xiàng)工作所需要的環(huán)境或條件,包括技術(shù)平臺(tái)、業(yè)務(wù)平臺(tái)、數(shù)據(jù)平臺(tái)等?!捌脚_(tái)”不是一天就建立起來的,需要巨大的建設(shè)投資和長期的運(yùn)行維護(hù)成本。我們的一切工作都需要在這個(gè)平臺(tái)上進(jìn)行。平臺(tái)一旦建成,中途也很難更換。因此,平臺(tái)的規(guī)劃、技術(shù)選擇等就成為開展大數(shù)據(jù)應(yīng)用的重要課題之一。
由于大數(shù)據(jù)應(yīng)用種類非常繁多,特征各不相同,一種普遍被接受的觀點(diǎn)是大數(shù)據(jù)平臺(tái)應(yīng)該是因應(yīng)用而異的。例如,就數(shù)據(jù)管理而言,傳統(tǒng)關(guān)系數(shù)據(jù)庫管理系統(tǒng)(DBMS)秉承的“全能型”(one-size-fits-all)理念不再適用于紛繁復(fù)雜的現(xiàn)實(shí)應(yīng)用:數(shù)據(jù)不同,負(fù)載不同,應(yīng)用場景不同等,導(dǎo)致每一類典型應(yīng)用都需要有相應(yīng)的數(shù)據(jù)管理系統(tǒng)。
“平臺(tái)”的可擴(kuò)展性也是一個(gè)重要的問題。從組織IT架構(gòu)體系上來看,必須考慮可擴(kuò)展性的問題:隨著使用人數(shù)的增多、業(yè)務(wù)量的增加,系統(tǒng)必須具備能夠及時(shí)擴(kuò)展IT系統(tǒng)的能力。解決這個(gè)問題通常有兩種方式:縱向擴(kuò)容(Scale up)和橫向擴(kuò)容(Scale out),兩種擴(kuò)容的方式分別從兩個(gè)維度來解決數(shù)據(jù)管理壓力??v向擴(kuò)容就是將數(shù)據(jù)庫服務(wù)器的配置提高,如增加硬件資源配置,通過硬件速度提升來解決訪問壓力。橫向擴(kuò)容就是將應(yīng)用的數(shù)據(jù)拆分,將原來集中存儲(chǔ)的數(shù)據(jù)根據(jù)一定的規(guī)則分布到不同的物理數(shù)據(jù)庫服務(wù)器上??v向擴(kuò)容模式實(shí)施成本較高,壓力大到一定程度之后,硬件可能無法滿足這類需求。如果能夠通過疊加相對廉價(jià)設(shè)備的方式實(shí)現(xiàn)存儲(chǔ)和計(jì)算能力的擴(kuò)展,那么這將是長期可擴(kuò)展的有效手段。這是橫向擴(kuò)容的優(yōu)勢。
舉例來說,我國的群體性事件時(shí)有發(fā)生。政府為了加強(qiáng)對群體性事件的發(fā)現(xiàn)和處置能力,就需要有一個(gè)基于大數(shù)據(jù)的輿情分析平臺(tái),加強(qiáng)輿情研判能力,以捕捉最佳處置時(shí)機(jī)。這個(gè)平臺(tái)需要自動(dòng)收集各種社交網(wǎng)絡(luò)上的信息并進(jìn)行整合,監(jiān)控社會(huì)輿情和公眾情緒,并具有能對網(wǎng)民群體行為進(jìn)行社會(huì)態(tài)勢分析與預(yù)警的能力,將可能釀成重大輿情危機(jī)的不穩(wěn)定苗頭化解在萌芽狀態(tài)。這個(gè)平臺(tái)需要管理各種結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),需要很強(qiáng)的橫向擴(kuò)展能力和實(shí)時(shí)數(shù)據(jù)分析能力。建設(shè)這個(gè)平臺(tái)將成為政府一項(xiàng)投資巨大、挑戰(zhàn)巨大的任務(wù)。
結(jié)束語
面對新一輪的大數(shù)據(jù)革命,由于技術(shù)的全球化和開放性,中國具有獨(dú)特的“后發(fā)優(yōu)勢”,在很多方面甚至具備創(chuàng)新和超越的可能。
當(dāng)然,在科技迅猛發(fā)展的今天,還有相當(dāng)多的農(nóng)民和城市底層居民,因?yàn)楦鞣N原因而成為信息時(shí)代的缺席者,無法在網(wǎng)絡(luò)世界表達(dá)意見和訴求。例如,用駕駛員的智能手機(jī)收集交通擁堵、路面坑洼數(shù)據(jù),這固然是一個(gè)以低成本收集信息的途徑,但是,這樣收集的信息是存在盲區(qū)的,一些貧窮社區(qū)、老年社區(qū)的道路很可能會(huì)因?yàn)閳?bào)告較少而得不到及時(shí)的維護(hù)。在中國,數(shù)字鴻溝造成的差別正在成為繼城鄉(xiāng)差別、工農(nóng)差別、腦體差別“三大差別”之后的“第四大差別”,其本身已不僅僅是一個(gè)技術(shù)問題,而正在成為一個(gè)社會(huì)問題。只有確保人們能夠平等地享用現(xiàn)代通信和網(wǎng)絡(luò)基礎(chǔ)設(shè)施,擁有大體平等的教育機(jī)會(huì),才能使這些問題得到解決。
黨的十八屆三中全會(huì)將“國家治理體系和治理能力的現(xiàn)代化”列為全面深化改革的總目標(biāo),大數(shù)據(jù)應(yīng)當(dāng)成為國家治理現(xiàn)代化的題中之義,在頂層設(shè)計(jì)和國家戰(zhàn)略層面予以部署。大數(shù)據(jù)治理的內(nèi)涵還很豐富,還有待我們進(jìn)一步認(rèn)識(shí)、進(jìn)一步闡釋,有關(guān)數(shù)據(jù)質(zhì)量、數(shù)據(jù)隱私、數(shù)據(jù)安全、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)溯源、數(shù)據(jù)開放、數(shù)據(jù)定價(jià)估價(jià)等也都是非常重要而現(xiàn)實(shí)的課題。但是變化正在發(fā)生,你我置身其中,數(shù)據(jù)治國的時(shí)代已經(jīng)來臨。
?。ㄖ袊嗣翊髮W(xué)中國調(diào)查與數(shù)據(jù)中心研究人員馮啟娜對此文亦有貢獻(xiàn))
注釋
?。?)涂子沛:《數(shù)據(jù)之巔:大數(shù)據(jù)革命的歷史、現(xiàn)實(shí)與未來》,北京:中信出版社,2014年,第292、337頁。
(2)[美]斯蒂芬·貝克:《當(dāng)我們變成一堆數(shù)字》,北京:中信出版社,2007年。
?。?)[美]安德魯·麥卡菲(Andrew McAfee)、埃里克·布林約爾松(Erik Brynjolfsson):《大數(shù)據(jù):一場管理革命》,《哈佛商業(yè)評論》,2012年10月。
?。?)洪黎明:《物聯(lián)網(wǎng):“智能城市”生長的沃土》,《福建日報(bào)》,2010年12月23日,第15版。
?。?)1919年,胡適寫下了一篇著名的雜文《差不多先生傳》,活靈活現(xiàn)地描繪出了中國人取道中庸、不肯認(rèn)真、甘于糊涂、拒絕精準(zhǔn)的庸碌形象,表達(dá)了對中國人“凡事差不多、凡事只講大致如此”的習(xí)慣和作風(fēng)的憂慮。
(6)《北漂小伙返鄉(xiāng)6次辦護(hù)照 補(bǔ)5張證明多跑3000公里》,“焦點(diǎn)訪談”,央視網(wǎng),2013年10月11日。
?。?)[美]凱文·凱利:《技術(shù)元素》,北京:電子工業(yè)出版社,2014年,第223頁。
?。?)(17)[英]維克托·邁爾-舍恩伯格(Viktor Mayer-Schnberger):《大數(shù)據(jù)時(shí)代》,杭州:浙江人民出版社,2013年,第53~55、73頁。
?。?)(10)涂子沛:《大數(shù)據(jù):正在到來的數(shù)據(jù)革命》,桂林:廣西師范大學(xué)出版社,2012年,第77~82、313頁。
?。?1)[美]安雅·卡緬涅茨(Anya Kamenetz):《技術(shù)公民占領(lǐng)政府:政府2.0時(shí)代的凱歌》(How an Army of Techies Is Taking on City Hall),高成長公司(Fast Company),2010年。
?。?2)徐繼華、馮啟娜、陳貞汝:《智慧政府:大數(shù)據(jù)治國時(shí)代的來臨》,北京:中信出版社,2014年,第33~34頁。
?。?3)UN Global Pulse, Big Data for Development: Challenges & Opportunities, May, 2012.
?。?4)聯(lián)合國:《聯(lián)合國全球脈動(dòng):分析實(shí)時(shí)數(shù)據(jù) 增進(jìn)人類福祉》,聯(lián)合國新聞網(wǎng),2011年11月8日。
?。?6)Wing J M., Computational Thinking, Communications of the ACM, 2006.
(18)張婷:《美國郵政探尋“大數(shù)據(jù)”生存之道》,新華網(wǎng),2013年4月19日。
