摘要

 
  大數(shù)據(jù)正在成為國家的重要戰(zhàn)略資源,已是社會各界關(guān)注的焦點(diǎn)。從大數(shù)據(jù)的概念入手,界定了大數(shù)據(jù)概念的內(nèi)涵、外延,指出政務(wù)大數(shù)據(jù)應(yīng)用應(yīng)成為政府管理改革的全新階段?;趪鴥?nèi)外政務(wù)大數(shù)據(jù)發(fā)展現(xiàn)狀,在評述國內(nèi)外政府大數(shù)據(jù)應(yīng)用發(fā)展的基礎(chǔ)上,提出中國政務(wù)大數(shù)據(jù)發(fā)展需堅(jiān)持整體性政府、透明化政府和服務(wù)型政府三個基本方向,需避免將將大數(shù)據(jù)等同于開放數(shù)據(jù)、共享數(shù)據(jù)和海量數(shù)據(jù)三大認(rèn)識誤區(qū),需警惕數(shù)據(jù)權(quán)的惡意使用或過度濫用、大數(shù)據(jù)帶來的信息歧視和互聯(lián)網(wǎng)公司侵害國家數(shù)據(jù)主權(quán)三大潛在問題。
 
  近年來,大數(shù)據(jù)在全球范圍內(nèi)受到追捧。據(jù)國際數(shù)據(jù)資訊(IDC)公司監(jiān)測,全球數(shù)據(jù)量大約每兩年翻一番,預(yù)計(jì)到2020年,全球?qū)碛?5ZB的數(shù)據(jù)量。據(jù)統(tǒng)計(jì),平均每一秒即有200萬用戶在使用Google搜索,F(xiàn)acebook注冊用戶超過10億,每天生成300TB以上的日志數(shù)據(jù)。同時,傳感網(wǎng)、物聯(lián)網(wǎng)、社交網(wǎng)絡(luò)等技術(shù)迅猛發(fā)展,引發(fā)數(shù)據(jù)規(guī)模爆炸式增長,大數(shù)據(jù)時代已經(jīng)到來。著名的管理和咨詢公司麥肯錫(McKinsey)認(rèn)為,“大數(shù)據(jù)已經(jīng)滲透到工業(yè)和商業(yè)領(lǐng)域的各個方面,成為影響生產(chǎn)的一個重要因素”,大數(shù)據(jù)的應(yīng)用涉及經(jīng)濟(jì)、文化、教育、醫(yī)療、公共管理等各行各業(yè)。正是由于大數(shù)據(jù)的廣泛應(yīng)用及其背后蘊(yùn)藏的巨大潛力和價值,許多國家紛紛將“大數(shù)據(jù)”的建設(shè)和發(fā)展上升為國家戰(zhàn)略,積極推動大數(shù)據(jù)應(yīng)用的發(fā)展。
 
  中國政府雖已發(fā)布《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》,將數(shù)據(jù)定性為國家基礎(chǔ)性戰(zhàn)略資源,但各級政府在推動政務(wù)大數(shù)據(jù)應(yīng)用方面,仍存在不少問題。所謂政務(wù)大數(shù)據(jù),是指政府推動大數(shù)據(jù)應(yīng)用發(fā)展的過程或大數(shù)據(jù)在公共服務(wù)領(lǐng)域的應(yīng)用實(shí)踐。本文在評述國內(nèi)外政務(wù)大數(shù)據(jù)應(yīng)用發(fā)展的基礎(chǔ)上,界定了大數(shù)據(jù)的概念內(nèi)涵和外延,指出中國政務(wù)大數(shù)據(jù)應(yīng)用發(fā)展的方向及應(yīng)避免的認(rèn)識誤區(qū)和需警惕的潛在問題。
 
  一、大數(shù)據(jù)的概念內(nèi)涵及其外延
 
  對于大數(shù)據(jù)概念的界定,目前尚無統(tǒng)一的認(rèn)識。由于所從事學(xué)科領(lǐng)域的差異,國內(nèi)外學(xué)者對“大數(shù)據(jù)”有不同的看法。一些學(xué)者從計(jì)算科學(xué)角度出發(fā),認(rèn)為大數(shù)據(jù)是指無法在可容忍的時間內(nèi)用傳統(tǒng)IT技術(shù)和軟硬件工具對其進(jìn)行感知、獲取、管理、處理和服務(wù)的數(shù)據(jù)集合。[1]還有學(xué)者從信息資源的角度出發(fā),指出大數(shù)據(jù)是具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。[2]而近年來,從事社會科學(xué)領(lǐng)域研究的學(xué)者認(rèn)為,大數(shù)據(jù)的概念內(nèi)涵不應(yīng)僅僅局限在技術(shù)層面:大數(shù)據(jù)可以定義為在合理時間內(nèi)采集大規(guī)模資料、處理成為常規(guī)使用者更有效決策的社會過程。[3]基于現(xiàn)有學(xué)者對“大數(shù)據(jù)”的研究,本文從大數(shù)據(jù)的內(nèi)涵、外延出發(fā),分別作界定(參見圖1)。

大數(shù)據(jù)概念的內(nèi)涵及外延

圖1 大數(shù)據(jù)概念的內(nèi)涵及外延
 
  從概念內(nèi)涵來看,大數(shù)據(jù)是指海量數(shù)據(jù),泛指大規(guī)?;虺笠?guī)模的數(shù)據(jù)資源集合。與傳統(tǒng)數(shù)據(jù)相比,大數(shù)據(jù)具有新的特點(diǎn),現(xiàn)可概括為“5V”,即Volume(數(shù)據(jù)規(guī)模大)、Velocity(處理速度快)、Variety(數(shù)據(jù)類型多)、Value(價值密度低)、Veracity(數(shù)據(jù)準(zhǔn)確性低)。
 
  從概念外延來看,大數(shù)據(jù)還具有如下三個層面的含義:
 
  一是指一種新型的研究方法或發(fā)現(xiàn)新知識的分析技術(shù)。這是因?yàn)榇髷?shù)據(jù)不僅強(qiáng)調(diào)數(shù)據(jù)量大,更重視海量數(shù)據(jù)背后的價值信息。從本質(zhì)上說,大數(shù)據(jù)是應(yīng)對人類數(shù)據(jù)量劇增挑戰(zhàn)而產(chǎn)生的一種新技術(shù)。據(jù)統(tǒng)計(jì),全球約90%的數(shù)據(jù)產(chǎn)生于最近兩年間,目前每天新增數(shù)據(jù)量達(dá)到2.5TB。[4]IDC的預(yù)測則指出,2011年全球數(shù)據(jù)總量約1.8ZB,到2020年則將激增到40ZB,其中文本、視頻、圖片等非結(jié)構(gòu)化數(shù)據(jù)占比將達(dá)到75%。面對這樣一個全球數(shù)據(jù)的爆炸性增長,沒有一套全新的數(shù)據(jù)處理和分析技術(shù)是無法想象的。
 
  二是指由數(shù)據(jù)驅(qū)動的新型決策機(jī)制。Gang-Hoon Kim等認(rèn)為,大數(shù)據(jù)技術(shù)屬于第五代決策分析技術(shù)。[5]在大數(shù)據(jù)時代,小到商業(yè)機(jī)構(gòu)的營銷分析,大到公共領(lǐng)域的政府決策,越來越多地依靠數(shù)據(jù)作出。這種基于數(shù)據(jù)驅(qū)動的新型決策機(jī)制,表明了大數(shù)據(jù)不僅僅是一種技術(shù),更是一種理念創(chuàng)新和模式創(chuàng)新。如美國沃爾瑪連鎖超市因“啤酒與尿布”的購物籃數(shù)據(jù)分析而獲得大量利潤,美國總統(tǒng)奧巴馬依靠競選團(tuán)隊(duì)的數(shù)據(jù)分析而作出的競選決策等,都是大數(shù)據(jù)時代由數(shù)據(jù)驅(qū)動決策的經(jīng)典案例。
 
  三是指數(shù)字時代下的新型治理模式。大數(shù)據(jù)不僅僅是政府管理的一種新手段或新工具,它還將帶來政府管理改革的一個全新階段。隨著大數(shù)據(jù)在政府管理和公民社會生活的深入,政府部門內(nèi)部及其與公民社會的關(guān)系將被重新建構(gòu)。技術(shù)、組織、關(guān)系和行為的再造呼喚全新的管理模式的出現(xiàn),這種新的管理模式就是數(shù)字時代的治理。[6]這種創(chuàng)新的治理模式不只是政府內(nèi)部自身的數(shù)字化變革,還將是廣泛深遠(yuǎn)的社會變革和管理方式的創(chuàng)新。[7]從這個層面看,由大數(shù)據(jù)應(yīng)用帶來的數(shù)字治理模式創(chuàng)新將成為政府管理改革的全新階段。Amanda Clarke等認(rèn)為,在過去的100年間,政府機(jī)構(gòu)設(shè)置經(jīng)歷了三種模式(參見圖2)。[8]

圖2 行政管理的三種模式
 
  首先是韋伯模式,其基本特征是基于書面文獻(xiàn)和大規(guī)??茖蛹壗Y(jié)構(gòu)的控制模式。[9]在這一模式下,政府信息化致力于社會集成,即辦公自動化,政府獲取和掌握數(shù)據(jù)資源的能力較弱。從20世紀(jì)60年代開始,韋伯式政府機(jī)構(gòu)開始面向數(shù)字化轉(zhuǎn)型,但其數(shù)據(jù)主要來自內(nèi)部業(yè)務(wù)運(yùn)轉(zhuǎn),是一個封閉和不透明的系統(tǒng)。在韋伯式結(jié)構(gòu)中,很少使用數(shù)據(jù)來理解公民的想法,并為政策制定提供依據(jù)。
 
  自20世紀(jì)80年代到21世紀(jì)初,新公共管理(NPM)模式成為政府管理改革的主要模式,該模式強(qiáng)調(diào)大型部門的解構(gòu),引入政府機(jī)構(gòu)間競爭機(jī)制以及業(yè)務(wù)線管理機(jī)制等。[10]在這一模式中,信息技術(shù)在最初被用于更好地傳遞服務(wù)之后,也逐漸被邊緣化了,因?yàn)榧みM(jìn)的NPM理論認(rèn)為信息技術(shù)技能應(yīng)當(dāng)剝離給外部服務(wù)供應(yīng)商。[11]由于政府IT部門被外包出去,甚至在某些情況下被私有化,公民使用政府服務(wù)所產(chǎn)生的數(shù)據(jù)被計(jì)算機(jī)服務(wù)商所擁有,從而與服務(wù)供給脫節(jié)。且由于擔(dān)心招來不必要的政府審計(jì),這些服務(wù)提供商往往選擇雪藏這些數(shù)據(jù),而不是將其反饋到政府決策過程之中。[12]這些情況的出現(xiàn),實(shí)際上導(dǎo)致NPM模式下的政府機(jī)構(gòu)既不了解公民也不了解他們自己。
 
  自2000年以來,一種新的公共管理模式——數(shù)字時代治理(Digital-Era Governance,DEG)模式出現(xiàn)。[13]這種模式將數(shù)字化技術(shù)置于機(jī)構(gòu)層級的核心位置,恢復(fù)了被NPM模式所阻隔的“政府—公民數(shù)據(jù)流”。DEG模式的基礎(chǔ)有三,即對紙質(zhì)和基于電話的信息系統(tǒng)的完全數(shù)據(jù)化,以用戶為中心的服務(wù)一體化,以及對碎片化政府機(jī)構(gòu)的重組與整合。在DEG模式下,政府將跨層級的數(shù)據(jù)管理從原先的私人部門管理轉(zhuǎn)移到集中化的“智能中心”模式,這種模式類似于沃爾瑪?shù)拇髷?shù)據(jù)倉庫管理模式,比原來的政府?dāng)?shù)據(jù)管理模式有效得多。大數(shù)據(jù)的興起,正好與政府管理模式的這一變革遙相呼應(yīng)。
 
  二、國內(nèi)外政務(wù)大數(shù)據(jù)發(fā)展現(xiàn)狀
 
  由于“大數(shù)據(jù)”的廣泛應(yīng)用以及“大數(shù)據(jù)”蘊(yùn)藏的巨大潛力和價值,許多國家紛紛將“大數(shù)據(jù)”的建設(shè)和發(fā)展上升為國家戰(zhàn)略。2012年3月29日,美國正式發(fā)布了《大數(shù)據(jù)研究和發(fā)展倡議》(Big Data Research and Development Initiative)[14],該倡議書中提到,大數(shù)據(jù)計(jì)劃的實(shí)施,旨在幫助美國獲得從海量復(fù)雜數(shù)據(jù)集中萃取知識的能力,借此提高國家應(yīng)對急迫挑戰(zhàn)的能力。這一計(jì)劃類似于過去美國聯(lián)邦政府在高性能計(jì)算和互聯(lián)網(wǎng)等領(lǐng)域的戰(zhàn)略性投入,并旨在推動國家在科學(xué)研究、教育和國家安全等領(lǐng)域的能力提升。該倡議書的發(fā)布,標(biāo)志著大數(shù)據(jù)已經(jīng)上升成為美國在計(jì)算服務(wù)領(lǐng)域的國家戰(zhàn)略。英國、加拿大、新加坡、日本、韓國等國家紛紛推出了以開放、融合、創(chuàng)新為特征的新一輪信息技術(shù)革命推進(jìn)政策。如英國政府所宣布的一項(xiàng)價值1.89億英鎊的“大數(shù)據(jù)”發(fā)展計(jì)劃,意在推動“大數(shù)據(jù)”在商業(yè)、醫(yī)療、農(nóng)業(yè)和科學(xué)研究等方面的應(yīng)用;法國政府發(fā)布的“數(shù)字路線圖(Digital Roadmap)”,計(jì)劃投資1000余萬歐元用于支持包括大數(shù)據(jù)在內(nèi)的7個尖端領(lǐng)域的研究;澳大利亞聯(lián)邦政府發(fā)布“澳大利亞公共服務(wù)大數(shù)據(jù)戰(zhàn)略”,以推動公共行業(yè)利用大數(shù)據(jù)分析進(jìn)行服務(wù)改革等。2011年9月20日,美國、英國、挪威、墨西哥、印度尼西亞、菲律賓、巴西、南非等八國發(fā)起成立“開放政府聯(lián)盟”,發(fā)布了《開放政府宣言》,目前全球已經(jīng)有超過60個國家加入該聯(lián)盟,貼近互聯(lián)網(wǎng)、開發(fā)大數(shù)據(jù)、造福全社會已經(jīng)成為當(dāng)前發(fā)達(dá)國家政務(wù)信息化的主流聲音。
 
  相較而言,國內(nèi)對于大數(shù)據(jù)的研究起步較晚。始于1993年國家自然科學(xué)基金會成立的“大數(shù)據(jù)共享聯(lián)盟”,以搜集和展示大數(shù)據(jù)的研究開發(fā)為主。自1999年起,“第三屆亞太地區(qū)知識發(fā)現(xiàn)與數(shù)據(jù)挖掘國際會議”“Hadoop與大數(shù)據(jù)技術(shù)大會”和“大數(shù)據(jù)共享聯(lián)盟”等才開始開展有關(guān)大數(shù)據(jù)研究和開發(fā)的促進(jìn)工作。[15]2008年,“計(jì)算社區(qū)聯(lián)盟”(Computing Community Consortium)在《大數(shù)據(jù)計(jì)算:在商務(wù)、科學(xué)和社會領(lǐng)域創(chuàng)建革命性突破》報告中詳盡闡述了大數(shù)據(jù)對社會治理的推動作用,以及潛在的商業(yè)價值。[3]直到2013年,維克托·邁爾-舍恩伯格的《大數(shù)據(jù)時代:生活、工作與思維的大變革》一書才掀起國內(nèi)的“大數(shù)據(jù)”熱潮。自2013年以來,大數(shù)據(jù)、互聯(lián)網(wǎng)、云計(jì)算等新興產(chǎn)業(yè)得到了中國政府的高度重視。李克強(qiáng)總理在2014年《政府工作報告》中明確提出,要設(shè)立新興產(chǎn)業(yè)創(chuàng)業(yè)創(chuàng)新平臺,在大數(shù)據(jù)、云計(jì)算等方面趕超先進(jìn),引領(lǐng)未來產(chǎn)業(yè)發(fā)展。國務(wù)院常務(wù)會議多次專題研究部署推進(jìn)互聯(lián)網(wǎng)、大數(shù)據(jù)等新興產(chǎn)業(yè)的快速發(fā)展,科技部、發(fā)改委、工信部等部委在科技和產(chǎn)業(yè)化專項(xiàng)中對新一代信息技術(shù)給予重點(diǎn)支持,在推進(jìn)技術(shù)研發(fā)方面取得了積極效果。在國家層面的積極鼓勵和倡導(dǎo)下,各地政府高度重視互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等新興產(chǎn)業(yè)發(fā)展。2014年2月,廣東省率先提出設(shè)立廣東省大數(shù)據(jù)管理局,并正式公布了《廣東省大數(shù)據(jù)發(fā)展規(guī)劃(2015-2020年)》,為大數(shù)據(jù)產(chǎn)業(yè)發(fā)展注入了強(qiáng)大動力。上海、北京等地率先推出了政府?dāng)?shù)據(jù)資源開放共享網(wǎng)絡(luò)平臺,整合本地區(qū)數(shù)十個部門的政務(wù)大數(shù)據(jù)資源,向全社會開放共享,為企業(yè)和個人開展政務(wù)信息資源的社會化開發(fā)利用提供數(shù)據(jù)支撐。貴州省提出建設(shè)“云上貴州”計(jì)劃,并力爭成為全國首個基于云計(jì)算建成省級政府?dāng)?shù)據(jù)共享平臺的省份。重慶、內(nèi)蒙古、陜西、湖北等地都提出建設(shè)大數(shù)據(jù)和云計(jì)算產(chǎn)業(yè)基地的計(jì)劃,力圖將新興產(chǎn)業(yè)培育成本地的支柱產(chǎn)業(yè)。2015年4月,國家發(fā)改委在部委中首家專門成立了大數(shù)據(jù)分析中心——國家發(fā)改委互聯(lián)網(wǎng)大數(shù)據(jù)分析中心,全面支撐國家發(fā)改委宏觀調(diào)控和重大決策,這標(biāo)志著中國大數(shù)據(jù)產(chǎn)業(yè)已經(jīng)開始進(jìn)入應(yīng)用深化的全新階段。
 
  三、政務(wù)大數(shù)據(jù)需堅(jiān)持的三個基本方向
 
  (一)整體性政府
 
  整體性政府強(qiáng)調(diào)政府內(nèi)部須實(shí)現(xiàn)機(jī)構(gòu)、部門、專業(yè)、層級等之間的協(xié)調(diào)整合,以更好地解決公眾需求,避免因政府內(nèi)部矛盾沖突而造成的公共服務(wù)效率低下。Michael Milakovich指出,單一數(shù)據(jù)源已越來越難以滿足應(yīng)對很多政策領(lǐng)域日益復(fù)雜問題的需求,未來將會出現(xiàn)越來越多跨數(shù)據(jù)集的聯(lián)系,且在數(shù)字時代,政府治理的關(guān)鍵在于整合多數(shù)據(jù)源的公共管理模式,因此,推動政務(wù)大數(shù)據(jù)應(yīng)用首先應(yīng)堅(jiān)持整體性政府方向,推動政府間的數(shù)據(jù)共享與業(yè)務(wù)協(xié)同。[16]在英國,曾有報道稱,由于缺乏跨部門溝通,當(dāng)?shù)鼐觳块T和醫(yī)院系統(tǒng)推進(jìn)的一個分享暴力犯罪數(shù)據(jù)的項(xiàng)目最終宣告失敗。[17]相比商業(yè)機(jī)構(gòu)而言,政府在推進(jìn)大數(shù)據(jù)方面所面臨的挑戰(zhàn)更加尖銳,因?yàn)樗麄儽仨氃谧駨陌踩院拖嚓P(guān)法規(guī)的前提下,不斷打破部門孤島來推進(jìn)數(shù)據(jù)的集成。[5]政府部門不僅要應(yīng)對多數(shù)據(jù)源和不同格式數(shù)據(jù)的集成分析等大數(shù)據(jù)領(lǐng)域通行問題,還要面對很多政府部門特有的挑戰(zhàn)和問題。但對推進(jìn)政務(wù)大數(shù)據(jù)應(yīng)用而言,無論是對政府自身監(jiān)管行為所產(chǎn)生的大數(shù)據(jù),還是對公民在社交媒體或其他網(wǎng)絡(luò)平臺上所產(chǎn)生的行為數(shù)據(jù)進(jìn)行采集和分析,都可能促進(jìn)政府機(jī)構(gòu)中跨層級的“智能中心”的建立。如在美國“9·11事件”以后,借由國家安全之名,政府開始強(qiáng)力推進(jìn)跨部門電子數(shù)據(jù)共享。如美國國土安全部高度強(qiáng)調(diào)跨部門數(shù)據(jù)的互操作性,并應(yīng)用多種技術(shù)手段促進(jìn)數(shù)據(jù)在市政部門、社區(qū)、醫(yī)院、供血站、避難所等各類機(jī)構(gòu)之間的順暢流動。此外,美國在環(huán)保、交通、醫(yī)療和公共安全等領(lǐng)域的信息共享也取得了良好成效。
 
 ?。ǘ┩该骰?/div>
 
  R. C. Joseph等認(rèn)為,大數(shù)據(jù)分析技術(shù)的使用,能夠大大提升政府服務(wù)的效能。[18]大數(shù)據(jù)能夠提升電子政府的效率和效果,并促進(jìn)其進(jìn)一步演化為透明政府(transformational government,t-government),這被認(rèn)為是電子政府的最終演化階段。[19]大數(shù)據(jù)應(yīng)用建立在掌握數(shù)據(jù)的基礎(chǔ)上,以海量數(shù)據(jù)為前提,政務(wù)大數(shù)據(jù)的發(fā)展往往離不開政府開放數(shù)據(jù),這使得政府的透明度大大提高。紐約大學(xué)法學(xué)院教授貝絲·諾維克(Beth Novick)表示,數(shù)據(jù)的開放可以讓政府公職人員和民眾一起參與進(jìn)來,解決政府無法完成的、棘手的問題,更廣泛地發(fā)揮公眾力量,借助大數(shù)據(jù)平臺更好地進(jìn)行社會管理。隨著政府組織的行為及其與公眾的交互越來越數(shù)據(jù)化,在政府自身內(nèi)部系統(tǒng)中產(chǎn)生的各類大數(shù)據(jù)也為透明性政府建設(shè)提供了巨大潛力。在推進(jìn)政務(wù)大數(shù)據(jù)應(yīng)用中,政府的監(jiān)管方式應(yīng)不斷創(chuàng)新,更加透明。在最極端的情況下,如果我們可以設(shè)想一個機(jī)構(gòu)像維基百科那樣完全進(jìn)行數(shù)字化運(yùn)作,那么通過下載其所有的編輯歷史就可以提供該“組織”的所有完整的交互記錄,從而提供了一種迄今為止難以想象的機(jī)會去理解其治理安排。[20]隨著政府組織越來越“成為”一種前臺的網(wǎng)絡(luò)存在和后臺的信息處理系統(tǒng),大數(shù)據(jù)也將更有力地促進(jìn)上述整體性政府的最終形成。
 
 ?。ㄈ┓?wù)型政府
 
  大數(shù)據(jù)可以促進(jìn)政府公共服務(wù)水平的提升,有利于服務(wù)型政府的建立。M. R. Rajagopalan等[21]指出,在大數(shù)據(jù)時代,公眾可以更好地參與到政府工作之中,與政府分享信息,形成政府和公眾共同參與的政務(wù)決策機(jī)制。[22]社會公眾可以通過社交媒體、公開出版物、博客等渠道分享他們的意見,大數(shù)據(jù)分析技術(shù)可以處理這些非結(jié)構(gòu)化數(shù)據(jù),并將更好的服務(wù)和方案傳遞給所需的客戶群體。因此,在大數(shù)據(jù)背景下,任何政府都可以藉由政務(wù)大數(shù)據(jù)的采集、分析和利用,不斷推動優(yōu)化政府自身運(yùn)作流程和服務(wù)效能。而且,政務(wù)大數(shù)據(jù)分析是政府理解公民行為、解釋政策與公共服務(wù)優(yōu)劣的良好手段,也是政府決策者理解公眾需求與偏好的工具,以更好地理解人們對于公民參與的積極性,對立法變動的態(tài)度[8],以及對政府公共服務(wù)的需求。美國國稅局(IRS)曾經(jīng)重新設(shè)計(jì)其納稅申報流程,并應(yīng)用大數(shù)據(jù)技術(shù)手段來提高對納稅欺詐和納稅不遵從行為的自動監(jiān)測。在美國,隨著聯(lián)邦政府各個機(jī)構(gòu)對于大數(shù)據(jù)分析的應(yīng)用,政府在處理自身事務(wù)時將花費(fèi)越來越少的精力。此外,大數(shù)據(jù)還可有效改進(jìn)政府績效管理方法,促進(jìn)公共服務(wù)的提升。Michael Milakovich指出,以往政府部門的績效管理往往是滯后的,因?yàn)槠渲饕蕾囈恍┦潞蟮闹笜?biāo)來評估政府工作的效果。[16]未來,政府管理部門應(yīng)當(dāng)更多依靠實(shí)時性數(shù)據(jù)來提升政府管理效能。
 
  四、政務(wù)大數(shù)據(jù)需避免的三大認(rèn)識誤區(qū)
 
 ?。ㄒ唬⒋髷?shù)據(jù)等同于開放數(shù)據(jù)
 
  由于目前尚無對“大數(shù)據(jù)”的標(biāo)準(zhǔn)界定,政府部門對大數(shù)據(jù)的認(rèn)識存在混亂,有將開放數(shù)據(jù)等同于大數(shù)據(jù),有將任何“大”的政府?dāng)?shù)據(jù)集的發(fā)布都當(dāng)作是大數(shù)據(jù)。但事實(shí)上,很多開放數(shù)據(jù)只是離散的“小數(shù)據(jù)”,并不具備大規(guī)模、未經(jīng)處理和非結(jié)構(gòu)化等大數(shù)據(jù)的基本特征,且很多通過開放數(shù)據(jù)機(jī)構(gòu)發(fā)布的在線數(shù)據(jù)集僅僅是一個可用的樣本集。同時,雖然開放數(shù)據(jù)對于促進(jìn)政務(wù)大數(shù)據(jù)應(yīng)用意義很大,但當(dāng)開放數(shù)據(jù)僅僅是由于上級部門的指令要求,并對政府部門本身工作并沒有任何回饋時,開放數(shù)據(jù)項(xiàng)目就會缺乏可持續(xù)性??紤]到開放數(shù)據(jù)并不是不需要成本(公務(wù)員需要花時間去收集這些數(shù)據(jù),并發(fā)布出去),在政府看不到任何收益的情況下,將其維持下去會很困難。在加拿大和英國,已經(jīng)有證據(jù)表明,政府開放數(shù)據(jù)項(xiàng)目的可持續(xù)性受到了威脅,有些官員將開放數(shù)據(jù)描述為僅是由一小群愛好者推動的“桌角項(xiàng)目”。以美國的data.gov門戶網(wǎng)站為例,其在2012年包含有378529個原始空間數(shù)據(jù)集、1264個政府APP和236個公民開發(fā)APP。然而,到2014年,該網(wǎng)站的數(shù)據(jù)集事實(shí)上已經(jīng)下降到了108606個,且各種APP的數(shù)量也有所下降。這實(shí)際上也是因?yàn)榫W(wǎng)站數(shù)據(jù)集的可用性不佳造成的。[23,24]此外,為了便于開發(fā)者和分析者能夠不受數(shù)據(jù)格式限制而處理數(shù)據(jù),開放數(shù)據(jù)集都是以原始格式發(fā)布的,這將影響數(shù)據(jù)的獲得和使用。由于編碼缺乏一致性,這些數(shù)據(jù)在沒有電腦歸納的情況下非常難以理解,從而難以得到真正有效應(yīng)用??梢?,在推動政務(wù)大數(shù)據(jù)應(yīng)用中,不能簡單地將大數(shù)據(jù)等同于開放數(shù)據(jù)。
 
  (二)將大數(shù)據(jù)等同于共享數(shù)據(jù)
 
  Gang-Hoon Kim等對美國、英國、荷蘭、瑞士、新加坡、日本、韓國、澳大利亞等發(fā)達(dá)國家的24項(xiàng)政府大數(shù)據(jù)應(yīng)用進(jìn)行了統(tǒng)計(jì)分析,發(fā)現(xiàn)目前發(fā)達(dá)國家政府大數(shù)據(jù)應(yīng)用與商業(yè)領(lǐng)域大數(shù)據(jù)應(yīng)用相比,規(guī)模還有很大距離;且目前大部分政府大數(shù)據(jù)應(yīng)用的對象仍以結(jié)構(gòu)化數(shù)據(jù)為主,較少采用實(shí)時、動態(tài)、半結(jié)構(gòu)化甚至非結(jié)構(gòu)化數(shù)據(jù)。[5]這在中國政務(wù)大數(shù)據(jù)應(yīng)用中也較為常見。據(jù)調(diào)查,目前很多地方政府建設(shè)的大數(shù)據(jù)平臺,僅僅是過去政府共享數(shù)據(jù)平臺的“翻版”。政府推動大數(shù)據(jù)平臺建設(shè)的首要目的不是推動大數(shù)據(jù)應(yīng)用,而是統(tǒng)一政府信息基礎(chǔ)設(shè)施,實(shí)現(xiàn)各部門數(shù)據(jù)的互聯(lián)互通。然而,政府大數(shù)據(jù)不僅僅是政府自身的業(yè)務(wù)數(shù)據(jù),在當(dāng)今社會,有大量對政府治理有意義的大數(shù)據(jù)源,如金融、電商、醫(yī)療、社交媒體等,并不完全由政府自身掌握。在推動政務(wù)大數(shù)據(jù)應(yīng)用中,應(yīng)逐步整合政府外部數(shù)據(jù)資源,建設(shè)國家層面的全國性大數(shù)據(jù)中心,形成更加完善的治理決策支持體系,以在數(shù)據(jù)整合的基礎(chǔ)上實(shí)現(xiàn)服務(wù)整合。以澳大利亞Centrelink國家數(shù)據(jù)中心的建設(shè)為例,全國各地的Centrelink與數(shù)據(jù)中心直接聯(lián)網(wǎng),聯(lián)邦、州、當(dāng)?shù)氐姆?wù)機(jī)構(gòu),如稅務(wù)部門、金融機(jī)構(gòu)、警局等,也與數(shù)據(jù)中心實(shí)現(xiàn)聯(lián)網(wǎng)共享;Centrelink在多種服務(wù)渠道的后臺,借助信息通信技術(shù)將業(yè)務(wù)流程、服務(wù)、網(wǎng)絡(luò)和資源進(jìn)行優(yōu)化整合,便捷、高效地為公眾提供一體化的服務(wù)。
 
 ?。ㄈ⒋髷?shù)據(jù)等同于海量數(shù)據(jù)
 
  隨著大數(shù)據(jù)在中國的不斷發(fā)展,各個地方都開始興建大數(shù)據(jù)中心,但對于大數(shù)據(jù)中心的建設(shè),更多地還停留在“建機(jī)房、上設(shè)備、堆數(shù)據(jù)”的階段,忽視了大數(shù)據(jù)強(qiáng)調(diào)的是對數(shù)據(jù)的分析和應(yīng)用。對于政務(wù)大數(shù)據(jù)的推進(jìn)或大數(shù)據(jù)中心的建設(shè),首先應(yīng)有周密、嚴(yán)謹(jǐn)、細(xì)致的數(shù)據(jù)目錄體系頂層規(guī)劃,建立統(tǒng)一的數(shù)據(jù)資源目錄體系、數(shù)據(jù)標(biāo)準(zhǔn)體系、數(shù)據(jù)質(zhì)量審計(jì)體系和業(yè)務(wù)系統(tǒng)數(shù)據(jù)共享交換體系等;其次要有可對比、可回溯、可審計(jì)的數(shù)據(jù)質(zhì)量管理體系,保障數(shù)據(jù)采集獲取的可持續(xù)性,避免“數(shù)據(jù)陷阱”;再者,要有精通數(shù)據(jù)挖掘和業(yè)務(wù)建模的數(shù)據(jù)科學(xué)家隊(duì)伍,從政務(wù)應(yīng)用需求出發(fā),做好潛在數(shù)據(jù)價值的挖掘與應(yīng)用。此外,當(dāng)前不少學(xué)者還未真正認(rèn)識到大數(shù)據(jù)價值,認(rèn)為海量數(shù)據(jù)無法獲得,且大數(shù)據(jù)只是一種暫時性趨勢。殊不知,大數(shù)據(jù)雖指海量數(shù)據(jù),但并不是“全數(shù)據(jù)”,而是數(shù)據(jù)資源總量不斷增長的狀態(tài),且從“大數(shù)據(jù)”中挖掘出有價值信息才是大數(shù)據(jù)應(yīng)用的關(guān)鍵。
 
  五、政務(wù)大數(shù)據(jù)需警惕的三大潛在問題
 
 ?。ㄒ唬┚钄?shù)據(jù)權(quán)的惡意使用或過度濫用
 
  隨著大數(shù)據(jù)應(yīng)用的不斷推進(jìn),數(shù)據(jù)開始被視為重要的戰(zhàn)略資源,“世界經(jīng)濟(jì)論壇”報告曾指出大數(shù)據(jù)為新財(cái)富,價值堪比石油。在政治領(lǐng)域,數(shù)據(jù)的所有權(quán)是一種新的權(quán)利源泉。圍繞原始數(shù)據(jù)的占有權(quán)和發(fā)布權(quán)的斗爭將成為一個持久性的政治議題。一個不可否認(rèn)的政治事實(shí)是,意識形態(tài)的傾向性總是會影響對客觀事實(shí)的調(diào)查,并且對決策過程產(chǎn)生導(dǎo)向作用。當(dāng)前,數(shù)據(jù)權(quán)被濫用的案例普遍存在。如針對政府網(wǎng)站數(shù)據(jù)不準(zhǔn)確問題,2001年美國政府頒布了《數(shù)據(jù)質(zhì)量條例》(Data Quality Act),允許私人團(tuán)體對聯(lián)邦政府部門所發(fā)布信息的準(zhǔn)確性提出質(zhì)疑。很多反對美國環(huán)保政策的商業(yè)團(tuán)隊(duì)就經(jīng)常利用這一條款來拖延環(huán)保監(jiān)管工作的執(zhí)行。這條法律變成了環(huán)境保護(hù)監(jiān)管工作的一個巨大障礙,因?yàn)樗?jīng)常被用來拖延那些必要的監(jiān)管工作的正常開展。在推進(jìn)政務(wù)大數(shù)據(jù)應(yīng)用中,應(yīng)警惕數(shù)據(jù)權(quán)的惡意使用或過度使用。
 
 ?。ǘ┚璐髷?shù)據(jù)帶來的信息歧視
 
  大數(shù)據(jù)技術(shù)為基于證據(jù)的未來趨勢預(yù)測提供了一種可能,但同時有可能會帶來公平和公正的問題。Michael Milakovich指出,在政務(wù)大數(shù)據(jù)應(yīng)用中,數(shù)據(jù)挖掘階段最有可能引發(fā)對公民隱私權(quán)的侵害。[16]盡管作為一種提升公共服務(wù)傳遞的重要手段,數(shù)據(jù)挖掘本身的意圖是好的,但由政府收集和分析個人數(shù)據(jù),不可避免地會引發(fā)對公民自由問題的爭論。很多民眾正在失去對政府的信任,其中部分原因就是政府機(jī)構(gòu)擁有太多對公民個人數(shù)據(jù)的獲取手段,而相反對個人數(shù)據(jù)的保護(hù)手段卻太少。另外一個政務(wù)大數(shù)據(jù)應(yīng)用的障礙來自倫理上的挑戰(zhàn),數(shù)據(jù)“可被獲取,并不代表使用它就是道德的”[25]。大數(shù)據(jù)技術(shù)為基于證據(jù)的未來趨勢預(yù)測提供了一種可能,使得社會科學(xué)的研究可以做到像自然科學(xué)研究一樣的精準(zhǔn)、量化、客觀。大數(shù)據(jù)可以用于預(yù)測未來,人們可以基于大數(shù)據(jù)構(gòu)建政策制定的概率模型,分析未來可能會發(fā)生什么,但這些模型會帶來公平和公正的問題。舉例來說,通過應(yīng)用大數(shù)據(jù)技術(shù),我們可以識別一些犯罪的“熱點(diǎn)”區(qū)域,政府就可以在犯罪發(fā)生之前更好預(yù)知其發(fā)生規(guī)律,而生活在這些區(qū)域的人將會因此而比其他地方的人面臨更高的被逮捕率。[26]
 
 ?。ㄈ┚杌ヂ?lián)網(wǎng)公司侵害國家數(shù)據(jù)主權(quán)
 
  由于中國數(shù)據(jù)產(chǎn)權(quán)的立法滯后,且在國家層面缺乏采集相關(guān)數(shù)據(jù)資源的統(tǒng)一規(guī)劃,使得當(dāng)前與國家經(jīng)濟(jì)、政治密切關(guān)聯(lián)的數(shù)據(jù)較少掌握在政府手中,而如阿里、百度、騰訊、小米等互聯(lián)網(wǎng)公司所掌握的數(shù)據(jù)資源較為豐富,且與國家經(jīng)濟(jì)社會運(yùn)行關(guān)系密切。以阿里為例,已將數(shù)據(jù)化作為該公司三大戰(zhàn)略之一,其所掌握的大數(shù)據(jù)資源與中國國家安全之間的關(guān)聯(lián),是建立在阿里的數(shù)據(jù)覆蓋面和數(shù)據(jù)累積深度的基礎(chǔ)之上的。目前,阿里旗下淘寶的注冊用戶就接近5億,從而支撐起阿里的消費(fèi)者數(shù)據(jù)、制造業(yè)數(shù)據(jù)和供應(yīng)商數(shù)據(jù)。至2013年底,阿里旗下的支付寶實(shí)名用戶已近3億(其注冊賬戶早在2012年底即已突破8億),并成為全球最大的移動支付商;而截至2014年6月30日,創(chuàng)立僅一年的余額寶用戶已超過一億,差不多是股市開市20多年后中國股民的兩倍,支付寶和余額寶共同支撐起阿里的金融數(shù)據(jù)。馬云說其未來進(jìn)軍的領(lǐng)域是醫(yī)療和文化事業(yè),屆時又會形成阿里關(guān)于中國人的體質(zhì)健康生理數(shù)據(jù)和心理意識數(shù)據(jù)。這些數(shù)據(jù)通過云計(jì)算進(jìn)行挖掘之后,對國家安全的價值會遠(yuǎn)遠(yuǎn)超出國家保密局所保密的信息價值。[27]為此,推進(jìn)政務(wù)大數(shù)據(jù)應(yīng)用,必須要警惕互聯(lián)網(wǎng)公司對國家數(shù)據(jù)主權(quán)的侵害。
 
  六、結(jié)語
 
  Gang-Hoon Kim等指出,國家主導(dǎo)是政務(wù)大數(shù)據(jù)發(fā)展的根本動力。[5]發(fā)達(dá)國家政府的大數(shù)據(jù)項(xiàng)目都有著相似的目標(biāo)導(dǎo)向(如公共服務(wù)的平等性和可獲取性、公眾對公共事務(wù)的更好參與、透明性政府等等)。政務(wù)大數(shù)據(jù)應(yīng)用發(fā)展的主要關(guān)注點(diǎn)集中在安全性、速度、互操作性、分析能力和競爭人才等方面。當(dāng)然,每個國家的政府都有其優(yōu)先主導(dǎo)的方向,以及基于自身特殊環(huán)境的機(jī)遇與挑戰(zhàn)(如美國的恐怖主義和健康問題,日本的自然災(zāi)害,以及韓國的國防事業(yè)等等)。[28]
 
  中國在推進(jìn)政務(wù)大數(shù)據(jù)應(yīng)用的過程中,應(yīng)從中國實(shí)際出發(fā),出臺切實(shí)可行的政府大數(shù)據(jù)發(fā)展供給政策。
 
  參考文獻(xiàn)略。
 
  基金項(xiàng)目:國家發(fā)展改革委重大問題軟科學(xué)研究項(xiàng)目“大數(shù)據(jù)與重大政策評估研究”。
 
  作者簡介:
 
  于施洋(1974—),男,博士,副研究員,國家信息中心信息化研究部副主任,國家發(fā)改委互聯(lián)網(wǎng)大數(shù)據(jù)分析中心執(zhí)行副主任,研究方向:信息化戰(zhàn)略、電子政務(wù)規(guī)劃。
 
  王建冬(1982—),男,博士,副研究員,國家信息中心信息化研究部大數(shù)據(jù)分析處副處長,國家發(fā)改委互聯(lián)網(wǎng)大數(shù)據(jù)分析中心主任助理,研究方向:網(wǎng)絡(luò)用戶行為與政府信息服務(wù)創(chuàng)新。
 
  童楠楠(1989—),女,中國人民大學(xué)信息資源管理學(xué)院博士研究生,國家信息中心信息化研究部助理研究員,國家發(fā)改委互聯(lián)網(wǎng)大數(shù)據(jù)分析中心合作交流部主任,研究方向:政府信息服務(wù)創(chuàng)新。
責(zé)任編輯:admin

關(guān)注國脈電子政務(wù)網(wǎng),政府CIO的思想陣地與交流平臺,5000位政府CIO在這里讀懂“互聯(lián)網(wǎng)+政務(wù)”

二維碼