互聯(lián)網(wǎng)大數(shù)據(jù)在政府統(tǒng)計中的應(yīng)用路徑研究[1]
“大數(shù)據(jù)在政府統(tǒng)計中的應(yīng)用研究”課題組
內(nèi)容摘要:近幾年,互聯(lián)網(wǎng)變得越來越“無所不在”,由此而產(chǎn)生的數(shù)據(jù)越來越多,互聯(lián)網(wǎng)大數(shù)據(jù)逐漸發(fā)展成為一門新學(xué)科、一套新學(xué)說以及一種分析與解決問題的新方法和新手段。本文以互聯(lián)網(wǎng)大數(shù)據(jù)為背景,結(jié)合政府統(tǒng)計工作的特點,提出了互聯(lián)網(wǎng)大數(shù)據(jù)在政府統(tǒng)計中的應(yīng)用路徑,并以互聯(lián)網(wǎng)搜索數(shù)據(jù)在房價統(tǒng)計方面的應(yīng)用進(jìn)行了案例研究,提出了互聯(lián)網(wǎng)大數(shù)據(jù)在政府統(tǒng)計應(yīng)用中的展望。
關(guān)鍵詞:互聯(lián)網(wǎng)大數(shù)據(jù);政府統(tǒng)計;應(yīng)用路徑
中圖分類號:C829.2 文獻(xiàn)標(biāo)識碼:A 文章編號:1004-7794(2015)09-0003-04
DOI:10.13778/j.cnki.11-3705/c.2015.09.001
大數(shù)據(jù)與互聯(lián)網(wǎng)的發(fā)展相輔相成。一方面,互聯(lián)網(wǎng)數(shù)據(jù)是大數(shù)據(jù)中重要的信息與資源。如新浪、搜狐網(wǎng)等每天有大量用戶瀏覽信息,百度、谷歌等搜索引擎為用戶檢索出大量需要瀏覽的內(nèi)容,并實時記錄關(guān)鍵詞的搜索密度。隨著電子通訊和媒體技術(shù)的發(fā)展,傳統(tǒng)媒體報紙、廣播、電視也紛紛進(jìn)入互聯(lián)網(wǎng)絡(luò)時代,由于互聯(lián)網(wǎng)時代信息傳播的瞬時性、廣域性和互動性,使得媒體數(shù)據(jù)以更快的速度出現(xiàn)。另一方面,大數(shù)據(jù)為互聯(lián)網(wǎng)的發(fā)展提供了更多支撐、服務(wù)與應(yīng)用。大數(shù)據(jù)是互聯(lián)網(wǎng)發(fā)展到現(xiàn)今階段的一種表象或特征,在以云計算為代表的技術(shù)創(chuàng)新大幕襯托下,這些原本很難收集和使用的數(shù)據(jù)開始變得容易利用,通過各行各業(yè)的不斷創(chuàng)新,大數(shù)據(jù)價值開發(fā)呈井噴式發(fā)展。
一、互聯(lián)網(wǎng)大數(shù)據(jù)在政府統(tǒng)計中的應(yīng)用路徑
對于政府統(tǒng)計而言,互聯(lián)網(wǎng)數(shù)據(jù)主要有社交網(wǎng)數(shù)據(jù)、媒體數(shù)據(jù)和搜索引擎數(shù)據(jù)三種類型?;ヂ?lián)網(wǎng)大數(shù)據(jù)在政府統(tǒng)計諸多專業(yè)中都具有廣闊的應(yīng)用前景。如在宏觀層面,互聯(lián)網(wǎng)搜索數(shù)據(jù)能夠為官方統(tǒng)計提供分析、預(yù)測與決策支持。
目前,國內(nèi)最大的搜索引擎百度已與統(tǒng)計部門、交通運輸部門、教育部門、旅游部門、工業(yè)與信息化部門等官方機(jī)構(gòu)進(jìn)行了很好合作。這象征著政府部門在利用互聯(lián)網(wǎng)搜索數(shù)據(jù)把握宏觀趨勢、了解民生動態(tài)、推動管理創(chuàng)新等方面,開始邁出了實質(zhì)性的步伐,正在走進(jìn)大數(shù)據(jù)共贏時代。
1.經(jīng)濟(jì)發(fā)展。
傳統(tǒng)官方統(tǒng)計按月度、季度或年度統(tǒng)計各項經(jīng)濟(jì)指標(biāo),以GDP、社會消費品零售總額、固定資產(chǎn)投資完成額、采購經(jīng)理指數(shù)等各項數(shù)據(jù)來分析經(jīng)濟(jì)發(fā)展趨勢;而互聯(lián)網(wǎng)企業(yè)可以利用大數(shù)據(jù)來探索和完善各項經(jīng)濟(jì)指標(biāo),及時有效地反映國民經(jīng)濟(jì)運行狀況,提高宏觀經(jīng)濟(jì)監(jiān)測的全面性和及時性,為宏觀經(jīng)濟(jì)部門把握經(jīng)濟(jì)發(fā)展趨勢、監(jiān)控企業(yè)景氣狀態(tài)提供分析、預(yù)測與決策支持。
2.價格統(tǒng)計。
在CPI統(tǒng)計方面,電子商務(wù)交易數(shù)據(jù)、互聯(lián)網(wǎng)企業(yè)數(shù)據(jù)都是價格統(tǒng)計的新數(shù)據(jù)源,這些數(shù)據(jù)量大、更新快,充分利用這些數(shù)據(jù)有助于減少調(diào)查成本,提高指標(biāo)發(fā)布的頻次。應(yīng)用大數(shù)據(jù)進(jìn)行價格統(tǒng)計的實現(xiàn)途徑有三種:一是采用搜索方式收集網(wǎng)上交易價格數(shù)據(jù);二是與電子商務(wù)企業(yè)進(jìn)行合作,獲取交易價格數(shù)據(jù);三是建立商場、超市、醫(yī)院等實行電子計價的采價點向統(tǒng)計部門報送交易記錄的制度。
3.批發(fā)零售業(yè)統(tǒng)計。
由于網(wǎng)上電商交易數(shù)據(jù)的量體非常大、更新速度快,而且在全社會商品零售貿(mào)易中所占比重越來越大。因此,充分利用這些信息可以為改善傳統(tǒng)的批發(fā)零售貿(mào)易業(yè)統(tǒng)計帶來新的思路。
4.人口統(tǒng)計。
傳統(tǒng)官方統(tǒng)計投入大量人力物力財力,進(jìn)行人口普查,可獲得數(shù)據(jù)包括全國和地區(qū)人口數(shù)量、城市和農(nóng)村人口數(shù)量、人口性別比例、人口地域分布、年齡結(jié)構(gòu)、出生率/死亡率等;而利用互聯(lián)網(wǎng),可以快速及時地統(tǒng)計PC端和移動端網(wǎng)民,統(tǒng)計維度包括地域、年齡、性別、學(xué)歷等,將來還可以根據(jù)網(wǎng)民行為挖掘出群體的消費力水平、興趣點,更立體地洞察人群特征。
5.社會就業(yè)。
傳統(tǒng)官方統(tǒng)計通過畢業(yè)生人數(shù)增長情況和勞動力需求增長情況的對比研究就業(yè)形勢,而互聯(lián)網(wǎng)大數(shù)據(jù)通過網(wǎng)民對特定關(guān)鍵詞的搜索趨勢就可以直觀地分析求職需求和就業(yè)壓力。如可以從“找工作”的搜索指數(shù)變動情況來了解求職需求動向,補(bǔ)充人力資源與社會保障部門數(shù)據(jù)的不足,輔助了解就業(yè)趨勢,把握就業(yè)需求,支持政策調(diào)整。
6.醫(yī)療衛(wèi)生。
傳統(tǒng)官方統(tǒng)計通過醫(yī)療機(jī)構(gòu)數(shù)量、診療人次等線下數(shù)據(jù)分析醫(yī)療服務(wù)情況,而互聯(lián)網(wǎng)大數(shù)據(jù)可以利用用戶在線行為數(shù)據(jù)研究疾病趨勢。利用網(wǎng)民的疾病相關(guān)搜索數(shù)據(jù),建立科學(xué)的預(yù)測模型,動態(tài)預(yù)測特定地域未來疾病的活躍指數(shù),并呈現(xiàn)每個城市多種疾病的熱門醫(yī)院排名?;ヂ?lián)網(wǎng)搜索大數(shù)據(jù)能輔助衛(wèi)生部門監(jiān)測流行病發(fā)展態(tài)勢,提前做好預(yù)防措施,監(jiān)督管理熱點醫(yī)院。
7.旅游管理。
傳統(tǒng)官方統(tǒng)計對旅游人數(shù)的統(tǒng)計屬于事后統(tǒng)計,而基于網(wǎng)民出游前的網(wǎng)絡(luò)搜索數(shù)據(jù),得到網(wǎng)民選擇的出行路線,可以預(yù)測旅游趨勢。通過分析旅游相關(guān)關(guān)鍵詞搜索數(shù)據(jù)與實際出游人數(shù)之間的密切關(guān)系,可以預(yù)測各旅游景點未來的人流趨勢,進(jìn)而輔助旅游管理部門預(yù)警景點客流,提前準(zhǔn)備游客疏導(dǎo)措施。
二、利用互聯(lián)網(wǎng)搜索數(shù)據(jù)進(jìn)行房價統(tǒng)計案例研究
近幾年來,政府統(tǒng)計以房地產(chǎn)價格為突破口研究互聯(lián)網(wǎng)搜索數(shù)據(jù)的應(yīng)用取得了初步成果。
房地產(chǎn)業(yè)是我國國民經(jīng)濟(jì)發(fā)展的重要支柱產(chǎn)業(yè),房地產(chǎn)價格走勢一直是人們關(guān)注的熱點,但政府統(tǒng)計部門發(fā)布的數(shù)據(jù)往往具有一定的時滯,不能完全滿足大眾的需求。利用網(wǎng)絡(luò)搜索數(shù)據(jù)對房地產(chǎn)價格走勢進(jìn)行預(yù)測,是一種可行而且有效的方法。
國家統(tǒng)計局嘗試以北京、上海、廣州、南京、沈陽和西安6個大中城市的二手房價格和新房價格為研究對象,以百度搜索指數(shù)為數(shù)據(jù)基礎(chǔ),首先選出了對二手房價格變動影響最大的12個關(guān)鍵詞和對新房價格變動影響最大的8個關(guān)鍵詞;然后采用交叉驗證技術(shù),運用線性回歸、回歸樹、隨機(jī)森林、Bagging、M-boosting、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和混合線性回歸8種模型分別對6個城市的二手房價格和新房價格進(jìn)行了擬合和預(yù)測。
(一)數(shù)據(jù)描述、變量描述及數(shù)據(jù)預(yù)處理
1.數(shù)據(jù)描述。
百度搜索指數(shù)是以網(wǎng)民在百度的搜索量為數(shù)據(jù)基礎(chǔ),以關(guān)鍵詞為統(tǒng)計對象,分析并計算出各個關(guān)鍵詞在百度網(wǎng)頁搜索中搜索頻次的加權(quán)和。百度指數(shù)平臺是當(dāng)前互聯(lián)網(wǎng)乃至整個數(shù)據(jù)時代最重要的統(tǒng)計分析平臺之一。
對于網(wǎng)絡(luò)搜索數(shù)據(jù)的獲取與處理,主要是基于百度指數(shù)這項服務(wù),在百度指數(shù)當(dāng)中輸入關(guān)鍵詞,就能夠獲得該關(guān)鍵詞自2011年以來每日的搜索量。該搜索量為相對數(shù)據(jù),即相對于當(dāng)日百度總搜索量中該關(guān)鍵詞的搜索率。這項功能反映了某一個關(guān)鍵詞在某段時間里的關(guān)注程度。
2.變量描述。
被解釋變量分別是北京、上海、廣州、南京、沈陽、西安的二手住宅銷售價格指數(shù)(以下簡稱二手房價格)和新建商品住宅銷售價格指數(shù)(以下簡稱新房價格),采用2012年1月到2014年7月共31個月的月度同比數(shù)據(jù),來源于國家統(tǒng)計局網(wǎng)站。
解釋變量是與二手房和新房價格相關(guān)的某些關(guān)鍵詞的網(wǎng)絡(luò)搜索指數(shù)。按下面三個步驟來選取關(guān)鍵詞。
第一,根據(jù)人們在房屋購買決策中考慮的主要方面選定初始關(guān)鍵詞。具體而言,首先考慮的是當(dāng)前的宏觀經(jīng)濟(jì)形勢和房地產(chǎn)市場整體走勢,此類關(guān)鍵詞包括房價、房價走勢等;其次由于中國房地產(chǎn)市場受政策的影響比較大,限購、限貸、稅費或利率調(diào)整等政策變動會對人們的購買決策和行為造成直接影響,因此選取與房地產(chǎn)市場密切相關(guān)的政策類關(guān)鍵詞,如公積金、房貸利率、購房政策、房產(chǎn)稅等;最后考慮的是利用搜索引擎獲取大量與房屋本身和交易細(xì)節(jié)直接相關(guān)的各類信息,如涉及房屋本身的房源、二手房、新樓盤、保障房、裝修等,涉及交易細(xì)節(jié)的房產(chǎn)中介、房產(chǎn)網(wǎng)、二手房交易流程、二手房交易稅費等。最終共選取15個初始關(guān)鍵詞。
第二,利用百度搜索引擎的關(guān)鍵詞自動推薦技術(shù),得到與二手房價格相關(guān)的101個關(guān)鍵詞,與新房價格相關(guān)的59個關(guān)鍵詞。剔除重復(fù)和數(shù)據(jù)量較少的關(guān)鍵詞,組成關(guān)鍵詞庫。
第三,對數(shù)據(jù)進(jìn)行移動平均處理,轉(zhuǎn)化成月度數(shù)據(jù),分別計算每個關(guān)鍵詞與二手房價格和新房價格的相關(guān)系數(shù),檢驗每個關(guān)鍵詞與二手房價格和新房價格的相關(guān)性,并據(jù)此對關(guān)鍵詞進(jìn)行篩選。
經(jīng)過多次比較和篩選,對于6個城市的二手房價格預(yù)測,最終選取12個關(guān)鍵詞,分別是:房價走勢、房源、裝修、房產(chǎn)網(wǎng)、公積金、房貸利率、房產(chǎn)稅、房屋出租、房產(chǎn)中介、二手房、二手房交易流程、二手房交易稅費。對于新房價格預(yù)測,最終選取8個關(guān)鍵詞,分別是:房價走勢、房源、裝修、房產(chǎn)網(wǎng)、公積金、房貸利率、新樓盤、保障房。
可見,不論是二手房還是新房交易,人們都普遍比較關(guān)注房價走勢、房源、裝修、房產(chǎn)網(wǎng)、公積金、房貸利率,這6個關(guān)鍵詞是二者都有的。同時,二手房和新房各自不同的交易特點也決定了其搜索關(guān)鍵詞的差異,如房產(chǎn)稅、房屋出租、房產(chǎn)中介、二手房、二手房交易流程、二手房交易稅費等6個關(guān)鍵詞是二手房特有的,而新樓盤和保障房這兩個關(guān)鍵詞是新房特有的。
3.數(shù)據(jù)預(yù)處理。
為了與被解釋變量保持一致,對所有關(guān)鍵詞的搜索指數(shù)做如下處理:首先根據(jù)日搜索指數(shù)計算月度平均搜索指數(shù),然后將月度平均搜索指數(shù)轉(zhuǎn)換為同比數(shù)據(jù),最終得到6個城市所有關(guān)鍵詞從2012年1月到2014年7月的月度同比數(shù)據(jù)。采用同比數(shù)據(jù)而不是環(huán)比數(shù)據(jù)的原因在于,同比數(shù)據(jù)更能反映隨著時間推移房地產(chǎn)價格以及搜索指數(shù)的變動情況,而環(huán)比數(shù)據(jù)的波動相對較小,不適宜構(gòu)建模型進(jìn)行分析和預(yù)測。
(二)研究結(jié)論
在采用的8種模型中,支持向量機(jī)和隨機(jī)森林模型的預(yù)測效果最佳,回歸樹模型的預(yù)測效果最差;在二手房和新房價格的網(wǎng)絡(luò)搜索關(guān)鍵詞中,宏觀經(jīng)濟(jì)形勢和房產(chǎn)政策是關(guān)注的重點??梢?,網(wǎng)絡(luò)搜索數(shù)據(jù)不但能夠較好地預(yù)測房價指數(shù),同時能夠得出經(jīng)濟(jì)主體行為的趨勢與規(guī)律,而且具有一定的時效性,預(yù)測的月度房地產(chǎn)價格指數(shù)能夠比官方發(fā)布數(shù)據(jù)提前約兩周。具體研究結(jié)論如下:
第一,通過運用交叉驗證技術(shù)在8種模型中選擇的最優(yōu)模型成功預(yù)測了6個城市的二手房和新房價格。總體來看,最優(yōu)模型和線性回歸模型預(yù)測結(jié)果與實際值的走勢都基本一致,但是最優(yōu)模型的預(yù)測值與實際值更接近。線性回歸模型對大部分城市的預(yù)測效果較好,但是對南京的二手房價格擬合度不夠理想。
第二,根據(jù)6個城市二手房和新房價格的各預(yù)測模型驗證集的標(biāo)準(zhǔn)化均方誤差(NMSE)和均方誤差(MSE)結(jié)果,在使用的8種方法中,支持向量機(jī)和隨機(jī)森林表現(xiàn)最佳,其次是混合性線性回歸、線性回歸、Bagging、M-boosting、神經(jīng)網(wǎng)絡(luò)、回歸樹模型。支持向量機(jī)表現(xiàn)最好,因為它在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多特有的優(yōu)勢,并能夠推廣應(yīng)用到函數(shù)擬合中。隨機(jī)森林也能夠得出較為準(zhǔn)確的預(yù)測值,因為它可以產(chǎn)生高準(zhǔn)確度的分類器和處理大量的輸入變量,在決定類別時,評估出變量的重要性,而且在建造森林時,它可以在內(nèi)部對于一般化后的誤差產(chǎn)生不偏差的估計。
第三,在影響6個城市二手房價格的關(guān)鍵詞搜索指數(shù)中,出現(xiàn)頻次較高的包括裝修、公積金、房屋出租、房價走勢和二手房交易流程。這說明人們在購買二手房時,都非常關(guān)注當(dāng)時的房地產(chǎn)政策和房價形勢,同時也比較關(guān)注購房后房屋的裝修和出租事宜。
第四,人們在進(jìn)行新房交易時,通過搜索引擎搜索較多的關(guān)鍵詞分別是裝修、公積金、房價走勢和房貸利率。這說明人們在購買新房時也同樣比較關(guān)注宏觀經(jīng)濟(jì)形勢和房地產(chǎn)相關(guān)政策。
三、互聯(lián)網(wǎng)大數(shù)據(jù)應(yīng)用展望
大幅增長的網(wǎng)民規(guī)模和飛速發(fā)展的信息技術(shù),使得借助網(wǎng)絡(luò)搜索引擎對社會經(jīng)濟(jì)活動進(jìn)行監(jiān)測成為可能。一方面,網(wǎng)絡(luò)搜索數(shù)據(jù)真實體現(xiàn)大眾關(guān)注熱點;另一方面,大眾的關(guān)注熱點也易受到外部環(huán)境的影響,兩者間呈現(xiàn)出一定的對應(yīng)關(guān)系。如何利用網(wǎng)絡(luò)搜索數(shù)據(jù)使其為國家治理、企業(yè)決策乃至個人生活服務(wù),正成為大數(shù)據(jù)的核心議題。
?。ㄒ唬┗诨ヂ?lián)網(wǎng)搜索數(shù)據(jù)構(gòu)建環(huán)保投資景氣指數(shù)
隨著互聯(lián)網(wǎng)的普及和大數(shù)據(jù)時代的到來,投資主體和消費主體的購買意圖已經(jīng)體現(xiàn)到互聯(lián)網(wǎng)上。例如,在投資決策前,一般會通過互聯(lián)網(wǎng)搜索引擎進(jìn)行信息收集。而市場主體的這些網(wǎng)上行為與他們真實意圖密切相關(guān)。如果能夠提取網(wǎng)絡(luò)中的這些有效信息,就可以通過數(shù)據(jù)間的相關(guān)性,找出網(wǎng)絡(luò)信息行為與某個具體行業(yè)相關(guān)投資數(shù)據(jù)走勢之間的關(guān)系。
因此,可以考慮選取環(huán)保產(chǎn)業(yè)作為主要預(yù)測研究對象,利用互聯(lián)網(wǎng)搜索數(shù)據(jù),聯(lián)系經(jīng)濟(jì)社會發(fā)展熱點,同時結(jié)合現(xiàn)有政府統(tǒng)計指標(biāo),構(gòu)建基于互聯(lián)網(wǎng)搜索數(shù)據(jù)的“環(huán)保投資景氣指數(shù)”,并將此指數(shù)運用到我國環(huán)境管理投資的預(yù)測之中。
(二)基于互聯(lián)網(wǎng)搜索數(shù)據(jù)構(gòu)建霧霾與環(huán)保出行關(guān)聯(lián)性指數(shù)
宣傳低碳生活和環(huán)保出行理念,改變公眾行為,對霧霾天氣的改善具有一定的積極作用。如果能構(gòu)建霧霾和環(huán)保出行關(guān)聯(lián)性指數(shù)就可以直觀看出城市居民在霧霾關(guān)注程度及環(huán)保出行行為上的表現(xiàn)。
因此,可以利用搜索關(guān)鍵詞構(gòu)建霧霾和環(huán)保出行指數(shù)之間的關(guān)系,揭示城市空氣質(zhì)量指數(shù)與公眾霧霾關(guān)注度及環(huán)保出行理念之間的傳導(dǎo)機(jī)制。首先,選取與霧霾相關(guān)的搜索詞,如構(gòu)成因素、形成原因、產(chǎn)生的危害、治理措施及預(yù)防等。然后,根據(jù)選詞搜索數(shù)據(jù)與我國空氣質(zhì)量指數(shù)的相關(guān)性,得到選取與空氣質(zhì)量高度相關(guān)的關(guān)鍵詞。以選用城市PM2.5數(shù)據(jù)的加權(quán)平均值代表全國PM2.5數(shù)據(jù)的變化趨勢。權(quán)數(shù)為各城市關(guān)鍵詞搜索量占總搜索量的比重,加權(quán)平均計算合成指數(shù)。
(三)基于互聯(lián)網(wǎng)購物搜索數(shù)據(jù)測算居民收入水平
住戶收支數(shù)據(jù)是重要的統(tǒng)計資源。作為需求的市場微觀主體,居民的互聯(lián)網(wǎng)購物搜索行為在互聯(lián)網(wǎng)上有所反映,體現(xiàn)為網(wǎng)絡(luò)搜索、瀏覽量等指標(biāo)的變化。網(wǎng)絡(luò)搜索內(nèi)容反映了市場主體的關(guān)注點,搜索量則反映了關(guān)注程度,因此利用購物搜索關(guān)鍵詞的搜索量變化可以對居民收入水平做出判斷或預(yù)測。從居民家庭消費特征出發(fā),構(gòu)建出對居民收入記賬記錄依賴小的收入測度模型,科學(xué)輔助數(shù)據(jù)質(zhì)量控制,可靠評估收入數(shù)據(jù)及預(yù)測趨勢,從而科學(xué)指導(dǎo)政府宏微觀政策。
當(dāng)然,互聯(lián)網(wǎng)搜索數(shù)據(jù)中不同關(guān)鍵詞代表的含義不同,采用科學(xué)的方法對關(guān)鍵詞進(jìn)行篩選,選擇和統(tǒng)計指標(biāo)最相關(guān)的關(guān)鍵詞,并建立適當(dāng)?shù)哪P?,還可以輔助測算其他官方統(tǒng)計的月度數(shù)據(jù),如住宅成交量、消費價格指數(shù)、居民收入、居民消費支出、失業(yè)率等。
互聯(lián)網(wǎng)大數(shù)據(jù)的應(yīng)用前景是廣闊的,引領(lǐng)政府統(tǒng)計變革是當(dāng)代政府統(tǒng)計工作者肩負(fù)的重任,雖然在改革創(chuàng)新的道路上,會遇到多方面的問題,但是只要不斷堅定地、持續(xù)地向明確的方向和目標(biāo)前進(jìn),互聯(lián)網(wǎng)大數(shù)據(jù)將在政府統(tǒng)計中大放異彩。
參考文獻(xiàn)
[1]馬建堂.大數(shù)據(jù)在政府統(tǒng)計中的應(yīng)用[M].北京:中國統(tǒng)計出版社,2013.
[2]涂子沛.大數(shù)據(jù):正在到來的數(shù)據(jù)革命[M].南寧:廣西師范大學(xué)出版社,2012.
[3]徐繼華,馮啟娜,陳貞汝.智慧政府:大數(shù)據(jù)治國時代的來臨[M].北京:中信出版社,2014.
[4]郭三強(qiáng),郭燕錦.大數(shù)據(jù)環(huán)境下的數(shù)據(jù)安全研究[J].科技廣場,2013(2):28-31.
[5]宗威.大數(shù)據(jù)時代下數(shù)據(jù)質(zhì)量的挑戰(zhàn)[J].西安交通大學(xué)學(xué)報,2013,33(5):38-43.
[6]李慶莉.大數(shù)據(jù)戰(zhàn)略[J].中國金融電腦,2013(7).
[7]孟小峰,李勇,祝建華.社會計算:大數(shù)據(jù)時代的機(jī)遇與挑戰(zhàn)[J].計算機(jī)研究與發(fā)展,2013(12).
[8]王元卓,靳小龍.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J].計算機(jī)學(xué)報,2013(6):1126-1138.
[1]基金項目:國家社科基金項目《大數(shù)據(jù)在政府統(tǒng)計中的應(yīng)用研究》(批準(zhǔn)號13ATJ004階段性成果)。