貴州前段時間發(fā)布了大數(shù)據(jù)產(chǎn)業(yè)規(guī)劃和戰(zhàn)略布局,在這里根據(jù)關鍵內(nèi)容做一個簡單解讀和分析。

 
  將圍繞建設信息資源中心、打造大數(shù)據(jù)產(chǎn)業(yè)新高地的戰(zhàn)略定位,按照“基礎構(gòu)建、集群聚集、創(chuàng)新突破”的思路,科學規(guī)劃大數(shù)據(jù)產(chǎn)業(yè)布局,建基地、引人才、聚企業(yè)、抓應用、保安全、促創(chuàng)新,努力將新區(qū)建成全國領先的大數(shù)據(jù)資源中心和大數(shù)據(jù)應用服務示范基地。
 
  一是加快數(shù)據(jù)資源集聚能力和管理能力建設。打造全省統(tǒng)一的大數(shù)據(jù)平臺,集聚全省政務、公共服務等領域的數(shù)據(jù)資源;引進國家級數(shù)據(jù)資源庫,爭取國家基礎數(shù)據(jù)存儲中心、容災備份中心和重點企業(yè)數(shù)據(jù)中心落戶;拓展數(shù)據(jù)來源渠道和范圍,支持和鼓勵企業(yè)、行業(yè)協(xié)會、高等院校、科研機構(gòu)等單位提升數(shù)據(jù)采集能力,參與數(shù)據(jù)資源庫建設;設立貴州省數(shù)據(jù)資源管理辦公室,完善數(shù)據(jù)資產(chǎn)登記、管理、開放、開發(fā)等標準,規(guī)范政府數(shù)據(jù)資產(chǎn)管理制度,保證數(shù)據(jù)資源有序、有效使用。
 
  解讀:建設統(tǒng)一的大數(shù)據(jù)平臺
 
  首先說明下為何要建設數(shù)據(jù)資源庫,其核心目的還是需要聚合原有分散在各個政務系統(tǒng)中的數(shù)據(jù),大家要注意這里不是聚合所有數(shù)據(jù),而是需要在多個政務系統(tǒng)共享的數(shù)據(jù),在進行大數(shù)據(jù)分析的時候需要使用到的本身具有相關性的各類數(shù)據(jù)。這里的數(shù)據(jù)資源庫和傳統(tǒng)電子政務建設里面談到的數(shù)據(jù)資源中心在業(yè)務上目標是一樣的,納入大數(shù)據(jù)平臺后只是在構(gòu)建過程中會應用到大數(shù)據(jù)相關技術如分布式存儲,流計算等來解決對數(shù)據(jù)的海量和實時性要求。
 
  數(shù)據(jù)資源庫的建設本身包括了兩個方面的內(nèi)容,從業(yè)務上重點是數(shù)據(jù)標準,數(shù)據(jù)規(guī)范和接口,數(shù)據(jù)模型的建設,這個以往差別不大,唯一增加的內(nèi)容是在數(shù)據(jù)模型建設中需要更多的考慮數(shù)據(jù)本身之間的相關性。其次是數(shù)據(jù)平臺的建設,這里從技術上講和傳統(tǒng)區(qū)別相當比較大,一個是在建設數(shù)據(jù)平臺過程中需要應用到大數(shù)據(jù)相關技術平臺,如Hadoop平臺等,這里已經(jīng)不是一個單純的數(shù)據(jù)存儲平臺,而是必須提供數(shù)據(jù)存儲,數(shù)據(jù)處理和數(shù)據(jù)分析能力的完整平臺,其次大數(shù)據(jù)平臺建設的最終目標還是希望經(jīng)過處理和分析后的數(shù)據(jù)能力能夠共享和開發(fā),體現(xiàn)業(yè)務價值,因此需要有大數(shù)據(jù)共享服務能力提供,即大數(shù)據(jù)平臺本身還必須是可開放和共享的數(shù)據(jù)能力服務平臺。

  對于大數(shù)據(jù)平臺的建設難點不在技術而是在業(yè)務上,這里面涉及到兩個層面的數(shù)據(jù)開放和共享,一個是在政府行業(yè)內(nèi)部各個部門間,工商,稅務,質(zhì)監(jiān),交通等各個部門的數(shù)據(jù)能夠共享,這里面涉及到的部門和利益壁壘要想短期解決是很困難的事情;其次是大數(shù)據(jù)平臺最終處理和分析后的能力能否進一步朝外面的企業(yè)和公共服務部門共享和開放,這是第二個層面的困難,在這一點上國外類似美國在政府部門大數(shù)據(jù)資源和數(shù)據(jù)目錄開放程度就遠遠好于我國。具體可以看下涂子沛的《大數(shù)據(jù)時代》這本書。
 
  二是加快計算服務能力和應用能力建設。引進公共云服務龍頭企業(yè),提供高質(zhì)量的基礎設施即服務(IaaS)、平臺即服務(PaaS)、軟件即服務(SaaS)等公共云服務;引導財政資金支持的信息化項目優(yōu)先部署在統(tǒng)一的云計算基礎設施,促進政務信息系統(tǒng)和信息資源的共享;面向貴州省建設電子政務、智能交通、智能物流、企業(yè)管理、智慧城市等方面的需求,發(fā)展服務功能強、商業(yè)模式新、帶動效果大的行業(yè)云平臺;面向企業(yè)研發(fā)、產(chǎn)品設計、生產(chǎn)控制、經(jīng)營管理等方面需求,提供專業(yè)化的工業(yè)云計算服務;加快研發(fā)云計算平臺資源管理軟件、云安全防護產(chǎn)品、云模式應用軟件,發(fā)展面向重點行業(yè)領域的云計算系統(tǒng)解決方案。
 
  解讀:計算服務和應用能力建設
 
  對于這部分內(nèi)容基本可以看到是常規(guī)的云計算平臺和智慧城市方面的建設內(nèi)容。政府很多時候規(guī)劃往往就是沒有了解一件事情的本質(zhì)而一味的追求大而全的理想化建設模式。從最早的各地圈地大搞特搞云計算中心和產(chǎn)業(yè)基地;到智慧城市概念炒作起來的時候又把云計算,SOA,大數(shù)據(jù),物聯(lián)網(wǎng)等所有內(nèi)容全部涵蓋在智慧城市規(guī)劃里面。而到了大數(shù)據(jù)時代,我們看到的規(guī)劃效果又是所有內(nèi)容似乎都恨不得全部納入到大數(shù)據(jù)產(chǎn)業(yè)規(guī)劃里面,搞理想化的大而全建設,結(jié)果平臺項目建設過程中就夭折點,這個是每個政府部門做大數(shù)據(jù)規(guī)劃前必須要考慮的問題,即必須清楚大數(shù)據(jù)本質(zhì)是什么?希望通過大數(shù)據(jù)平臺建設來解決什么業(yè)務問題,這個都沒有想清楚不適宜開始大數(shù)據(jù)產(chǎn)業(yè)規(guī)劃和建設。
 
  那么是不是大數(shù)據(jù)平臺和云平臺完全沒有關系?那也不是絕對。對于兩者的關系在這里用最通俗的方式來進行下說明和對應。首先大數(shù)據(jù)本身需要存儲,大數(shù)據(jù)在處理和聚合到數(shù)據(jù)資源平臺過程中需要進行計算,那么就需要資源來提供計算和存儲能力,而且這個能力可以彈性擴展,這塊能力的提供即是云計算平臺IaaS層完成的內(nèi)容。其次大數(shù)據(jù)在處理過程中涉及到數(shù)據(jù)集成,數(shù)據(jù)采集和聚合,數(shù)據(jù)并行處理,數(shù)據(jù)流處理,數(shù)據(jù)分析,數(shù)據(jù)服務能力共享和開放,這些能力已經(jīng)是在資源層上層的能力,即平臺層能力,而這些平臺層能力都可以納入到廣義的云計算PaaS平臺層。
 
  三是加快大數(shù)據(jù)分析能力和利用能力建設。加強大數(shù)據(jù)分析關鍵算法和共性基礎技術研發(fā),開發(fā)專業(yè)化的數(shù)據(jù)處理分析工具,形成大數(shù)據(jù)基礎技術與產(chǎn)品資源池;發(fā)揮大企業(yè)平臺引領作用和專業(yè)大數(shù)據(jù)服務企業(yè)創(chuàng)新優(yōu)勢,加快市場化的大數(shù)據(jù)應用,發(fā)展第三方大數(shù)據(jù)服務,提供特色化的數(shù)據(jù)服務;支持數(shù)據(jù)開放、共享和應用服務,探索商業(yè)模式創(chuàng)新,推進大數(shù)據(jù)的公共應用;選擇重點行業(yè)領域,開展基于云計算的大數(shù)據(jù)示范應用,推動專業(yè)化的大數(shù)據(jù)挖掘、分析、應用和服務發(fā)展,提高大數(shù)據(jù)行業(yè)應用能力。
 
  解讀:數(shù)據(jù)分析和利用能力建設
 
  再次強調(diào)大數(shù)據(jù)核心是實現(xiàn)了業(yè)務價值和公共服務能力提升,如果我們建設的大數(shù)據(jù)平臺和數(shù)據(jù)資源中心雖然實現(xiàn)了數(shù)據(jù)的聚合和數(shù)據(jù)模型的標準化,但是這些海量數(shù)據(jù)如果不能進行很好的挖掘和相關性分析,如果不能將數(shù)據(jù)本身的價值和能力通過服務化方式開放出來,那么整個大數(shù)據(jù)平臺將沒有任何價值。
 
  貴州大數(shù)據(jù)產(chǎn)業(yè)戰(zhàn)略里面談到的將數(shù)據(jù)開放和共享出去,發(fā)展第三方大數(shù)據(jù)服務,推薦大數(shù)據(jù)公共應用并探索新的商業(yè)模式是相關關鍵的點。這仍然是商業(yè)模式和業(yè)務問題,而非技術問題,經(jīng)過處理和分析的數(shù)據(jù)只有能夠被使用,能夠用于決策,能夠為大眾提供更加高效的公共數(shù)據(jù)服務才是最大的價值。
 
  根據(jù)大數(shù)據(jù)本身的海量,異構(gòu),實時等特點,可以看到要針對海量異構(gòu)數(shù)據(jù)進行數(shù)據(jù)挖掘和分析,同時有必須滿足大數(shù)據(jù)分析的實時或準實時性要求還是相當有難度的。這一方面涉及到CEP,流處理,MPP,并行計算等各種技術的使用;一方面涉及到數(shù)據(jù)相關性分析模型的建立,兩者缺一不可。

  大數(shù)據(jù)平臺建設本身又有兩種模式,一種是先構(gòu)建數(shù)據(jù)存儲平臺,再構(gòu)建處理平臺,最后再構(gòu)建數(shù)據(jù)分析和挖掘平臺;一種是根據(jù)業(yè)務目標來分析是否涉及到大數(shù)據(jù)應用場景,根據(jù)應用場景來分析究竟涉及到哪些相互關聯(lián)數(shù)據(jù),然后進行數(shù)據(jù)建模,再來考慮如何高效可擴展的對這些數(shù)據(jù)進行存儲,處理和分析。對于政府部門的大數(shù)據(jù)我們更加建議第二種方式,即不要一開始就追求大而全,而是有針對性的各個擊破,快速的體現(xiàn)出大數(shù)據(jù)平臺應有的商業(yè)價值。


責任編輯:admin