貴州前段時間發(fā)布了大數(shù)據產業(yè)規(guī)劃和戰(zhàn)略布局,在這里根據關鍵內容做一個簡單解讀和分析。

 
  將圍繞建設信息資源中心、打造大數(shù)據產業(yè)新高地的戰(zhàn)略定位,按照“基礎構建、集群聚集、創(chuàng)新突破”的思路,科學規(guī)劃大數(shù)據產業(yè)布局,建基地、引人才、聚企業(yè)、抓應用、保安全、促創(chuàng)新,努力將新區(qū)建成全國領先的大數(shù)據資源中心和大數(shù)據應用服務示范基地。
 
  一是加快數(shù)據資源集聚能力和管理能力建設。打造全省統(tǒng)一的大數(shù)據平臺,集聚全省政務、公共服務等領域的數(shù)據資源;引進國家級數(shù)據資源庫,爭取國家基礎數(shù)據存儲中心、容災備份中心和重點企業(yè)數(shù)據中心落戶;拓展數(shù)據來源渠道和范圍,支持和鼓勵企業(yè)、行業(yè)協(xié)會、高等院校、科研機構等單位提升數(shù)據采集能力,參與數(shù)據資源庫建設;設立貴州省數(shù)據資源管理辦公室,完善數(shù)據資產登記、管理、開放、開發(fā)等標準,規(guī)范政府數(shù)據資產管理制度,保證數(shù)據資源有序、有效使用。
 
  解讀:建設統(tǒng)一的大數(shù)據平臺
 
  首先說明下為何要建設數(shù)據資源庫,其核心目的還是需要聚合原有分散在各個政務系統(tǒng)中的數(shù)據,大家要注意這里不是聚合所有數(shù)據,而是需要在多個政務系統(tǒng)共享的數(shù)據,在進行大數(shù)據分析的時候需要使用到的本身具有相關性的各類數(shù)據。這里的數(shù)據資源庫和傳統(tǒng)電子政務建設里面談到的數(shù)據資源中心在業(yè)務上目標是一樣的,納入大數(shù)據平臺后只是在構建過程中會應用到大數(shù)據相關技術如分布式存儲,流計算等來解決對數(shù)據的海量和實時性要求。
 
  數(shù)據資源庫的建設本身包括了兩個方面的內容,從業(yè)務上重點是數(shù)據標準,數(shù)據規(guī)范和接口,數(shù)據模型的建設,這個以往差別不大,唯一增加的內容是在數(shù)據模型建設中需要更多的考慮數(shù)據本身之間的相關性。其次是數(shù)據平臺的建設,這里從技術上講和傳統(tǒng)區(qū)別相當比較大,一個是在建設數(shù)據平臺過程中需要應用到大數(shù)據相關技術平臺,如Hadoop平臺等,這里已經不是一個單純的數(shù)據存儲平臺,而是必須提供數(shù)據存儲,數(shù)據處理和數(shù)據分析能力的完整平臺,其次大數(shù)據平臺建設的最終目標還是希望經過處理和分析后的數(shù)據能力能夠共享和開發(fā),體現(xiàn)業(yè)務價值,因此需要有大數(shù)據共享服務能力提供,即大數(shù)據平臺本身還必須是可開放和共享的數(shù)據能力服務平臺。

  對于大數(shù)據平臺的建設難點不在技術而是在業(yè)務上,這里面涉及到兩個層面的數(shù)據開放和共享,一個是在政府行業(yè)內部各個部門間,工商,稅務,質監(jiān),交通等各個部門的數(shù)據能夠共享,這里面涉及到的部門和利益壁壘要想短期解決是很困難的事情;其次是大數(shù)據平臺最終處理和分析后的能力能否進一步朝外面的企業(yè)和公共服務部門共享和開放,這是第二個層面的困難,在這一點上國外類似美國在政府部門大數(shù)據資源和數(shù)據目錄開放程度就遠遠好于我國。具體可以看下涂子沛的《大數(shù)據時代》這本書。
 
  二是加快計算服務能力和應用能力建設。引進公共云服務龍頭企業(yè),提供高質量的基礎設施即服務(IaaS)、平臺即服務(PaaS)、軟件即服務(SaaS)等公共云服務;引導財政資金支持的信息化項目優(yōu)先部署在統(tǒng)一的云計算基礎設施,促進政務信息系統(tǒng)和信息資源的共享;面向貴州省建設電子政務、智能交通、智能物流、企業(yè)管理、智慧城市等方面的需求,發(fā)展服務功能強、商業(yè)模式新、帶動效果大的行業(yè)云平臺;面向企業(yè)研發(fā)、產品設計、生產控制、經營管理等方面需求,提供專業(yè)化的工業(yè)云計算服務;加快研發(fā)云計算平臺資源管理軟件、云安全防護產品、云模式應用軟件,發(fā)展面向重點行業(yè)領域的云計算系統(tǒng)解決方案。
 
  解讀:計算服務和應用能力建設
 
  對于這部分內容基本可以看到是常規(guī)的云計算平臺和智慧城市方面的建設內容。政府很多時候規(guī)劃往往就是沒有了解一件事情的本質而一味的追求大而全的理想化建設模式。從最早的各地圈地大搞特搞云計算中心和產業(yè)基地;到智慧城市概念炒作起來的時候又把云計算,SOA,大數(shù)據,物聯(lián)網等所有內容全部涵蓋在智慧城市規(guī)劃里面。而到了大數(shù)據時代,我們看到的規(guī)劃效果又是所有內容似乎都恨不得全部納入到大數(shù)據產業(yè)規(guī)劃里面,搞理想化的大而全建設,結果平臺項目建設過程中就夭折點,這個是每個政府部門做大數(shù)據規(guī)劃前必須要考慮的問題,即必須清楚大數(shù)據本質是什么?希望通過大數(shù)據平臺建設來解決什么業(yè)務問題,這個都沒有想清楚不適宜開始大數(shù)據產業(yè)規(guī)劃和建設。
 
  那么是不是大數(shù)據平臺和云平臺完全沒有關系?那也不是絕對。對于兩者的關系在這里用最通俗的方式來進行下說明和對應。首先大數(shù)據本身需要存儲,大數(shù)據在處理和聚合到數(shù)據資源平臺過程中需要進行計算,那么就需要資源來提供計算和存儲能力,而且這個能力可以彈性擴展,這塊能力的提供即是云計算平臺IaaS層完成的內容。其次大數(shù)據在處理過程中涉及到數(shù)據集成,數(shù)據采集和聚合,數(shù)據并行處理,數(shù)據流處理,數(shù)據分析,數(shù)據服務能力共享和開放,這些能力已經是在資源層上層的能力,即平臺層能力,而這些平臺層能力都可以納入到廣義的云計算PaaS平臺層。
 
  三是加快大數(shù)據分析能力和利用能力建設。加強大數(shù)據分析關鍵算法和共性基礎技術研發(fā),開發(fā)專業(yè)化的數(shù)據處理分析工具,形成大數(shù)據基礎技術與產品資源池;發(fā)揮大企業(yè)平臺引領作用和專業(yè)大數(shù)據服務企業(yè)創(chuàng)新優(yōu)勢,加快市場化的大數(shù)據應用,發(fā)展第三方大數(shù)據服務,提供特色化的數(shù)據服務;支持數(shù)據開放、共享和應用服務,探索商業(yè)模式創(chuàng)新,推進大數(shù)據的公共應用;選擇重點行業(yè)領域,開展基于云計算的大數(shù)據示范應用,推動專業(yè)化的大數(shù)據挖掘、分析、應用和服務發(fā)展,提高大數(shù)據行業(yè)應用能力。
 
  解讀:數(shù)據分析和利用能力建設
 
  再次強調大數(shù)據核心是實現(xiàn)了業(yè)務價值和公共服務能力提升,如果我們建設的大數(shù)據平臺和數(shù)據資源中心雖然實現(xiàn)了數(shù)據的聚合和數(shù)據模型的標準化,但是這些海量數(shù)據如果不能進行很好的挖掘和相關性分析,如果不能將數(shù)據本身的價值和能力通過服務化方式開放出來,那么整個大數(shù)據平臺將沒有任何價值。
 
  貴州大數(shù)據產業(yè)戰(zhàn)略里面談到的將數(shù)據開放和共享出去,發(fā)展第三方大數(shù)據服務,推薦大數(shù)據公共應用并探索新的商業(yè)模式是相關關鍵的點。這仍然是商業(yè)模式和業(yè)務問題,而非技術問題,經過處理和分析的數(shù)據只有能夠被使用,能夠用于決策,能夠為大眾提供更加高效的公共數(shù)據服務才是最大的價值。
 
  根據大數(shù)據本身的海量,異構,實時等特點,可以看到要針對海量異構數(shù)據進行數(shù)據挖掘和分析,同時有必須滿足大數(shù)據分析的實時或準實時性要求還是相當有難度的。這一方面涉及到CEP,流處理,MPP,并行計算等各種技術的使用;一方面涉及到數(shù)據相關性分析模型的建立,兩者缺一不可。

  大數(shù)據平臺建設本身又有兩種模式,一種是先構建數(shù)據存儲平臺,再構建處理平臺,最后再構建數(shù)據分析和挖掘平臺;一種是根據業(yè)務目標來分析是否涉及到大數(shù)據應用場景,根據應用場景來分析究竟涉及到哪些相互關聯(lián)數(shù)據,然后進行數(shù)據建模,再來考慮如何高效可擴展的對這些數(shù)據進行存儲,處理和分析。對于政府部門的大數(shù)據我們更加建議第二種方式,即不要一開始就追求大而全,而是有針對性的各個擊破,快速的體現(xiàn)出大數(shù)據平臺應有的商業(yè)價值。


責任編輯:admin