大數據來了。8月14日下午,甫一走進北京國家會議中心二層會議室大門,“大數據”“云計算”“網絡營銷”等鮮活名詞便闖入耳朵。
這里正在舉辦“2013中國大數據發(fā)展論壇”。雖然這是大數據第一次亮相頗具影響力的中國互聯網大會,卻與2000年初談互聯網的場景相仿,容納數百人的會場座無虛席,臺上的演講者熱情高漲,臺下的聽眾豪情萬丈。
幾乎所有人都意識到,大數據正在改變著人們的生活,它將帶來一場徹頭徹尾的革命,包括技術、產品、行業(yè)乃至整個經濟運作模式。
政府部門頒布的一紙政策恰到好處地鼓勵了人們發(fā)展大數據的決心。同一天,國務院發(fā)布《關于促進信息消費擴大內需的若干意見》,明確提出到2015年,信息消費規(guī)模超過3.2萬億元,年均增長20%以上,帶動相關行業(yè)新增產出超過1.2萬億元,其中基于互聯網的新型信息消費規(guī)模達到2.4萬億元,年均增長30%以上。
面對如此誘人而巨大的蛋糕,無論是傳統的IT企業(yè),還是在各種數據里摸爬滾打多年的互聯網公司,甚至電信運營商都禁不住怦然心動:IT企業(yè)譬如Oracle、IBM坐擁先進的技術,互聯網公司譬如百度、阿里巴巴則在廣告推送、個性化營銷等方面率先踐行大數據技術多年,三大運營商亦掌握著其他企業(yè)無可媲美的真實且龐大的數據源,各方憑借自身優(yōu)勢競相涉足大數據,都打定了分一杯羹的主意。
實際上,大數據的發(fā)展態(tài)勢早就引起了工信部智囊團隊——電信經濟專家委員會的注意。財新記者獲悉,在2012年底的一次內部交流中,幾十名來自學界、業(yè)界、政府部門的專家集中討論的話題只有一個——大數據。
在討論聲中,大數據從理論探討到實踐創(chuàng)新日漸紅火,我們有必要關注這一新興領域從何而來,到底發(fā)展到了何種地步,又該如何拓寬大數據的盤子?為此,財新記者專訪了工業(yè)和信息化部電信研究院互聯網中心主任何寶宏博士,在他看來,在技術的推動下,以前不起眼的數據突然就變成了一種資源,而且還是一筆可能創(chuàng)造出巨大價值的資產。只是這筆資產的應用目前還處于初級階段,也沒有相應的政策針對性地去引導這些應用。
大數據一定會成功
財新記者:現在市場都在熱議著大數據,大數據的定義到底是什么?
何寶宏:坦白說,對于大數據,業(yè)內并沒有明確的概念。在維基百科或其他網絡解釋中,將“傳統工具無法處理的數據”稱為大數據,有的會加一些定語,譬如“在有效的時間里”。
在我看來,大數據的重點在于如何處理“大”?!按蟆币馕吨萘看?、內存多、變化快,相對來說,也是指處理這種數據的能力或工具,既然是大數據,就意味著是分析、處理、應用不規(guī)則且一直在變化的數據。
財新記者:目前,大數據發(fā)展到了何種程度?
何寶宏:大數據現在還不是一個行業(yè),它是嵌入在云計算里發(fā)展的,規(guī)模還很小。它的發(fā)展尚處于初級階段,還沒有成長到能夠從云計算里獨立出來。要從云計算里獨立出來,至少還需要三五年的時間。
相對來說,云計算已經過了概念描述期,正處于一個高速成長的階段,而現在的大數據,就像三五年前的云計算,還處于培育期,大家都在討論到底該怎么做產品、怎么樣才會有市場。簡言之,大數據處于吹泡沫階段,云計算已經吹完泡沫,務實發(fā)展了。不過,雖然大數據是剛剛才開始的技術,可這個技術迎合了社會的需求,一定會成功。
財新記者:大數據與物聯網、云計算的關系是怎樣的?
何寶宏:物聯網可以看成是大數據的采集環(huán)節(jié),云計算為大數據提供一個通用的處理平臺,但僅僅依靠云計算這個平臺是不夠的,需要在云計算這個平臺上專門針對大數據處理做一些工作。
物聯網與大數據的關系要遠一層,至于云計算與大數據,就像操作系統與數據庫管理系統一樣。大數據是基于云計算的基礎服務,幾乎每一個大數據的處理都要依托云計算平臺。
誰是大玩家
財新記者:大數據這一概念為何會在現在爆發(fā)?
何寶宏:任何技術都不是平白無故出來的。2000年以前,大家都致力于研究傳統的數據庫,對結構化數據進行處理;2000年以后,以谷歌、亞馬遜這幾家互聯網巨頭為代表,開始對非結構化的數據進行處理,并運用數據挖掘的成果去推薦自身產品或投放廣告等。
直到2011年、2012年,經過了十年的實踐、研究,互聯網巨頭們終于通過不斷的技術創(chuàng)新,找到了一種廉價的、高效的處理各類不規(guī)則數據的方法,并從這種數據處理、應用中獲益不菲。在有利可圖的情況下,況且這筆利潤可能還不小,其他行業(yè)自然意欲將互聯網企業(yè)的做法搬到自己所處的行業(yè)中,這樣,大數據這一概念就被包裝出來了,也就是近兩年的事情。
財新記者:當前,依托大數據,可否有成功的盈利模式?
何寶宏:現在,大數據應用得最成功的還是一些互聯網企業(yè)。百度可以通過分析用戶語義,了解用戶習慣、愛好,以便推送廣告,阿里巴巴也能利用數據挖掘進行精準的產品營銷,這種根據用戶瀏覽、搜索等行為分析用戶需求繼而推送廣告或產品,是當前最典型的大數據應用模式。
實際上,等大數據真正發(fā)展起來,可能會出現超乎想象的應用,就像谷歌通過分析人們搜索的關鍵詞竟然可以對流行病進行預測那樣,很多創(chuàng)新性的應用將隨之出現,發(fā)展空間之大我們目前還難以預料。
財新記者:大數據現在最主要的應用在互聯網領域,具體案例如何?可否供其他行業(yè)借鑒?
何寶宏:以淘寶為例,這個電子商務平臺擁有的商品超過10億種,交易總額已經突破萬億,每天約有30億次網頁瀏覽、數千萬筆商品交易。如此多的商品數據、用戶數據、交易數據、社交數據等,經過分析、挖掘,最終形成的應用流向了交易的全過程,包括用戶潛在的購買需求預測、針對性地推送產品、商品滿意度調查、商家信譽等,甚至還流向了支付、保險、物流等環(huán)節(jié),衍生出極具想象力的應用。