發(fā)微博、寫博客、瀏覽網(wǎng)頁(yè)、撥打電話、看病、坐火車……這些都是我們生活中常做的事。然而,似乎很少有人注意到這些行為會(huì)留下“痕跡”。事實(shí)上,在與互聯(lián)網(wǎng)、政府、信息系統(tǒng)等的交互中,我們創(chuàng)造了成千上萬(wàn)、甚至上億的數(shù)據(jù),日積月累,這個(gè)數(shù)量越來(lái)越龐大,龐大到傳統(tǒng)的數(shù)據(jù)庫(kù)和基礎(chǔ)架構(gòu)根本無(wú)法及時(shí)處理、管理和分析這些數(shù)據(jù)集,于是,“大數(shù)據(jù)”應(yīng)運(yùn)而生。
近年來(lái),“大數(shù)據(jù)(Big Data)”一詞快速升溫,成為了IT行業(yè)爭(zhēng)相傳誦的熱門話題。最早提出“大數(shù)據(jù)”時(shí)代已經(jīng)到來(lái)的麥肯錫公司指出:數(shù)據(jù)已經(jīng)滲透到每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,逐漸成為重要的生產(chǎn)因素,而人們對(duì)于海量數(shù)據(jù)的運(yùn)用將預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來(lái)。當(dāng)前,國(guó)內(nèi)大數(shù)據(jù)正處于快速起步階段。大數(shù)據(jù)的到來(lái),將會(huì)帶動(dòng)包括基礎(chǔ)架構(gòu)、軟件以及相關(guān)服務(wù)整個(gè)信息產(chǎn)業(yè)鏈的變革。大數(shù)據(jù)時(shí)代,數(shù)據(jù)承載事實(shí)、承載民意,在公民表達(dá)、監(jiān)督方面,在政府政策的制定、實(shí)行方面,在企業(yè)的盈利創(chuàng)新方面,甚至在公共對(duì)話方面,都將產(chǎn)生深遠(yuǎn)影響,屆時(shí),尊重?cái)?shù)據(jù)、使用數(shù)據(jù)、公開(kāi)數(shù)據(jù)將成為一種行為方式。
何為“大數(shù)據(jù)”?
2012年6月,美國(guó)《國(guó)家科學(xué)院院刊》刊登了美國(guó)科學(xué)院院士邁克·古德柴爾德和中國(guó)科學(xué)院院士郭華東等共同撰寫的《新一代數(shù)字地球》一文,指出人類將進(jìn)入“大數(shù)據(jù)”時(shí)代。隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、電子商務(wù)等應(yīng)用更加普及,帶來(lái)了數(shù)據(jù)源種類和數(shù)據(jù)量的持續(xù)快速增加,大數(shù)據(jù)現(xiàn)象已經(jīng)出現(xiàn)。
數(shù)據(jù)本身是一種資產(chǎn),大數(shù)據(jù)是有價(jià)值的,這點(diǎn)在業(yè)界已形成共識(shí),但“大數(shù)據(jù)”在業(yè)內(nèi)并沒(méi)有統(tǒng)一的定義。由于大數(shù)據(jù)分析常和云計(jì)算聯(lián)系到一起,有人把大數(shù)據(jù)等同于云計(jì)算,也有人在大數(shù)據(jù)是種技術(shù)還是種現(xiàn)象之間糾結(jié)。關(guān)于大數(shù)據(jù)和云計(jì)算間的關(guān)系,麥肯錫是這樣描述的:“如果說(shuō)云計(jì)算為數(shù)據(jù)資產(chǎn)提供了保管、訪問(wèn)的場(chǎng)所和渠道,那么如何盤活數(shù)據(jù)資產(chǎn),使其為國(guó)家治理、企業(yè)決策乃至個(gè)人生活服務(wù),則是大數(shù)據(jù)的核心議題,也是云計(jì)算內(nèi)在的靈魂和必然的升級(jí)方向。”
綜合取舍各方意見(jiàn),互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)為“大數(shù)據(jù)”下了定義,得到了業(yè)內(nèi)的普遍認(rèn)可,即“大數(shù)據(jù)”是指為了更經(jīng)濟(jì)更有效地從高頻率、大容量、不同結(jié)構(gòu)和類型的數(shù)據(jù)中獲取價(jià)值而設(shè)計(jì)的新一代架構(gòu)和技術(shù),用它來(lái)描述和定義信息爆炸時(shí)代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。
物聯(lián)網(wǎng)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、車聯(lián)網(wǎng)、手機(jī)、平板電腦、PC以及遍布地球各個(gè)角落的各種各樣的傳感器,無(wú)一不是數(shù)據(jù)來(lái)源或者承載的方式。如此海量的數(shù)據(jù)造就了大數(shù)據(jù)的“4V”—— Volume,Variety,Value,Velocity,即數(shù)據(jù)體量巨大,從TB級(jí)別躍升到PB級(jí)別;數(shù)據(jù)類型繁多,網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等都能成為數(shù)據(jù);價(jià)值密度低,以視頻為例,長(zhǎng)時(shí)間連續(xù)不間斷監(jiān)控過(guò)程中,可能有用的數(shù)據(jù)僅僅有一兩秒;處理速度快,遵循1秒定律。上述“4V”,造就了獨(dú)一無(wú)二的“大數(shù)據(jù)”。
“大數(shù)據(jù)”將帶來(lái)什么?
有數(shù)據(jù)顯示,目前全球有46億移動(dòng)電話用戶,每天有20億人訪問(wèn)互聯(lián)網(wǎng),人們與數(shù)據(jù)的交互比以往任何時(shí)候都密切。據(jù)全球領(lǐng)先的互聯(lián)網(wǎng)解決方案供應(yīng)商思科公司預(yù)測(cè),到2013年,在互聯(lián)網(wǎng)上流動(dòng)的交通量將達(dá)到每年667艾字節(jié)(EB)。目前,大數(shù)據(jù)所形成的市場(chǎng)規(guī)模在51億美元左右,而到2017年,此數(shù)據(jù)將上漲到530億美元。
大數(shù)據(jù)時(shí)代,網(wǎng)民和消費(fèi)者的界限正在消弭,企業(yè)的疆界變得模糊,數(shù)據(jù)共享成為政府的一種常態(tài)化責(zé)任。數(shù)據(jù)成為企業(yè)的核心資產(chǎn),并將深刻影響企業(yè)的業(yè)務(wù)模式,甚至重構(gòu)其文化和組織。順“大數(shù)據(jù)”者昌,逆“大數(shù)據(jù)”者亡。索尼前總裁出井深之曾一針見(jiàn)血地指出:新一代基于互聯(lián)網(wǎng)DNA企業(yè)的核心能力在于利用新模式和新技術(shù)更加貼近消費(fèi)者、深刻理解需求、高效分析信息并做出預(yù)判,所有傳統(tǒng)的產(chǎn)品公司都只能淪為這種新型用戶平臺(tái)級(jí)公司的附庸,其衰落不是管理能扭轉(zhuǎn)的。
在大數(shù)據(jù)概念提出之前,互聯(lián)網(wǎng)企業(yè)沿著固有的脈搏一路繁榮,人們利用互聯(lián)網(wǎng)進(jìn)行溝通、娛樂(lè)和消費(fèi),傳統(tǒng)企業(yè)一直忙于供、研、產(chǎn)、銷,兩者基本上平行發(fā)展、鮮有交集。大數(shù)據(jù)使兩者產(chǎn)生交集,為互聯(lián)網(wǎng)嫁接了“供應(yīng)鏈”,為傳統(tǒng)企業(yè)嫁接“互聯(lián)網(wǎng)基因”,引發(fā)消費(fèi)模式、制造模式、管理模式的巨大變革??梢哉f(shuō),大數(shù)據(jù)幫助人們開(kāi)啟循“數(shù)”管理的模式,“得數(shù)據(jù)者得天下”。