當前,全球已進入大數(shù)據(jù)時代,大數(shù)據(jù)正以一種革命風暴的姿態(tài)闖入人們生產(chǎn)和生活,影響著我們的工作與思維,龐大的數(shù)據(jù)資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程。今天我們有幸采訪到了《大數(shù)據(jù)革命》的作者、中國大數(shù)據(jù)產(chǎn)業(yè)的布道者和開拓者,數(shù)據(jù)科學家,也是一個有情懷的學者和創(chuàng)業(yè)者趙勇博士來詳細給我們講述大數(shù)據(jù)的發(fā)展與未來。

  專家介紹:趙勇

  美國芝加哥大學博士,師從世界網(wǎng)格之父Ian Foster教授;曾就職于IBM美國研發(fā)中心、美國Argonne國家實驗室,其SWIFT系統(tǒng)數(shù)據(jù)算法平臺享譽數(shù)據(jù)科學界,具體應用到例如: 美國能源部的SDSS斯隆數(shù)字天空掃描項目, 美國航空航天局NASA的AstroPortal天文數(shù)據(jù)網(wǎng)關項目,引力波探測LIGO,歐洲大型強子對撞機(LHC) ……曾就職于美國Microsoft總部西雅圖,次年即榮獲微軟杰出員工獎,中國計算機學會大數(shù)據(jù)專家委員會發(fā)起委員,國內(nèi)首位撰寫大數(shù)據(jù)技術專著的作者,作品《架構大數(shù)據(jù)》、《大數(shù)據(jù)革命》;曾任清華大學大數(shù)據(jù)處理中心CTO,組建國內(nèi)第一支專業(yè)化大數(shù)據(jù)技術團隊。

  以下為采訪主要內(nèi)容:

  數(shù)邦客:趙博士,請您幫我們介紹一下中國西部互聯(lián)網(wǎng)與大數(shù)據(jù)產(chǎn)業(yè)分會是一個什么樣的組織。

  趙勇:中國西部互聯(lián)網(wǎng)與大數(shù)據(jù)產(chǎn)業(yè)分會是由中國西部12省、市、區(qū)范圍內(nèi)從事互聯(lián)網(wǎng)與大數(shù)據(jù)研究、開發(fā)、應用、服務的企業(yè)、機構和個人組織成立的地方性、行業(yè)性、非營利性的社會團體。匯集西部近500家大數(shù)據(jù)企業(yè)及科研機構、院校和業(yè)內(nèi)知名投資人,同時獲得清華大數(shù)據(jù)產(chǎn)業(yè)聯(lián)合會西部分會的全力支持。分會結(jié)合了產(chǎn)業(yè)、行業(yè)的優(yōu)勢資源與中國西部的地緣和市場優(yōu)勢,借助“實施國家大數(shù)據(jù)戰(zhàn)略,推進數(shù)據(jù)資源開放共享”的國家戰(zhàn)略,推動、促進西部地區(qū)的大數(shù)據(jù)和相關產(chǎn)業(yè)的發(fā)展,打造中國西部大數(shù)據(jù)產(chǎn)業(yè)高地。

  數(shù)邦客:您作為大數(shù)據(jù)的“傳道者”最近也參加了不少的政府、企業(yè)的培訓,請問您目前大數(shù)據(jù)在各行業(yè)的應用都有哪些?應用效果如何?

  趙勇:我自2010年從美國微軟辭職回國到現(xiàn)在,每年都會對政府、企業(yè)、機構進行幾十次的培訓和講座,始終在傳播大數(shù)據(jù)之“道”。如果做個階段區(qū)分的話,2010—2012年是大數(shù)據(jù)概念在中國模糊了解的時期,當時大數(shù)據(jù)這個名詞才剛剛出現(xiàn),我講的云計算和數(shù)據(jù)科學、大部分人聽不懂、不了解。2013—2014年大數(shù)據(jù)的培訓和講座受到的關注就越來越多了。2015年到現(xiàn)在大數(shù)據(jù)方面的培訓和講座往往能激起強烈反響,通過三個階段的對比可以發(fā)現(xiàn),大數(shù)據(jù)的發(fā)展從概念普及、社會重視、行業(yè)熱炒、應用落地到國家戰(zhàn)略,在短短幾年時間內(nèi)整個產(chǎn)業(yè)生態(tài)發(fā)生了巨變。

  我去美國留學的目的就是致力于數(shù)據(jù)科學的學習和研究,也是奔著世界網(wǎng)格之父Ian Foster教授去的芝加哥大學,在Ian Foster教授門下學了七年,之后進入微軟,回國之后我做的第一件事就是傳道,普及云計算及大數(shù)據(jù)概念,第二件事就是將先進的大數(shù)據(jù)技術運用到具體的行業(yè)中。2012年我組建國內(nèi)第一支專業(yè)化的大數(shù)據(jù)團隊,并相繼在國家電網(wǎng)、中國民航、教育、安監(jiān)、金融、醫(yī)療、交通、農(nóng)業(yè)、車聯(lián)網(wǎng)等多個行業(yè)落地,其中大多數(shù)應用都是開拓性的成果。

  在國內(nèi)許多戰(zhàn)略性行業(yè)的軟件還被IOE壟斷的時候,我把大數(shù)據(jù)技術的突破點選擇在長期被IBM,Oracle公司壟斷的國家戰(zhàn)略行業(yè)航空和電力系統(tǒng)。

  2013年首先為中航信研發(fā)了基于大數(shù)據(jù)的新一代民航信息系統(tǒng)、訂票實時查詢系統(tǒng)、動態(tài)航班聯(lián)程性能優(yōu)化系統(tǒng),基于海量數(shù)據(jù)的儲存、查詢、分析的綜合平臺。同時團隊又為東方航空建立數(shù)據(jù)挖掘平臺、電子商務網(wǎng)站優(yōu)化系統(tǒng)。在航空領域的大數(shù)據(jù)技術成功應用,是我?guī)ьI團隊在中國大數(shù)據(jù)產(chǎn)業(yè)應用的一個突破性案例,打破了Oracle等國外公司對中國民航信息行業(yè)的壟斷,經(jīng)過幾年的發(fā)展,中航信公司的軟件和平臺實現(xiàn)了完全國產(chǎn)化。

  而對于另一家被IBM和Oracle公司長期壟斷的國家電網(wǎng),團隊為國家電網(wǎng)業(yè)務系統(tǒng)一級部署頂層架構設計,形成電網(wǎng)內(nèi)部改革的指導性方案,為國電量身打造了“財務實時運營監(jiān)管系統(tǒng)改造方案”和“用電信息采集系統(tǒng)改進方案”,填補了海量數(shù)據(jù)在國內(nèi)電力行業(yè)應用的空白。

  就應用效果和意義而言,這兩個應用不僅解決了他們的痛點,也為這些大公司節(jié)約了數(shù)百萬美金的研發(fā)費用,最重要的是為去IOE國家戰(zhàn)略和軟件國產(chǎn)化樹立了標桿。

  數(shù)邦客:您是如何理解數(shù)據(jù)開放與大數(shù)據(jù)應用之間的關系?

  趙勇:數(shù)據(jù)開放對大數(shù)據(jù)應用有很大的促進作用,像美國從2009年建立了政府數(shù)據(jù)開放平臺data.gov,每年帶動的數(shù)據(jù)創(chuàng)新和應用的產(chǎn)值高達3萬億美元。我們都知道數(shù)據(jù)源是大數(shù)據(jù)應用的基礎,中國有將近70%的數(shù)據(jù)是掌握在政府手里,而如BAT這些大的互聯(lián)網(wǎng)公司掌握了20%左右的數(shù)據(jù),其余10%的數(shù)據(jù)碎片化的分散到各個領域,從這個比例就可以得出一個基本的結(jié)論,那就是掌握數(shù)據(jù)源資源的政府開放數(shù)據(jù)直接影響著大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展。

  值得欣喜的是,隨著對數(shù)據(jù)價值的重視程度越來越高,數(shù)據(jù)價值的轉(zhuǎn)化問題成為政府重大的課題,我國的大數(shù)據(jù)發(fā)展行動綱要已經(jīng)明確制定了政府各部委的數(shù)據(jù)開放日程表。今后政策支持會越來越有力,開放的步伐也會越來越快,數(shù)據(jù)資產(chǎn)的交易需求也會越來越大。但數(shù)據(jù)開放同樣面臨著很多問題和細節(jié),比如數(shù)據(jù)的所屬權、使用權;數(shù)據(jù)開放的邊界、層級;開放標準;訪問格式;數(shù)據(jù)安全的保障、隱私的規(guī)避等等問題,這些都需要去解決。但我相信數(shù)據(jù)開放一定是大趨勢,數(shù)據(jù)開放的程度將直接影響到大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展速度。

  數(shù)邦客:大數(shù)據(jù)產(chǎn)業(yè)鏈上都包括哪些環(huán)節(jié),每個環(huán)節(jié)有哪些特點?咱們產(chǎn)業(yè)分會在大數(shù)據(jù)全產(chǎn)業(yè)鏈上又是如何參與的?

  趙勇:大數(shù)據(jù)的產(chǎn)業(yè)鏈從技術層面上來說,分為大數(shù)據(jù)的基礎設施支撐、數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)處理、數(shù)據(jù)的展示和交互、數(shù)據(jù)的應用、數(shù)據(jù)的運營支撐和安全保障等環(huán)節(jié)。目前在全球產(chǎn)業(yè)鏈的角度來看,每個環(huán)節(jié)都出現(xiàn)了細分的技術開發(fā)商和服務商。當前技術發(fā)展的重點集中在了數(shù)據(jù)處理、交互和應用環(huán)節(jié),比如目前火遍全球的AlphaGo和深度學習、認知科學和人工智能;還有VR/AR。大數(shù)據(jù)在各行各業(yè)深入應用并都朝著智能化的方向發(fā)展。

  從商業(yè)應用的角度來說,大數(shù)據(jù)產(chǎn)業(yè)鏈分為大數(shù)據(jù)的理論和方法論研究、大數(shù)據(jù)標準的制定、大數(shù)據(jù)的培訓和人才培養(yǎng)、大數(shù)據(jù)高端咨詢服務、大數(shù)據(jù)的技術開發(fā)及實施,大數(shù)據(jù)交易和交換、大數(shù)據(jù)產(chǎn)業(yè)孵化,以及大數(shù)據(jù)的投融資和產(chǎn)業(yè)發(fā)展基金等。

  我們產(chǎn)業(yè)分會和清數(shù)公司一開始就站在產(chǎn)業(yè)鏈的高度,著力構建系完整的大數(shù)據(jù)產(chǎn)業(yè)生態(tài)鏈,從大數(shù)據(jù)技術應用、研究開發(fā)、產(chǎn)品落地、人才培養(yǎng)、資源整合、產(chǎn)業(yè)孵化的多個維度打造一個大數(shù)據(jù)全產(chǎn)業(yè)鏈閉環(huán)。

  產(chǎn)業(yè)鏈以國家十三五發(fā)展規(guī)劃的大數(shù)據(jù)國家戰(zhàn)略為政策引導,通過構建大數(shù)據(jù)全產(chǎn)業(yè)生態(tài)鏈,結(jié)合“大眾創(chuàng)新、萬眾創(chuàng)業(yè)”的雙創(chuàng)氛圍,融入工業(yè)智造、智慧城市、軍民融合、信息扶貧、北斗衛(wèi)星這些大產(chǎn)業(yè)的發(fā)展背景,讓大數(shù)據(jù)發(fā)展緊扣中國科技、經(jīng)濟、社會發(fā)展趨勢。

  我們首先發(fā)起和成立了中國西部互聯(lián)網(wǎng)與大數(shù)據(jù)產(chǎn)業(yè)協(xié)會、清華大數(shù)據(jù)產(chǎn)業(yè)聯(lián)合會西部分會、中國西部大數(shù)據(jù)學院、四川大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟、四川智慧城市專業(yè)委員會等多個協(xié)會組織,以協(xié)會和專家智庫作為企業(yè)和資源整合、人才交流和培養(yǎng)、市場拓展、營銷宣傳平臺。同時在2015年創(chuàng)辦成都清數(shù)科技有限公司,以清數(shù)科技作為大數(shù)據(jù)產(chǎn)業(yè)鏈的產(chǎn)品研發(fā)和行業(yè)應用為主體,相繼成立控股承載協(xié)會運營和人才培訓的金數(shù)智創(chuàng)科技有限公司、承載智慧城市項目運營的中數(shù)智城科技有限公司、承載第五維國際大數(shù)據(jù)孵化器的清數(shù)華創(chuàng)科技有限公司、承載項目工程實施的分秒云創(chuàng)科技有限公司,同時還以技術參股形式參股數(shù)十家成長性優(yōu)質(zhì)的大數(shù)據(jù)應用公司。

  我們以協(xié)會為基礎依托平臺,以成都清數(shù)科技有限公司作為大數(shù)據(jù)技術和產(chǎn)品、大數(shù)據(jù)應用研發(fā)和實施的平臺;以大數(shù)據(jù)產(chǎn)業(yè)基金、大數(shù)據(jù)投資基金作為大數(shù)據(jù)金融投融資平臺;以第五維國際孵化器作為大數(shù)據(jù)產(chǎn)業(yè)創(chuàng)新創(chuàng)業(yè)平臺,以大數(shù)據(jù)研究院、大數(shù)據(jù)實驗室作為大數(shù)據(jù)深度科研平臺。以集群模式打造中國第一艘大數(shù)據(jù)航母,技術研發(fā)是驅(qū)動航母前進的動力引擎,產(chǎn)品和應用是航母的戰(zhàn)斗武器,協(xié)會和機構是保駕護航的護衛(wèi)艦,資金和人才為航母提供源源不斷的后勤支援。

  數(shù)邦客:4月13日,國家促進大數(shù)據(jù)發(fā)展部際聯(lián)席會議召開第一次會議,會議審議通過了《促進大數(shù)據(jù)發(fā)展三年工作方案(2016-2018)》、《促進大數(shù)據(jù)發(fā)展2016 年工作要點》,以及正在制定大數(shù)據(jù)產(chǎn)業(yè)“十三五”發(fā)展規(guī)劃,國家頻繁出臺相關文件辦法,您對此有什么看法?

  趙勇:從2015年開始,國家對大數(shù)據(jù)行業(yè)的關注可以說達到了前所未有的高度。之前歐美國家都已經(jīng)把大數(shù)據(jù)列為國家戰(zhàn)略,大數(shù)據(jù)的發(fā)展將直接關乎我們的國際競爭力。國家密集出臺關于發(fā)展大數(shù)據(jù)的規(guī)劃和文件,釋放出一種強烈的信號,那便是從國家層面將發(fā)展大數(shù)據(jù)作為長期可持續(xù)發(fā)展的國家戰(zhàn)略,并為此戰(zhàn)略配套一系列的具體發(fā)展政策和行動方案,國家的公共數(shù)據(jù)將逐漸開放,沉睡的數(shù)據(jù)將被激活,數(shù)據(jù)的價值將直接轉(zhuǎn)化為生產(chǎn)力,驅(qū)動創(chuàng)新創(chuàng)業(yè)發(fā)展。

  中國的很多企業(yè)正處于轉(zhuǎn)型升級的關鍵期,雙創(chuàng)形勢也是如火如荼,工業(yè)智造逐步推進,大健康醫(yī)療、北斗衛(wèi)星、WIFI信息扶貧,這些關乎國家未來發(fā)展的領域都會緊密的與大數(shù)據(jù)產(chǎn)業(yè)相結(jié)合,因此數(shù)據(jù)公開的步伐和政策支持的力度正在加大,隨著國家政策面的強力支撐,產(chǎn)業(yè)基金、風險投資也在積極跟進,未來幾年內(nèi),大數(shù)據(jù)的發(fā)展將引來爆發(fā)式增長,帶來豐厚的投資回報。

  數(shù)邦客:我們知道您著作了《大數(shù)據(jù)革命》、《架構大數(shù)據(jù)》相關書籍,請問您認為大數(shù)據(jù)將會進行一場什么樣的革命?

  趙勇:自2012年維克托?邁爾?舍恩伯出版《大數(shù)據(jù)時代》一書之后,拉開了大數(shù)據(jù)研究的先河,我和清華、微軟、百度的一些專家在總結(jié)多年的學術研究和實踐經(jīng)驗的基礎上,出版了國內(nèi)第一本理論與實踐結(jié)合的專著《大數(shù)據(jù)革命-理論、模式與技術創(chuàng)新》,從理論、模式與技術創(chuàng)新層面深入解析大數(shù)據(jù)的產(chǎn)業(yè)落地和價值邊界。之后出版的技術專著《架構大數(shù)據(jù)-大數(shù)據(jù)技術與算法解析》更深入的從技術及算法的專業(yè)角度,全面闡釋大數(shù)據(jù)相關技術、算法和應用場景,是國內(nèi)比較全面的大數(shù)據(jù)入門和進階的專業(yè)書籍,成為大數(shù)據(jù)技術人員的經(jīng)典教材,成書一上架就已經(jīng)售罄,經(jīng)過幾次再版依然很受歡迎。近十年來我在云計算和大數(shù)據(jù)學術領域,接連出版過《云計算—資源管理調(diào)度》、《數(shù)據(jù)中心資源優(yōu)化調(diào)度—原理與實踐》、《算法謎題》、《模糊測試—強制發(fā)掘安全漏洞的利器》等12部著譯作,在國際計算機書籍、期刊和會議上發(fā)表了60多篇技術和應用的前沿論文。

  我個人認為的大數(shù)據(jù)革命是對傳統(tǒng)的生產(chǎn)方式顛覆性的革命,首先是大數(shù)據(jù)成為新型的生產(chǎn)要素,可以替代勞動力、資本和自然資源,改變原有的要素組成和成分。其次大數(shù)據(jù)具備基因特質(zhì),基因的交叉融合可以產(chǎn)生新型的數(shù)據(jù)應用和價值。2015年底我首次提出大數(shù)據(jù)“黑洞理論”和“核聚變理論”,隨著數(shù)據(jù)的聚集,數(shù)據(jù)的質(zhì)量越來越大,數(shù)據(jù)流轉(zhuǎn)速度越來越快,可以把周邊所有相關的數(shù)據(jù)和資源都全部吸附進去,形成一個巨大的數(shù)據(jù)黑洞。未來在全球能形成幾個這樣的數(shù)據(jù)黑洞,我們也在著力打造一個。另外多種數(shù)據(jù)源進行聚合的時候可以產(chǎn)生密度更大,質(zhì)量更大的數(shù)據(jù)粒子,這個聚合就是個核聚變過程,最后能釋放出巨大的數(shù)據(jù)核能量,這種能量的爆發(fā)在未來能改變世界的政治、經(jīng)濟、科技、民生的發(fā)展,直接將人類從BT時代帶入DT時代,成為世界文明和科技發(fā)展的重要推手。

  數(shù)邦客: 您認為大數(shù)據(jù)領域未來的超級公司將如何誕生?工具型還是服務型公司更有可能成功?

  趙勇:我們比較美國和中國的大數(shù)據(jù)公司,可以看到美國注重的是平臺和數(shù)據(jù)分析,而中國目前還側(cè)重在應用方面投資。工具和平臺類的公司具備更長久的生存能力,并且可以被應用到各個行業(yè)方向,因而其未來的產(chǎn)值也是值得期待的,而應用領域則很容易面臨同類競爭。比如前一陣很流行的企業(yè)征信應用,剛開始只有幾家比較有名,而現(xiàn)在已經(jīng)遍地都是了。同樣國外由于行業(yè)比較細分和規(guī)范化,因而大數(shù)據(jù)相關的咨詢和服務市場也很大,而國內(nèi)這樣的服務市場還未成型,因而基于數(shù)據(jù)的服務和交易等公司都尚屬早期,但在未來一定會發(fā)揮大的作用。真正大數(shù)據(jù)領域的超級公司,我認為還是像上述的大數(shù)據(jù)黑洞理論所說的,按照共享經(jīng)濟的模式,整合行業(yè)資源,打造大數(shù)據(jù)產(chǎn)業(yè)生態(tài)鏈,能夠形成這個領域的超級獨角獸。

  數(shù)邦客: 您認為在未來3-5年大數(shù)據(jù)應用最廣泛的領域有哪些,原因是什么?

  趙勇:我們經(jīng)過前期的實踐,總結(jié)出了大數(shù)據(jù)領域的創(chuàng)新創(chuàng)業(yè)方法論,并提出了具體的十個衡量指標,比如價值密度、行業(yè)約束、數(shù)據(jù)全量度、地理區(qū)域覆蓋度等,具體的指標定義和衡量可以參考《大數(shù)據(jù)革命》這本書??偟膩碚f,我們摸索出金融、教育、醫(yī)療、旅游、工業(yè)這些領域大數(shù)據(jù)的前景最為廣闊。從工業(yè)企業(yè)來說,我們的信息化和自動化、智能化程度相比德國、美國還落后非常多,對數(shù)據(jù)、機器人、3D打印這些領域的需求巨大。而其他幾個領域,都關乎每個個體的生活和工作質(zhì)量,單用戶價值大,容易取得爆發(fā)式的應用和增長。我們在教育和醫(yī)療行業(yè)也取得了一些突破性的進展。我之前在清華大數(shù)據(jù)處理中心帶領團隊所研發(fā)的數(shù)學教育機器人,就能部分取代高級的數(shù)學教師,對初高中數(shù)學的作業(yè)、試題可以做到智能的識別、判卷和評測,提供給初高中學生最貼心的個性化數(shù)學輔導。這套系統(tǒng)也將參加明年的數(shù)學高考,目標是考取重點線。在醫(yī)療領域我們打造的“天人中醫(yī)”大數(shù)據(jù)健康養(yǎng)生平臺,也匯集了全國幾千名中醫(yī)專家,為全國用戶提供個性化的中醫(yī)健康養(yǎng)生服務,同時傳承和弘揚中醫(yī)國粹。

  數(shù)邦客:趙博士,您作為數(shù)邦客的平臺的入駐專家,還希望您能多與我們的會員多多進行在線溝通、答疑。另外想請問您,從專家角度來看,您覺得數(shù)邦客平臺還應該加強提供哪方面的服務?

  趙勇:數(shù)邦客——數(shù)聚天下,邦扶產(chǎn)業(yè),客至如家,共創(chuàng)未來。前期對于行業(yè)的熱點報道,還有這次的大數(shù)據(jù)領域?qū)<以L談都做得非常成功,樹立了行業(yè)影響力。我覺得今后可以在行業(yè)溝通、交流,以及領域發(fā)展的合作方面建立渠道和提供工具,促進平臺凝聚力和行業(yè)融合。

  記者:劉丹 數(shù)邦客運營總監(jiān)

責任編輯:lihui