【編者按】:人工智能和機(jī)器學(xué)習(xí)這兩個生僻的科技術(shù)語如今已經(jīng)廣為流傳。過去10年,機(jī)器學(xué)習(xí)已經(jīng)為我們帶來了無人駕駛汽車、實(shí)用的語音識別、有效的網(wǎng)絡(luò)搜索,還大幅加深了我們對人類基因組的理解。機(jī)器學(xué)習(xí)是什么;機(jī)器學(xué)習(xí)能做什么;企業(yè)機(jī)器學(xué)習(xí)應(yīng)用趨勢又哪些?數(shù)美CTO梁堃在以“大數(shù)據(jù)與人工智能”為主題的第五屆中國大數(shù)據(jù)應(yīng)用論壇上,分享了他的理解,以下是他演講的內(nèi)容。

 
 
  演講嘉賓:梁堃,數(shù)美聯(lián)合創(chuàng)始人&CTO, 高考狀元,北大學(xué)霸,曾就職于百度,小米擔(dān)任高級工程師,架構(gòu)師。兩次獲得百度年度“MVE”(最具有價值員工) 。成功將大數(shù)據(jù)運(yùn)用于搜索 推薦,反欺詐,風(fēng)險控制等領(lǐng)域。具有大數(shù)據(jù)方案整體架構(gòu)能力。擅長發(fā)現(xiàn)并解決用戶在大數(shù)據(jù)領(lǐng)域的痛點(diǎn)。
 
 
  先做下自我介紹,我是梁堃,數(shù)美的聯(lián)合創(chuàng)始人兼CTO。很榮幸有機(jī)會給大家介紹機(jī)器學(xué)習(xí)和人工智能。這次介紹分為三個部分:
 
  第一部分,機(jī)器學(xué)習(xí)是什么
 
  第二部分,機(jī)器學(xué)習(xí)能做什么
 
  第三部分,企業(yè)機(jī)器學(xué)習(xí)應(yīng)用趨勢
 
  機(jī)器學(xué)習(xí)是什么
 
  一個方面來介紹機(jī)器學(xué)習(xí),就是從機(jī)器學(xué)習(xí)的目標(biāo)或者業(yè)務(wù)要做什么來介紹。機(jī)器學(xué)習(xí)最大的是計(jì)算機(jī)科學(xué),其中有一個很重要的分支是人工智能。人工智能里面有兩種實(shí)現(xiàn)人工智能的方法,這兩種方法分別對應(yīng)于人類智能的兩種思考模式,一種思考模式叫做演繹法,就是我從已知的規(guī)則和事實(shí)推導(dǎo)新的規(guī)則和事實(shí)。這個系統(tǒng)是之前60-80年代用的比較多的系統(tǒng),叫專家系統(tǒng)。而第二種在人類思考叫做歸納法,通過對事實(shí)觀察歸納來歸納總結(jié)出來新的規(guī)律、新的事物的本質(zhì),然后再把它應(yīng)用到新的事物里面去。把這個是現(xiàn)在計(jì)算之中就叫做機(jī)器學(xué)習(xí)。當(dāng)然最近幾年非常熱的機(jī)器學(xué)習(xí)的方法叫做深度學(xué)習(xí),它是機(jī)器學(xué)習(xí)里面的一個領(lǐng)域。
 
 
  從一九四幾年開始發(fā)展出來計(jì)算機(jī)科學(xué),它在做什么?本質(zhì)就是嘗試對業(yè)務(wù)進(jìn)行自動化處理。剛出來的時候完全是針對數(shù)字計(jì)算,大規(guī)模的計(jì)算,如果要靠人來做這個事情是很困難的,需要花費(fèi)大量的精力和時間。那么能否讓機(jī)器像做成流水線計(jì)算呢?這就是最早的計(jì)算。我們不斷的去探究,不單單數(shù)據(jù)計(jì)算自動化了,普通企業(yè)各個行業(yè)的企業(yè)里面的流程以及業(yè)務(wù)也在被信息化、自動化。這是關(guān)于數(shù)據(jù)庫出現(xiàn)之后包括訂單的轉(zhuǎn)移、ERP財(cái)務(wù)等等都被自動化。隨著計(jì)算機(jī)越來越火,可以自動化越來越多的東西,互聯(lián)網(wǎng)自動化很多東西,比如對資料的檢索等。當(dāng)我們進(jìn)一步拓展可以自動化的范圍時我們發(fā)現(xiàn)了一些困難,舉個例子,比如說自動駕駛一輛汽車,這件事情就非常困難。因?yàn)橛?jì)算機(jī)本質(zhì)上它是一個程序,需要得到明確的指令,第一步做什么、第二步做什么,它才能做。而自動駕駛汽車,這個無法用一個明確的指令描述,因?yàn)檫@個過程非常復(fù)雜。
 
 
  還有一個非常一經(jīng)典問題就是有一只小貓,連一個三歲的孩子都可以非常容易辨別出來,但是寫一段程序讓計(jì)算機(jī)系統(tǒng)認(rèn)知就很復(fù)雜。
 
  所以就提出來第二個分支:人工智能,就是想對非常復(fù)雜的問題或業(yè)務(wù)進(jìn)行智能的自動化。為什么叫智能的自動化?因?yàn)楹茈y用一個確定的公式或算法來一步步的做出來。我們需要這個系統(tǒng)可以去觀察世界,可以像人一樣思考來智能、理性做決策,最大化目標(biāo)。比如我要駕駛汽車,在最短時間內(nèi)到達(dá)那個地方同時又不出任何事故,這就是人工智能。人工智能就是把原本機(jī)器學(xué)習(xí)里面簡單程序、無法自動化的東西,用一種像人一樣智能的把它做出來。
 
  人工智能在業(yè)界使用的方法有兩個,一個是演繹法,這種方法的核心概念就是有一個專家會把已知的知識和里面的推理規(guī)則放到這里面,當(dāng)出現(xiàn)新的狀況時,系統(tǒng)會根據(jù)已知的知道推演出新的規(guī)則。比如說大樓里都有防火器,其實(shí)它就是一個特別簡單的專家系統(tǒng),它只知道一個事實(shí),溫度達(dá)到一定高度時、有煙霧的時候就會啟動。這種系統(tǒng)有一個好處就是只需要專家的支持,而不需要那么多數(shù)據(jù)的支持。而業(yè)務(wù)系統(tǒng),就是我們說得機(jī)器學(xué)習(xí)。
 
  歸納法。這時候沒有專家告訴他推理的規(guī)則,而是給他一大堆數(shù)據(jù),這就是對世界的描述,然后會有個算法,無論是神經(jīng)網(wǎng)絡(luò)算法還是其他,這個算法本身是觀察數(shù)據(jù)、探索數(shù)據(jù),它會自動的根據(jù)統(tǒng)計(jì)學(xué)規(guī)則從數(shù)據(jù)中總結(jié)出來一些規(guī)則和事實(shí)。當(dāng)一份新的數(shù)據(jù)過來,就可以應(yīng)用到其中,機(jī)器學(xué)習(xí)本身還是把復(fù)雜的業(yè)務(wù)系統(tǒng)自動化。
 

 
  而深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個分支,我們可以做點(diǎn)擊率預(yù)估,這個是互聯(lián)網(wǎng)購盈利的兩大核心之一。當(dāng)一個用戶來了,我應(yīng)該給他出什么樣的廣告,這個用戶才最可能點(diǎn)這個廣告讓我盈利。深度學(xué)習(xí)解決的是,對這個世界做一種更抽象的解讀。比如說傳統(tǒng)的是無法形成多級的抽象,深度學(xué)習(xí)不一樣,深度學(xué)習(xí)是給他一個圖片就行。深度學(xué)習(xí)主要是基于神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)的前幾層是在學(xué)習(xí)這張圖片里面或者學(xué)習(xí)人臉的邊邊角角的特征,這是不是有一個弧線或者陰影,比如說一些特征組合出來眼睛這個概念,一些特征組合出來鼻子這個概念。再往上這個神經(jīng)網(wǎng)絡(luò)就會形成一個非常高級的抽象,這是一個人臉。這種高級的概念對我們而言是非常自然的,但是對于計(jì)算機(jī)而言,你想把它描述準(zhǔn)確極其困難。
 
 
  比如說“馬”這個概念,我們可以看到有各種各樣的馬,白色的馬、黑色的馬或者有的馬少一條腿甚至是一個玩具的馬、木馬,當(dāng)把這個東西方在你面前,任何一個人都明確知道這是馬。但是你想給一個機(jī)器去描述的時候,什么樣的東西是馬,這個概念極其復(fù)雜。你很難描述出來。兩個耳朵、四條腿、能跑的就是馬?不對。深度學(xué)習(xí)要解決的就是這個問題。希望通過深度學(xué)習(xí)讓計(jì)算機(jī)認(rèn)識之前只有人才認(rèn)識的高級概念。
 
  深度學(xué)習(xí)這兩年做的非?;?,但其實(shí)這個概念很早就有了。70年代的時候銀行就開始使用了,目前演進(jìn)為“深度學(xué)習(xí)”,銀行就做個人信用得分的預(yù)測。比如說收入、年齡、消費(fèi)組成、職業(yè),預(yù)測輸出如期還款概率或者延期還款概率等等。
 
  機(jī)器學(xué)習(xí)在今天越來越重要,為什么?因?yàn)檫@些年信息化程度非常之高,存儲成本又非常便宜,廣泛的互聯(lián)網(wǎng)化讓大量數(shù)據(jù)出現(xiàn)在我們的存儲、出現(xiàn)在計(jì)算機(jī)世界當(dāng)中。這樣就有機(jī)會用更加復(fù)雜的機(jī)器學(xué)習(xí)的算法,因?yàn)樗写罅渴聦?shí)、數(shù)據(jù)可以學(xué)習(xí)。它是歸納法,本身就依賴于這個條件。所以這兩年發(fā)展非??焖佟?/div>
 
  機(jī)器學(xué)習(xí)能做什么?
 
  算法交易、欺詐檢測、信用評估...這是非常經(jīng)典的應(yīng)用,都是預(yù)測的東西。我把前的兩個提出來,前兩個就是去年到今天為止整個互聯(lián)網(wǎng)行業(yè)盈利最大的兩個算法,一個是在線廣告,在線廣告貫穿了整個PC端。打開任何一個網(wǎng)頁,都會發(fā)現(xiàn)這些廣告。有些是廣告主直接跟網(wǎng)站簽訂投放協(xié)議,但更多的是通過京東、淘寶這樣的中介去投放。當(dāng)你投放廣告時,只有用戶點(diǎn)擊了,廣告主才會付賬。所以廣告出現(xiàn)在這個頁面時,你一定要把他最可能點(diǎn)的廣告放在上面。這里面就涉及到非常復(fù)雜的東西。這里面涉及到方方面面,包括你要對用戶建立畫像,你要了解你的用戶,性別、年齡、住在什么地區(qū)什么小區(qū)。第二是個性化推薦,相信大家對這個非常熟悉。在互聯(lián)網(wǎng)上我們每個人都在享受定制化的服務(wù),你在聽音樂,它會把你感興趣的音樂推給你,你看今日頭條,他也會把你感興趣的新聞推給你。當(dāng)然還有算法交易、欺詐檢測、信用評估等等,比如說我們的員工,實(shí)時檢測一個人,他是真的人還是機(jī)器人。另外,現(xiàn)在機(jī)器人特別高級,他們自己都會相互聊天。
 
 
  那么新興應(yīng)用呢?機(jī)器學(xué)習(xí)其實(shí)能做很多事情,我挑了幾個非常震驚的例子,比如說實(shí)時翻譯,一個路牌,你把攝像頭對準(zhǔn)它,它就會給你實(shí)時翻譯成你認(rèn)識的語言。又比如微軟的一個軟件,是同聲傳譯的東西,他只要說英語就行,他說出來的話就被實(shí)時的翻譯成中文,你說出來的話在他聽到的時候已經(jīng)被實(shí)時翻譯成英文。這件事情讓我極其震驚。因?yàn)槲掖髮W(xué)有一個同學(xué)就是學(xué)同聲傳譯的,當(dāng)時他學(xué)的時候非常辛苦,但是現(xiàn)在機(jī)器就可以做到了。自動駕駛,一兩年前還是在實(shí)驗(yàn)階段,但今天已經(jīng)開始上路。第一個真正路上跑的。包括特斯拉、Google、百度。相信自動駕駛將來會成為一個中高端車的標(biāo)配。為什么今天可以做到這點(diǎn)?很簡單,因?yàn)樘厮估袛?shù)億英里的駕駛數(shù)據(jù)。
 
  從剛才幾個例子來看,我們想象一下機(jī)器學(xué)習(xí)可以深入到生活的方方面面。金融、制造業(yè)、機(jī)器人工廠、醫(yī)療、教育、服務(wù)等方方面面。為什么?因?yàn)闄C(jī)器學(xué)習(xí)或者說基于機(jī)器學(xué)習(xí)的人工智能,它最本質(zhì)的目標(biāo)就是在某一個任務(wù)上做到像人一樣有智能、像人一樣可以對這個問題進(jìn)行分析并做出快速的預(yù)測。在我看來機(jī)器學(xué)習(xí)會在其他方面成為核心。
 
  企業(yè)機(jī)器學(xué)習(xí)應(yīng)用趨勢
 
 
  我們來看Google公司的一個數(shù)據(jù),在2002年的時候Google公司全部署了機(jī)器學(xué)習(xí)模型,大幾十個,或者一百出頭的樣子。但是到2016年年初的時候,他們部署的機(jī)器學(xué)習(xí)的模型已經(jīng)接近3000個。在他的每一個業(yè)務(wù)里都有Gmail、讀書、翻譯等都部署了機(jī)器學(xué)習(xí)。其實(shí)很多公司,尤其是比較早的互聯(lián)網(wǎng)公司都是這樣的趨勢。在我看來可能幾年之后幾乎所有大規(guī)模的業(yè)務(wù)都將用機(jī)器學(xué)習(xí)自動處理,幾乎所有的。我加了“幾乎”只是為了嚴(yán)謹(jǐn),因?yàn)楹苡锌赡苁恰八小?。首先,隨著業(yè)務(wù)廣泛的數(shù)字化、互聯(lián)網(wǎng)化,無論是工業(yè)4.0還是互聯(lián)網(wǎng)+都是把人的衣食住行各個方面的業(yè)務(wù)數(shù)字化、互聯(lián)網(wǎng)化。這會導(dǎo)致什么?會導(dǎo)致我們有非常大量的數(shù)據(jù)產(chǎn)生。包括打車的數(shù)據(jù)、吃飯的數(shù)據(jù)、穿衣服的數(shù)據(jù)、醫(yī)療數(shù)據(jù)等等都會出現(xiàn)。同時,存儲和計(jì)算成本在不斷降低。幾年之后,每個企業(yè)都將成為數(shù)據(jù)企業(yè),都將積攢自己的核心數(shù)據(jù),這些數(shù)據(jù)是非常寶貴的財(cái)富。因?yàn)檫@些數(shù)據(jù)提供了機(jī)器學(xué)習(xí)、人工智能的基石。
 
  第二,這些數(shù)據(jù)不能僅僅出些報表而已,每一個企業(yè)都將大規(guī)模部署機(jī)器學(xué)習(xí),去把自己企業(yè)里面盡可能多的大規(guī)模業(yè)務(wù)自動化。能用機(jī)器學(xué)習(xí)代替的東西,為什么不呢,所以每個企業(yè)都會在自己的核心業(yè)務(wù)上部署機(jī)器學(xué)習(xí)。當(dāng)然機(jī)器學(xué)習(xí)還是個挺麻煩的事情,對于有實(shí)力的大企業(yè)可以建設(shè)自己的專家團(tuán)隊(duì)、機(jī)器學(xué)習(xí)團(tuán)隊(duì)來進(jìn)行定制化服務(wù),但是這件事情是富人游戲,一般的企業(yè)并不適用?,F(xiàn)在無論是亞馬遜、微軟、阿里都在集成標(biāo)準(zhǔn)學(xué)習(xí)模塊,以及共享行業(yè)的信息模塊。在我看來,中小型的企業(yè)也會部署機(jī)器學(xué)習(xí)模型,只不過他們的不是定制化的,而是一種基于云的機(jī)器學(xué)習(xí)。它就像App標(biāo)準(zhǔn)服務(wù)一樣被使用。第三,每個企業(yè)提供的每個應(yīng)用服務(wù)都是智能化的,它不再是說我要定制一個服務(wù)需要昂貴的成本。每一個客戶都在享受定制化服務(wù)、享受定制應(yīng)用。這是之后兩三年企業(yè)機(jī)器學(xué)習(xí)應(yīng)用的趨勢分析。當(dāng)然了,三年搞不定可能會是五年。
 
  我的介紹就到這里,謝謝大家!
責(zé)任編輯:admin

關(guān)注國脈電子政務(wù)網(wǎng),政府CIO的思想陣地與交流平臺,5000位政府CIO在這里讀懂“互聯(lián)網(wǎng)+政務(wù)”

二維碼