11月28-29日,由中國社會(huì)科學(xué)院信息化研究中心和北京國脈互聯(lián)信息顧問有限公司聯(lián)合舉辦的“2018智慧中國年會(huì)”在北京隆重召開,以“數(shù)據(jù)賦能 智慧中國”為主題,共有來自全國部委、省、市、區(qū)縣電子政務(wù)、智慧城市、大數(shù)據(jù)主管領(lǐng)導(dǎo)、行業(yè)專家、企業(yè)代表、主流媒體千余人參會(huì)。

  本文系北京中潤普達(dá)公司CEO杜小軍先生于11月28日下午在“2018智慧中國年會(huì)”分論壇三--“人工智能賦能智慧政府研討會(huì)”上的演講,內(nèi)容通過現(xiàn)場速記整理,未經(jīng)本人審核。

image.png

  【北京中潤普達(dá)公司CEO 杜小軍】

  我是一個(gè)人工智能領(lǐng)域的重建者,今天想跟大家分享我們團(tuán)隊(duì)在人工智能領(lǐng)域做的一些事情。

  目前大家對(duì)大數(shù)據(jù)、人工智能、包括區(qū)塊鏈都非常關(guān)注,我們團(tuán)隊(duì)在2014年初創(chuàng)辦時(shí)就是圍繞中文語義識(shí)別。我們的子公司大家都有所了解:東湖大數(shù)據(jù)交易中心、江蘇省大數(shù)據(jù)工程實(shí)驗(yàn)室、華東江蘇大數(shù)據(jù)交易中心、錢塘工業(yè)大數(shù)據(jù)交易中心,以及正在籌建的國家氣象大數(shù)據(jù)服務(wù)平臺(tái)等。中文語義識(shí)別是我們公司的一項(xiàng)技術(shù),如果說大數(shù)據(jù)是生產(chǎn)資料,那么人工智能就是生產(chǎn)力,區(qū)塊鏈就理解為生產(chǎn)關(guān)系。所以下一個(gè)十年、二十年我們回過頭來看今天談的大數(shù)據(jù),其中很多事情就迎刃而解。因此,我是從生產(chǎn)力的角度看中文語義識(shí)別怎么推動(dòng)人工智能的利用和發(fā)展。

  一、人工智能中文語義識(shí)別

  (一)人工智能產(chǎn)業(yè)發(fā)展三大階段

  計(jì)算智能階段(50年代-90年代):代表是計(jì)算機(jī),機(jī)器基于計(jì)算智能有很強(qiáng)的數(shù)據(jù)處理和分析能力。從全球來看,這個(gè)階段對(duì)數(shù)據(jù)的質(zhì)量,尤其是數(shù)據(jù)的顆粒度、算法要求極高,這是目前人工智能發(fā)展在這個(gè)階段可以達(dá)到一定的水平,中國和美國在人工智能領(lǐng)域競爭非常激烈。

  感知智能階段(90年代末-2010年):代表是深藍(lán)系統(tǒng)、智能手機(jī),在這個(gè)階段人工智能機(jī)器能說會(huì)寫。感知智能就是現(xiàn)在說的互聯(lián)網(wǎng),隨著芯片成本的進(jìn)一步下降,單個(gè)芯片價(jià)格低至幾分錢,數(shù)據(jù)的傳感、采集、爆發(fā)形成超出人類想象的數(shù)據(jù)鏈。人工智能從語音階段逐步發(fā)展到機(jī)器發(fā)育階段,特點(diǎn)包括語音、圖像、視頻解析,這些也越來越精準(zhǔn),有些能達(dá)到80%的精準(zhǔn)。目前中美開始在這個(gè)領(lǐng)域全面競爭,中國在這個(gè)領(lǐng)域有些超過美國。

  認(rèn)知智能階段(2010年末到現(xiàn)在):代表是Alpha Go,具有自主學(xué)習(xí)能力。從去年開始,Alpha Go在中國力度加大,它是人工智能三大頂層核心技術(shù)之一,讓機(jī)器具備人的思考能力。我們把前兩者稱為弱的能力,而強(qiáng)能力都來至于對(duì)語言的真正理解,賦予機(jī)器具有思考的能力。

  (二)認(rèn)知智能是未來人工智能發(fā)展的核心焦點(diǎn)

  國務(wù)院《新一代人工智能發(fā)展規(guī)劃》明確表示未來5-10年在人工智能領(lǐng)域需要建立數(shù)據(jù)驅(qū)動(dòng)、以自然語言理解為核心目標(biāo)的認(rèn)知計(jì)算模型,形成從大數(shù)據(jù)到知識(shí)結(jié)構(gòu)化、從知識(shí)結(jié)構(gòu)化轉(zhuǎn)換成具有決策能力的新一代技術(shù)革命。這在整個(gè)新一代人工智能規(guī)劃的八大基礎(chǔ)技術(shù)里非常重要的一項(xiàng),多部委已經(jīng)把自然語言(NLP)為核心的認(rèn)知計(jì)算技術(shù)作為人工智能自制核心技術(shù)開展技術(shù)突破,并且逐步推動(dòng)產(chǎn)業(yè)化。從2017年新興技術(shù)曲線來看,基于認(rèn)知計(jì)算和智能機(jī)器人里最核心的還是認(rèn)知計(jì)算,就是以自然語言理解為基礎(chǔ)。

 ?。ㄈ┱J(rèn)知智能(中文語義識(shí)別)迎來巨大產(chǎn)業(yè)發(fā)展契機(jī)

  預(yù)計(jì)到2025年底,43%的文字處理工作將由人工智能系統(tǒng)自動(dòng)完成。中國在圖像識(shí)別、人工智能、單點(diǎn)技術(shù)方面已經(jīng)遙遙領(lǐng)先于全球,未來七年,認(rèn)知交互的全球市場,每年增長率將達(dá)到34.9%。據(jù)估算,2024年的全球市場規(guī)模保守估計(jì)將達(dá)到720億元美元。國內(nèi)資本對(duì)于自然語言處理的投入相當(dāng)巨大,至2017年底,已披露融資總額累計(jì)超54億元。隨著技術(shù)帶來的產(chǎn)業(yè)化的突破,市場非常巨大。

  (四)人工智能-認(rèn)知智能的應(yīng)用場景

  認(rèn)知智能可以分析網(wǎng)頁、文件、郵件、音頻、論壇、社交媒體中的大量數(shù)據(jù),應(yīng)用領(lǐng)域廣泛,既可以直接應(yīng)用于醫(yī)療、教育、金融、工業(yè)、影視、農(nóng)業(yè)等多行業(yè),也可以通過技術(shù)接口應(yīng)用于所有智能語音交互場景,如智能家居、車載語音、可穿戴設(shè)備、VR、機(jī)器人等。數(shù)字政府方面,國內(nèi)有些城市已開始試點(diǎn),未來人與政府打交道只需要與機(jī)器見面,機(jī)器就像城市大腦,幫你解決一切人能解決的問題,當(dāng)然這是一個(gè)遠(yuǎn)景。但現(xiàn)在已經(jīng)在逐步實(shí)現(xiàn),包括一些城市的標(biāo)準(zhǔn)化的東西,這個(gè)標(biāo)準(zhǔn)化不需要人來思考,機(jī)器去學(xué)習(xí)就行,人和機(jī)器的交互未來就是人和政府的大腦之間的交互,所以智能語義識(shí)別被看作未來人工智能技術(shù)中最值得期待的應(yīng)用場景。

  二、技術(shù)支點(diǎn)和創(chuàng)新點(diǎn)

 ?。ㄒ唬?0多項(xiàng)獨(dú)創(chuàng)發(fā)明專利:基于中文分詞矩陣技術(shù)的類腦智能系統(tǒng)和裝置

  2018年6月,中潤普達(dá)正式申報(bào)中文語義類腦輔助系統(tǒng)(魔系A(chǔ)I)。首次提出把人腦當(dāng)作一個(gè)復(fù)雜的信息處理系統(tǒng)來考慮,從整體和動(dòng)態(tài)的角度,架構(gòu)一個(gè)中文分詞(包括意群)認(rèn)知矩陣及模型,在此基礎(chǔ)上讓各場景的漢語分詞(包括意群)認(rèn)知矩陣及模型之間形成協(xié)同競爭關(guān)系和類腦信息加工模式,完成類腦系統(tǒng)計(jì)算,并解釋語言、分詞、意群以及句子等生成的神經(jīng)機(jī)制和原理。舉例:現(xiàn)在機(jī)場的機(jī)器人能夠背誦唐詩、唱歌,還包括現(xiàn)在廣泛應(yīng)用的智能音響、人工智能設(shè)備,這些都叫做弱的人工智能。我們需要具備學(xué)習(xí)力的機(jī)器人,能夠和人溝通,目前整個(gè)機(jī)器人市場在往這個(gè)方面轉(zhuǎn)型,一個(gè)聰明的算法、一個(gè)嶄新的系統(tǒng)、一個(gè)中文的大腦、一個(gè)顛覆性應(yīng)用正在逐步實(shí)現(xiàn)創(chuàng)新。

  (二)中文語義類腦輔助系統(tǒng)技術(shù)能力理論支點(diǎn)

  “不要去設(shè)計(jì)機(jī)器人,而是培養(yǎng)機(jī)器人。”讓機(jī)器像人類一樣思考,必須具備像人一樣的理解、推理、可視化、交互、學(xué)習(xí)等幾個(gè)基礎(chǔ)要素,每一個(gè)要素里面有龐大的基于類腦的相關(guān)功能,這個(gè)功能有的超出目前工程師的技術(shù),需要新的辦法來解決。

  (三)中文語義識(shí)別技術(shù)使命:讓機(jī)器像人類一樣思考

  中潤普達(dá)自主研發(fā)的中文大數(shù)據(jù)的核心技術(shù)--中文認(rèn)知矩陣和動(dòng)態(tài)平衡模型計(jì)算技術(shù),是領(lǐng)先的創(chuàng)新的中文大數(shù)據(jù)關(guān)鍵計(jì)算技術(shù)。利用獨(dú)立開發(fā)的“人工神經(jīng)元網(wǎng)絡(luò)”數(shù)學(xué)算法模型,將海量的非結(jié)構(gòu)化和結(jié)構(gòu)化的數(shù)據(jù)放到模擬器中去,讓魔系 AI主腦進(jìn)行學(xué)習(xí)。隨著時(shí)間的推移,產(chǎn)生突變,培養(yǎng)它讓其成為具有自主學(xué)習(xí)意識(shí)的機(jī)器大腦,可應(yīng)用到所有人工智能生態(tài)鏈條中。舉例:百度搜索會(huì)留痕,下次登錄會(huì)根據(jù)訪問行為推薦搜索內(nèi)容,坦率講這不是機(jī)器學(xué)習(xí),這是服務(wù)器日志的自主記憶、主動(dòng)推送。國內(nèi)在自主學(xué)習(xí)機(jī)器人方面還有很長的路要走,在這個(gè)產(chǎn)業(yè),缺乏大量的創(chuàng)新,需要太多的專家、投資和創(chuàng)新的失敗。我們團(tuán)隊(duì)是從另外一個(gè)角度在一點(diǎn)點(diǎn)的創(chuàng)新里面實(shí)現(xiàn)了3-6歲小孩的水平,機(jī)器人通過數(shù)據(jù)的不斷喂養(yǎng),能夠?qū)崿F(xiàn)與人的基本交流,比如你講一個(gè)笑話,它能根據(jù)上下文或語義理解也講一個(gè)笑話,還有在醫(yī)療方面也有一些類腦的案例。路途雖遙遠(yuǎn),但這也是產(chǎn)業(yè)化的必經(jīng)之路。

  (四)5個(gè)人工智能語義識(shí)別技術(shù)應(yīng)用產(chǎn)品(試商用)

  目前中潤普達(dá)推出了5個(gè)人工智能語義識(shí)別技術(shù)應(yīng)用產(chǎn)品:

  魔系A(chǔ)I - 海量文本處理智能平臺(tái):通過計(jì)算機(jī)自動(dòng)對(duì)(中文)文本信息進(jìn)行快速識(shí)別、檢索、分類和精確定位,并能在不同語境下進(jìn)行語義分析;是一個(gè)嶄新的更高級(jí)的計(jì)算機(jī)自動(dòng)識(shí)別與檢索中文文本處理系統(tǒng)。

  裂云AI - 精準(zhǔn)營銷智能平臺(tái):通過接入各大運(yùn)營商和各大數(shù)據(jù)源機(jī)構(gòu)的大數(shù)據(jù)平臺(tái),以自建分布式DMP平臺(tái)為基礎(chǔ),提供精準(zhǔn)人群標(biāo)簽和用戶畫像,應(yīng)用于征信、精準(zhǔn)營銷、金融、保險(xiǎn)、快銷、汽車等等行業(yè),為給各類大數(shù)據(jù)應(yīng)用服務(wù)提供創(chuàng)新產(chǎn)品。

  沖霄AI - 政務(wù)智能決策平臺(tái):國內(nèi)首個(gè)基于AI的新一代政務(wù)大數(shù)據(jù)可視分析平臺(tái),適用于工商、工會(huì)、稅務(wù)、環(huán)保、安監(jiān)、質(zhì)檢、旅游、城管、文明等各種場景,為政務(wù)或商業(yè)決策提供重要參考,提升組織的決策精準(zhǔn)性和前瞻性。

  神通AI - 商業(yè)智能決策平臺(tái):基于AI的商業(yè)大數(shù)據(jù)可視分析工具平臺(tái)。能夠最大限度地利用數(shù)據(jù)獲得最大的價(jià)值,實(shí)現(xiàn)商業(yè)的智能決策,提高數(shù)據(jù)管理和數(shù)據(jù)資產(chǎn)的變現(xiàn)能力。

  傲天AI - 寫作和傳播智能機(jī)器:國內(nèi)首家基于AI的文章全生命周期(從創(chuàng)作到傳播)自運(yùn)行機(jī)器人。它通過對(duì)海量文章的深度學(xué)習(xí),總結(jié)了萬余種不同題材、體裁和場景下的文章結(jié)構(gòu),從而讓機(jī)器具備自動(dòng)寫作能力。

  三、技術(shù)實(shí)踐和應(yīng)用路徑

  (一)魔系A(chǔ)I-中文語義類腦輔助系統(tǒng)

  魔系A(chǔ)I為各類機(jī)器人配備中文語義大腦,使其能夠聽懂和了解用戶的基本意思和聲音,更好地與人類交互,完成多種匹配的動(dòng)作及相關(guān)的指令。這個(gè)系統(tǒng)我們走的是不同的技術(shù)路徑,幫助我們少走一些彎路。

  (二)我們做的是讓機(jī)器與人溝通交流的人工智能中文語義類腦輔助系統(tǒng)

  我們專注于中文,中國人對(duì)中文的語義理解遠(yuǎn)比外國人強(qiáng),在這個(gè)領(lǐng)域,王選院士發(fā)明的“漢字激光照排系統(tǒng)”,全球占有99.7%的規(guī)模,到現(xiàn)在還沒有哪個(gè)互聯(lián)網(wǎng)技術(shù)或其他技術(shù)達(dá)到這樣的水平,激光照排技術(shù)的核心就是對(duì)中文的解讀。

  在具體的場景目標(biāo)任務(wù)條件下,通過添加分詞(意群),并植入這個(gè)類腦計(jì)算系統(tǒng),無需寫代碼,系統(tǒng)可以幫助網(wǎng)絡(luò)、機(jī)器和設(shè)備等實(shí)現(xiàn)讓機(jī)器和設(shè)備具備自我學(xué)習(xí)、發(fā)現(xiàn)、理解、推理等各類能力,并形成自我知識(shí)體系;它讓機(jī)器能像人一樣,實(shí)現(xiàn)智能對(duì)話、智能客服、智能聊天、句子生成、知識(shí)發(fā)現(xiàn)、知識(shí)生成、模式識(shí)別、智能分析等,并能夠按照要求輔助處理專屬應(yīng)用場景的知識(shí)和業(yè)務(wù)。

  (三)快速搭建中文語義類腦(魔系A(chǔ)I)

  魔系A(chǔ)I具體方法是:按照魔系A(chǔ)I的操作程序,只需添加分詞、意群和句子,導(dǎo)入模板,即可應(yīng)用到各類場景之中;為每一個(gè)機(jī)器、設(shè)備、終端都能夠裝上專屬場景的、有知識(shí)、會(huì)聊天、能決策、自學(xué)習(xí),并且有性格、有情感的中文語言交流、溝通的大腦系統(tǒng);結(jié)合大數(shù)據(jù),魔系A(chǔ)I搭建了有效的深度學(xué)習(xí)的算法,在數(shù)據(jù)足夠的情況下, 魔系A(chǔ)I的“神經(jīng)元網(wǎng)絡(luò)”系統(tǒng)將會(huì)以階梯式的速度進(jìn)行深度自我學(xué)習(xí)和調(diào)整。

  (四)未來魔系A(chǔ)I 和行業(yè)深度結(jié)合

  與云、端、芯形成產(chǎn)品生態(tài):芯片端提供一整套的軟硬件一體的落地方案,終端領(lǐng)域提供人工智能交互軟件通過云端數(shù)據(jù)整合、分析、運(yùn)算從而提供更精準(zhǔn)的服務(wù)。

  IOT時(shí)代無限的終端入口:開放的終端入口快速積累用戶信息,持續(xù)向云端進(jìn)行數(shù)據(jù)傳遞。

  應(yīng)用領(lǐng)域:強(qiáng)大的技術(shù)體系從語音識(shí)別、語義理解到語音合成集云端服務(wù)為一體,首個(gè)獨(dú)創(chuàng)的工程架構(gòu)體系實(shí)現(xiàn)行業(yè)最先的效果和穩(wěn)定性。

  (五)魔系A(chǔ)I試商用階段進(jìn)展

  目前已經(jīng)在深圳某法院開展人工智能法院建設(shè)試點(diǎn)工作,和部分重點(diǎn)醫(yī)院合作開展健康醫(yī)療大數(shù)據(jù)的AI產(chǎn)品研發(fā);部分城市開展“城市大腦”技術(shù)應(yīng)用實(shí)踐(湖北省十堰市、江西上饒市和湖北荊州市)。

  魔系A(chǔ)I智能“吾真”問診系統(tǒng) -- 湖北十堰三甲醫(yī)院太和醫(yī)院

  應(yīng)用于診療的全過程,實(shí)現(xiàn)診前智能分診、掛號(hào);診中智能導(dǎo)診、語音電子病歷;診后慢性病康復(fù)輔助等,建立醫(yī)療各分支領(lǐng)域智能知識(shí)庫,打造快速精準(zhǔn)的智能醫(yī)療體系。

  魔系A(chǔ)I法律助手 -- 深圳某法院

  通過分詞矩陣技術(shù),構(gòu)建法律知識(shí)邏輯系統(tǒng),精準(zhǔn)地找到與案件相關(guān)各種信息和文檔,降低人力搜索卷宗的時(shí)間成本;通過法律機(jī)器人,快速解答法律方面的問詢,節(jié)省咨詢的人力成本。

  魔系A(chǔ)I語音交互系統(tǒng) -- 東風(fēng)汽車公司

  結(jié)合已有的車載系統(tǒng),用語音搜索行程路線、操控車內(nèi)設(shè)備、查詢目的地天氣狀況,在意外發(fā)生時(shí)報(bào)修拖車、保險(xiǎn)理賠等,讓魔系A(chǔ)I幫車主解決行車中遇到的問題。

  (六)魔系A(chǔ)I平臺(tái)的應(yīng)用效果目標(biāo):讓人回歸人的價(jià)值

  為什么要發(fā)展人工智能,人工智能能夠提升生產(chǎn)力。當(dāng)人每周只需要工作2天的時(shí)候,這就是生產(chǎn)力的體現(xiàn)。智能問答可以解決85%以上常見問題,在問答匹配、理解語義上準(zhǔn)確率高達(dá)97%;通過魔系進(jìn)行文檔處理,較人工相比處理效果提升59倍,準(zhǔn)確率95%以上;在某些領(lǐng)域,可以替代60%以上的人工,極大降低了企業(yè)經(jīng)營成本和提升效率。這是讓人回歸人的價(jià)值最實(shí)在的體現(xiàn)。

  (七)應(yīng)用場景:為每一臺(tái)機(jī)器人賦予一個(gè)類腦輔助系統(tǒng)

  為每一個(gè)機(jī)器、設(shè)備和終端都裝上一個(gè)魔系A(chǔ)I專屬場景的中文交流、溝通的類腦輔助系統(tǒng)?;诨A(chǔ)的數(shù)據(jù)元,交易中心本來就是數(shù)據(jù)流通的中心,期望各類數(shù)據(jù)能培養(yǎng)機(jī)器人,包括語音識(shí)別、圖像識(shí)別、標(biāo)注、分析、挖掘等海量的結(jié)構(gòu)和非結(jié)構(gòu)化數(shù)據(jù)需要在一定場合適用不同的機(jī)器人。當(dāng)然這些不是光靠中文語言技術(shù)能實(shí)現(xiàn)的,還涉及到圖像識(shí)別、語音識(shí)別、機(jī)器學(xué)習(xí)等基礎(chǔ)技術(shù)。解決方案方面包括各行業(yè)的機(jī)器人方案,可以廣泛應(yīng)用到數(shù)字政府、醫(yī)療、智能辦公等領(lǐng)域。

  四、小結(jié)

  今天介紹的是我們團(tuán)隊(duì)做的一些研發(fā),并不能代表這個(gè)產(chǎn)業(yè)的最高水平,但是在這個(gè)方向上我們會(huì)持續(xù)不斷地投入,也希望得到各位的指導(dǎo)和關(guān)注,謝謝大家!

  附:國脈,是領(lǐng)先的大數(shù)據(jù)治理和數(shù)字政府專業(yè)提供商。創(chuàng)新提出“軟件+咨詢+平臺(tái)+數(shù)據(jù)+創(chuàng)新業(yè)務(wù)”五位一體服務(wù)模型,擁有數(shù)據(jù)基因和水巢DIPS兩大系列幾十項(xiàng)軟件產(chǎn)品,長期為中國智慧城市、智慧政府和智慧企業(yè)提供專業(yè)咨詢規(guī)劃和數(shù)據(jù)服務(wù),廣泛服務(wù)于信息中心、大數(shù)據(jù)局、行政服務(wù)中心等政府客戶、中央企業(yè)和金融機(jī)構(gòu)。自2004年成立以來,已在全國七大區(qū)域設(shè)立20余家分支機(jī)構(gòu)、5大技術(shù)研發(fā)基地,服務(wù)客戶2000余家,執(zhí)行項(xiàng)目5000余個(gè),連續(xù)多年開展中國政府網(wǎng)站、智慧城市、互聯(lián)網(wǎng)+政務(wù)、營商環(huán)境等公益評(píng)估評(píng)選活動(dòng)。被業(yè)界譽(yù)為中國信息化民間智庫知名品牌、電子政務(wù)優(yōu)選咨詢機(jī)構(gòu),國內(nèi)首倡智慧政府理念,首創(chuàng)智慧城市、數(shù)據(jù)治理、互聯(lián)網(wǎng)+政務(wù)評(píng)價(jià)體系,首推數(shù)據(jù)資產(chǎn)普查、全口徑數(shù)據(jù)資源目錄、數(shù)據(jù)元標(biāo)準(zhǔn)化、數(shù)源確認(rèn)與供需對(duì)接、最多跑一次事項(xiàng)梳理、營商通等產(chǎn)品,信息資源編目、公共數(shù)據(jù)普查等業(yè)務(wù)全國占有率和影響力名居榜首。

  注:獲取更多會(huì)議信息及嘉賓演講資料,歡迎登錄“2018智慧中國年會(huì)官網(wǎng)”。

年會(huì)官網(wǎng).png

  現(xiàn)場照片直播分享:

現(xiàn)場直播.png

責(zé)任編輯:hejieling