近日,知名快遞公司順豐和電商巨頭阿里巴巴爭端甚囂塵上,這次爭端意味著“數(shù)據(jù)”已然成為商業(yè)必爭的“資產(chǎn)”。因此,伴隨大數(shù)據(jù)時代來臨,數(shù)據(jù)獲取、存儲、分析等一系列技術(shù)的研發(fā)和應(yīng)用已經(jīng)得到了眾多企業(yè)的關(guān)注。
作為大數(shù)據(jù)開發(fā)利用的重要組成部分,就數(shù)據(jù)存儲而言,圖數(shù)據(jù)庫是利用圖的特性來對數(shù)據(jù)進(jìn)行存儲管理,并對傳統(tǒng)圖的概念進(jìn)行了擴展。越來越成熟的數(shù)據(jù)模型,使得利用事物(即“節(jié)點”或“實體”)及事物之間的聯(lián)系(即“邊”或“關(guān)系”)來對各類業(yè)務(wù)場景進(jìn)行抽象變得更加容易。也正因為圖數(shù)據(jù)庫基于圖論的理論和算法實現(xiàn),相對于關(guān)系型數(shù)據(jù)庫,它也更擅于處理網(wǎng)狀的復(fù)雜關(guān)系。此外,圖數(shù)據(jù)庫通常都支持對圖數(shù)據(jù)模型的增、刪、改、查(CRUD)方法,并較多地用于事務(wù)(OLTP)系統(tǒng)中,被應(yīng)用系統(tǒng)實時訪問。
圖數(shù)據(jù)庫作為恒昌知識圖譜的底層存儲方案,是多方數(shù)據(jù)的知識融合及提煉后進(jìn)行匯聚的場所,為恒昌豐富的服務(wù)線與數(shù)據(jù)技術(shù)間的承轉(zhuǎn)起著重要作用。由于Neo4j 是目前最成熟的圖數(shù)據(jù)庫之一,恒昌廣泛使用 Neo4j 作為知識圖譜底層圖數(shù)據(jù)持久方案,基于其優(yōu)異的事務(wù)能力而提供實時的數(shù)據(jù)查詢功能。此外,恒昌還在 Titan、Gaffer 等分布式圖數(shù)據(jù)庫或計算引擎上有著深入的研究。
目前,恒昌的圖數(shù)據(jù)庫已經(jīng)融合了多方數(shù)據(jù),包括業(yè)務(wù)系統(tǒng)主要服務(wù)線各階段的數(shù)據(jù)、用戶授權(quán)數(shù)據(jù)等。這些數(shù)據(jù)形成的實體規(guī)模已過億、形成的關(guān)系已多達(dá)數(shù)十億。隨著用戶數(shù)量的提升,這個數(shù)據(jù)還在持續(xù)增長。因此,基于圖數(shù)據(jù)庫開發(fā)的知識圖譜正在發(fā)揮著越來越大的作用,目前已經(jīng)上線或待上線的技術(shù)平臺覆蓋了客戶失聯(lián)修復(fù)、反欺詐規(guī)則引擎、欺詐團伙調(diào)查等,近期還會覆蓋風(fēng)險預(yù)警等方向。