“大數(shù)據(jù)”是近兩年來各界最熱議的話題之一,和“大數(shù)據(jù)”相關的實踐幾乎成為所有行業(yè)在技術和商業(yè)兩個方面最具創(chuàng)新意義的行動。在越來越多企業(yè)重視“大數(shù)據(jù)”價值的同時,新型數(shù)據(jù)的挑戰(zhàn)也隨之而來。

  據(jù)IBM商業(yè)價值研究院和牛津大學賽德商學院共同發(fā)布的《分析:大數(shù)據(jù)在現(xiàn)實世界中的應用》顯示,全球僅四分之一的受訪者表示自己具備了分析高度非結構化數(shù)據(jù)的能力,而對大部分組織而言,掌握先進的非結構化數(shù)據(jù)分析能力仍是從“大數(shù)據(jù)”中獲得價值的重大挑戰(zhàn)。究竟 “非結構化數(shù)據(jù)” 與 “大數(shù)據(jù)”有何關聯(lián)?哪些創(chuàng)新技術能夠應對新型數(shù)據(jù)的挑戰(zhàn)?

  非結構化數(shù)據(jù):新價值和新挑戰(zhàn)

  IDC研究表明,數(shù)字領域當前存在著 1.8 萬億 GB 的數(shù)據(jù)。在這之中,除了傳統(tǒng)數(shù)據(jù)庫的結構化數(shù)據(jù),還有像文件、文獻、表單、影像等無以計量的非結構化數(shù)據(jù)。

  什么是“非結構化數(shù)據(jù)”?相較于記錄了生產、業(yè)務、交易和客戶信息等的結構化數(shù)據(jù),非結構化的信息涵蓋了更為廣泛的內容,包括了如合約、發(fā)票、書信與采購記錄等營運內容;如文書處理、電子表格、簡報檔案與電子郵件等部門內容;如HTML與XML等格式信息的Web內容;以及如聲音、影片、圖形等媒體內容。

  目前,非結構化數(shù)據(jù)的內容占據(jù)了當前數(shù)據(jù)海洋的80%,并將在2020年之前以44倍的速度迅猛增長。同時,因為非結構化數(shù)據(jù)的信息量和信息的重要程度很難被界定,分析成為了難點。如果說結構化數(shù)據(jù)用詳實的方式記錄了企業(yè)的生產交易活動,那么非結構化數(shù)據(jù)則是掌握企業(yè)命脈的關鍵內容,所反映的信息蘊含著諸多企業(yè)效益提高的機會。因此,只有解決非結構化數(shù)據(jù)的分析困難,才能有效挖掘這些數(shù)據(jù)背后的價值,克服逐漸攀升的數(shù)據(jù)量和復雜性對企業(yè)生產發(fā)展的重大阻礙,驅動企業(yè)價值提升。

  企業(yè)內容管理:突圍非結構化數(shù)據(jù)

  針對非結構化數(shù)據(jù)所呈現(xiàn)的新趨勢,IBM近年來不斷加深在企業(yè)內容管理(ECM)領域的實踐,充分發(fā)揮信息全文檢索、自然語言處理、和行業(yè)深入理解三大突出能力,為越來越多的企業(yè)找到了非結構化數(shù)據(jù)管理和分析之道。

  - BJC Healthcare推進醫(yī)療研究:和大部分醫(yī)療服務提供商一樣,BJC Healthcare面臨大數(shù)據(jù)時代的挑戰(zhàn)?,F(xiàn)有的醫(yī)療信息資源與實際操作嚴重脫節(jié),分散在非結構化的臨床記錄和診斷報告中的歷史數(shù)據(jù)幾乎閑置,只有少部分研究人員偶爾查閱,其隱藏的研究信息因此無法得以充分利用。通過使用IBM 企業(yè)內容管理解決方案,BJC和大學研究人員得以分析非結構化的歷史存檔來回答以前無法解決的關鍵問題。比如,患者吸煙嗎?如果吸煙,那么他吸煙的頻率和煙齡是多少?如果已經戒煙,那么戒煙多長時間了?患者自己用過哪些藥物?患者自己對病情是如何判斷的?醫(yī)院曾經對患者執(zhí)行了哪些治療過程?——通過這些問題的梳理,BJC現(xiàn)在能夠更深入地了解醫(yī)療信息,揭示病歷內容中存在的趨勢和模式,向患者提供更有效的醫(yī)療服務。

  - 赫茲提升客戶滿意度:赫茲國際汽車租賃公司是全球最大并廣受歡迎的租車品牌,準確識別客戶關于產品、服務和員工的滿意度是赫茲的關鍵業(yè)務。通過使用IBM 企業(yè)內容管理解決方案,赫茲能夠通過分析客戶的調查記錄更好地識別汽車和設備租賃業(yè)績水平,確定客戶的滿意水平并進行必要的調整,從而進一步改善流程。此外,內容分析結果頁能夠支持赫茲推出針對性的營銷活動,不斷調整其產品和服務來提升客戶的滿意度。

  - 北卡羅來納州立大學識別商業(yè)機會:北卡羅來納州立大學認識到,大學的本質不僅僅是教育培訓,而是以多種形式推進和傳播知識。通過使用IBM企業(yè)內容管理解決方案,北卡羅來納州立大學能夠有效挖掘和分析龐大的數(shù)據(jù),分析來自非結構化信息源的數(shù)千項內容,執(zhí)行數(shù)據(jù)和文本分析,從而更好的識別哪些科研成果能夠投入實際生產。通過分析所獲取的洞察,它的技術轉讓辦公室(Office of Technology Transfer)能夠以更經濟有效的方式將本大學研制的技術授權給企業(yè)。

  以上僅是IBM企業(yè)內容管理(ECM)應對非結構化數(shù)據(jù)分析的幾個案例,如今,ECM所帶來的深刻洞察已經逐步成為金融、電信、保險、醫(yī)療、制造等行業(yè)的核心能力。此外,在多個增長市場ECM也扮演著重要角色。在智慧城市(Smarter City)中,非結構化數(shù)據(jù)分析成為政府、公安、消防、民政等多個部門的協(xié)同運營奠定基礎;在智慧商務(Smarter Commerce)中,非結構化數(shù)據(jù)分析為產品信息管理、銷售合同管理、服務管理、市場推廣行動管理提供支持;在社交商務(Social Business)中,非結構化數(shù)據(jù)分析成為網絡協(xié)同,信息挖掘的前提。

責任編輯:admin