導(dǎo)讀
它山之石,可以攻玉。為了幫助各界人士學(xué)習(xí)國外先進經(jīng)驗,進一步了解大數(shù)據(jù)市場的定價、交易與保護,國脈戰(zhàn)略研究院專家楊冰之、林渠,帶來了《大數(shù)據(jù)市場調(diào)查:定價、交易與保護》的翻譯文章,相信會給大家以思想的碰撞、靈感的啟迪,促進大家思考,從而為我國推進數(shù)據(jù)要素市場化配置改革,貢獻國脈戰(zhàn)略研究院的智慧。本文為《大數(shù)據(jù)市場調(diào)查:定價、交易與保護》連載系列文章第六篇,也是最后一篇。
隨著傳統(tǒng)媒體日益數(shù)字化,內(nèi)容越來越多地存儲在數(shù)字卷中,而不是傳統(tǒng)內(nèi)容(電影、報紙、設(shè)計圖紙、客戶信息、辦公室文檔等)。換言之,商品正在從實用物品轉(zhuǎn)變?yōu)樘摂M物品。這樣,內(nèi)容很容易分發(fā)和復(fù)制。因此,數(shù)據(jù)保護成為確保數(shù)據(jù)所有權(quán)的關(guān)鍵條款。數(shù)據(jù)定價、數(shù)據(jù)交易和數(shù)據(jù)保護構(gòu)成了一個相互影響的三維閉環(huán)。為了實現(xiàn)數(shù)據(jù)所有者的最大利潤和數(shù)據(jù)的最大價值,數(shù)據(jù)保護是不可分割的一部分。下面,我們將討論大數(shù)據(jù)生命周期的最后一個重要階段,即數(shù)據(jù)保護。
A.數(shù)字版權(quán)管理
建立數(shù)字版權(quán)管理(DRM)是為了防止數(shù)字內(nèi)容被故意復(fù)制、共享和竊取,更重要的是作為數(shù)字版權(quán)保護發(fā)展的指導(dǎo)方針。2001年初,W3C成立了第一個DRM集團,作為參與全球數(shù)字版權(quán)管理的標準組織。實現(xiàn)DRM的解決方案多種多樣,包括XrML版權(quán)表達語言、Microsoft DRM、Apple HLS DRM、Adobe Flash access DRM、RealNetworks Helix DRM和OMA DRM規(guī)范。
所有這些DRM解決方案都需要五個關(guān)鍵組件:(i)安全性。它著重于內(nèi)容的加密以及為數(shù)字內(nèi)容創(chuàng)建哈希、水印和數(shù)字簽名;(ii)訪問控制。它負責(zé)身份和訪問管理,并為需要訪問受保護數(shù)字內(nèi)容的用戶提供憑據(jù)。此外,該組件監(jiān)視授權(quán)用戶的行為,并為不同用戶設(shè)置不同的訪問權(quán)限;(iii)使用控制。它監(jiān)視每個授權(quán)用戶的使用情況,并將使用情況記錄為歷史記錄;(iv)許可證管理。它向授權(quán)用戶發(fā)布許可證(密鑰、XrML文件、身份驗證代碼),并控制和檢查許可證的生命周期(有效期);(v) 付款管理。此組件與使用控制一起工作,并計算用戶需要支付的費用。這是數(shù)字商務(wù)的主要目標。
我們以Microsoft DRM為例來解釋DRM的工作原理。如圖7所示,匿名用戶嘗試訪問內(nèi)容服務(wù)器(content server)以播放或下載某些內(nèi)容,這些內(nèi)容受DRM服務(wù)器保護。他或她首先向個性化服務(wù)器發(fā)送請求。然后服務(wù)器檢查個性化客戶端設(shè)備上的應(yīng)用程序。如果有應(yīng)用程序正在運行,應(yīng)用程序?qū)⑾駾RM服務(wù)器發(fā)送許可證要求。個性化應(yīng)用程序是一個客戶端DRM軟件,稱為個性化黑盒(IBX)。如果沒有此軟件,DRM服務(wù)器將無法釋放解密內(nèi)容的許可證。為了滿足IBX的要求,DRM服務(wù)器釋放加密的許可證。當(dāng)用戶試圖解密許可證時,IBX保護敏感信息,這種過程稱為個性化。釋放許可證后,DRM服務(wù)器將檢查用戶狀態(tài)。如果這是第一次訪問服務(wù)器,DRM將要求用戶加入域。不同的域區(qū)分特定用戶的內(nèi)容和權(quán)限。這就是DRM實現(xiàn)訪問控制的方式。最后,允許用戶訪問內(nèi)容服務(wù)器(content server),內(nèi)容服務(wù)器會發(fā)回內(nèi)容。
?。▓D7. Microsoft數(shù)字版權(quán)管理工作流)
B. 數(shù)字版權(quán)管理模型
根據(jù)不同的數(shù)字內(nèi)容,我們將DRM模型分為以下三類:(i)基于軟件的DRM,(ii)基于多媒體的DRM,以及(iii)基于非結(jié)構(gòu)化數(shù)據(jù)的DRM。
1) 基于軟件的數(shù)字版權(quán)管理
最常見的DRM是基于軟件的DRM,因為軟件是計算機上使用最廣泛的應(yīng)用程序。軟件屬于數(shù)字商品,易于復(fù)制和重新制作,成本為零。因此,軟件開發(fā)公司通常設(shè)計保護版權(quán)和防止盜版入侵的機制。最佳的DRM機制可以記錄安裝時間和PC標識信息,并支持多個安裝和主機。
涉及的主要方法有兩種:在線身份驗證和離線身份驗證。對于在線身份驗證,當(dāng)用戶開始安裝過程時,軟件首先檢查Internet連接。如果存在Internet連接,軟件將向DRM服務(wù)器發(fā)送身份驗證請求,如上面討論的常見DRM策略中所述。否則,安裝將在沒有Internet連接時停止,或者只安裝SoftwareDemo。脫機身份驗證比聯(lián)機身份驗證更重要。如果不支持脫機DRM,本地許可證文件將很弱,并且很容易解密。許多研究工作集中于離線身份驗證。例如,Reavis Conner和Rumelt提出了一個成本函數(shù)來衡量解密的復(fù)雜性。如果解密成本大于此函數(shù)確定的價格,則軟件是安全的。Barapatre等人提出了一種結(jié)構(gòu),以增加解密許可證文件的復(fù)雜性。該模型使用靜態(tài)和動態(tài)代碼的代碼注入和軟件版權(quán)保護(SCP)技術(shù)對許可證文件進行加密,以保護原始軟件。在軟件層和許可證層(許可證文件、硬件令牌管理文件、庫文件等)之間引入了保護動態(tài)鏈接庫(DLL)層。因此,用戶不能直接訪問認證信息。
2) 基于多媒體的數(shù)字版權(quán)管理
多媒體是數(shù)字商品最重要的組成部分。超過80%的互聯(lián)網(wǎng)流量專用于視頻內(nèi)容。因此,帶來的巨大的挑戰(zhàn)是如何妥善保護多媒體內(nèi)容的版權(quán)。一般來說,加密和水印技術(shù)就是在這個方向上使用的。軟件和多媒體(視頻和音頻)的最大區(qū)別在于在線流媒體。在線視頻和音頻支持實時協(xié)議(RTP)/實時流協(xié)議(RTSP),以實現(xiàn)在線流,并且在某些情況下,需要支持組域身份驗證(家庭成員、企業(yè)用戶等)。通常,對手會在主機上運行惡意客戶端來中斷和監(jiān)視流,以分析加密密鑰。為了解決這個問題,大衛(wèi)(David)和扎登伯格(Zaidenberg)提出了一種使用選擇性視頻解密的方案,以確保內(nèi)容的安全性,同時減少加密時間。此外,選擇性解密是高效視頻加密的一種變體,并且所提出的算法僅對變換參數(shù)的符號位進行操作。它不需要額外的空間,并且由該算法加密的流產(chǎn)生H.264比特流。同時,該方案通過限制訪問狀態(tài)將加密過程推進到一個安全的環(huán)境中。例如,用戶要么處于加密狀態(tài),要么處于解密狀態(tài),但不能同時處于兩種狀態(tài),這是禁止的。
此外,水印技術(shù)已廣泛應(yīng)用于視頻和音頻DRM中。將水印嵌入視頻內(nèi)容需要對視頻內(nèi)容進行完全解碼。這是一個關(guān)鍵問題,因為這一過程需要大量計算資源,并降低了視頻質(zhì)量。為了避免隨著視頻比特率的增加而增加嵌入水印的復(fù)雜性,提出了一種基于H.264編解碼器標準的盲水印算法。請注意,H.264是基于運動補償?shù)母哔|(zhì)量編解碼器標準。H.264標準使用幾個宏塊以及每個宏塊的亮度和色度(Cb和Cr)來表示幀,。水印算法掃描宏塊并選擇最優(yōu)預(yù)測模型。因此,根據(jù)H.264的特點,盲水印算法將水印權(quán)利嵌入到所選宏塊中,防止共謀攻擊,并在解碼過程中保持視頻質(zhì)量。
有研究提出了另一種水印算法,該算法適用于基于深度圖像渲染(DIBR)的三維視頻內(nèi)容。傳統(tǒng)的水印系統(tǒng)要么會破壞三維視頻,造成不可逆的變形,要么容易受到攻擊,而本文提出的綜合Duns水印算法克服了這些問題。所設(shè)計的算法基于偽三維離散余弦變換(3D-DCT)和量化索引調(diào)制(QIM)將水印嵌入深度圖中,提高了水印的魯棒性,避免了對視頻內(nèi)容的破壞。值得注意的是,圖像也被視為多媒體內(nèi)容,類似于視頻和音頻內(nèi)容,水印技術(shù)是保護版權(quán)的最常用方法。對于基于圖像的水印系統(tǒng),通常使用離散小波變換(DWT)、最小有效位(LSB)和離散余弦變換(DCT)算法將水印嵌入到安全密鑰中。此外,可以在一幅圖像中嵌入多個水印。此外,水印方案已被用于追蹤匿名互聯(lián)網(wǎng)惡意流量,以識別惡意來源,用于取證。
3) 基于非結(jié)構(gòu)化數(shù)據(jù)的數(shù)字版權(quán)管理
非結(jié)構(gòu)化數(shù)據(jù),如Microsoft Word文檔、PDF文檔、各種數(shù)據(jù)庫、源代碼等,都是可以方便地傳播和存儲的數(shù)字化數(shù)據(jù)。盡管如此,它是脆弱的,并且很難防止故意復(fù)制和篡改非結(jié)構(gòu)化數(shù)據(jù)。此外,非結(jié)構(gòu)化數(shù)據(jù)通常具有很高的商業(yè)價值,并且包含敏感信息,這些信息的泄漏將導(dǎo)致數(shù)據(jù)所有者的嚴重損失。因此,非結(jié)構(gòu)化數(shù)據(jù)保護是當(dāng)今的一個熱門話題,也稱為數(shù)據(jù)泄漏保護(DLP)。非結(jié)構(gòu)化數(shù)據(jù)DRM與其他類型的DRM完全不同,因為數(shù)據(jù)易于操作和損壞。因此,加密作為一種最安全的方法,通常用于保護非結(jié)構(gòu)化數(shù)據(jù)。盡管如此,隨著數(shù)據(jù)規(guī)模的不斷擴大,加密過程的成本將繼續(xù)增加。例如,史(Shi)等人提出了一種基于概率數(shù)據(jù)結(jié)構(gòu)(Bloom Filter)的保護方案。該方案將狀態(tài)記錄到帶有正標記或?qū)傥粯擞浀木仃嘊loom過濾器中。該方案包括一個分析器,用于分析和掃描內(nèi)容。與加密方案相比,該方案具有更好的性能。
總之,在本章節(jié),我們闡述了三種數(shù)字版權(quán)管理模式,并討論了每種模式的現(xiàn)有相關(guān)方法。不同類型的數(shù)字內(nèi)容管理,即基于軟件的數(shù)字版權(quán)管理、基于多媒體的數(shù)字版權(quán)管理和基于非結(jié)構(gòu)化數(shù)據(jù)的數(shù)字版權(quán)管理,已經(jīng)有了很好的探索??梢钥吹剑瑪?shù)字管理技術(shù)是保護大數(shù)據(jù)不被竊取和復(fù)制的關(guān)鍵方法。盡管如此,隨著數(shù)字內(nèi)容的快速增長和大數(shù)據(jù)的交易屬性,現(xiàn)有數(shù)據(jù)保護方案和更先進技術(shù)的可行性有待進一步研究。
七、 結(jié)論
本文討論了大數(shù)據(jù)交易的問題。具體而言,我們首先講述了與大數(shù)據(jù)相關(guān)的現(xiàn)有研究,并確定了數(shù)據(jù)交易的大數(shù)據(jù)生命周期,包括數(shù)據(jù)收集、數(shù)據(jù)分析、數(shù)據(jù)定價、數(shù)據(jù)交易和數(shù)據(jù)保護。然后,講述了與大數(shù)據(jù)定價相關(guān)的現(xiàn)有工作。關(guān)于數(shù)據(jù)定價,闡明了它的重要性,對不同的市場結(jié)構(gòu)、數(shù)據(jù)定價策略和數(shù)據(jù)定價模型進行了分類,然后列出了每種類型的優(yōu)勢和局限性。對于數(shù)據(jù)交易流程,我們概述了與數(shù)據(jù)交易相關(guān)的關(guān)鍵問題及其可能的解決方案。我們進一步研究了拍賣策略,詳細說明了不同的方案、交易平臺和相關(guān)問題。最后,研究了作為大數(shù)據(jù)生命周期最后階段的數(shù)據(jù)保護。對現(xiàn)有版權(quán)保護方案進行了分類,并概述了大數(shù)據(jù)版權(quán)保護面臨的挑戰(zhàn)。本次調(diào)查的主要目的是對大數(shù)據(jù)交易有一個清晰而深入的了解。我們概述了與數(shù)據(jù)定價、數(shù)據(jù)交易和數(shù)據(jù)保護相關(guān)的廣泛主題,并強調(diào)了尚未解決的領(lǐng)域,以進一步促進大數(shù)據(jù)的研究和開發(fā)。
更多精彩,請關(guān)注“官方微信”
國脈,是大數(shù)據(jù)治理、數(shù)字政府、營商環(huán)境、數(shù)字經(jīng)濟、政務(wù)服務(wù)專業(yè)提供商。創(chuàng)新提出"軟件+咨詢+數(shù)據(jù)+平臺+創(chuàng)新業(yè)務(wù)"五位一體服務(wù)模型,擁有超能城市APP、營商環(huán)境流程再造系統(tǒng)、營商環(huán)境督查與考核評估系統(tǒng)、政策智能服務(wù)系統(tǒng)、數(shù)據(jù)基因、數(shù)據(jù)母體等幾十項軟件產(chǎn)品,長期為中國智慧城市、智慧政府和智慧企業(yè)提供專業(yè)咨詢規(guī)劃和數(shù)據(jù)服務(wù),廣泛服務(wù)于發(fā)改委、營商環(huán)境局、考核辦、大數(shù)據(jù)局、行政審批局等政府客戶、中央企業(yè)和高等院校。