2015年12月18日,國際科學(xué)理事會(ICSU)、國際科學(xué)院聯(lián)合會(IAP)、世界科學(xué)院(TWAS)和國際社會科學(xué)理事會(ISSC)聯(lián)合發(fā)布了《大數(shù)據(jù)環(huán)境下開放數(shù)據(jù)的協(xié)議》,指出數(shù)據(jù)革命為全球科技帶來了機遇和挑戰(zhàn),并提出了開放數(shù)據(jù)需遵循的基本原則。

 
  一、數(shù)據(jù)革命帶來的機遇
 
  豐富的數(shù)據(jù)為科學(xué)研究帶來的機遇包括:新模式的發(fā)現(xiàn);關(guān)聯(lián)系統(tǒng)的不同方面從而更好地理解它們的行為;描述復(fù)雜性的特征;深刻理解復(fù)雜系統(tǒng)的不同狀態(tài),模擬并預(yù)測其動態(tài)行為。許多研究領(lǐng)域都需要這方面的能力,如天氣和氣候預(yù)測、大腦工作機理探索、全球經(jīng)濟行為研究、農(nóng)業(yè)生產(chǎn)力評估、人口預(yù)測、歷史問題研究以及環(huán)境變化、傳染病、大規(guī)模遷移等全球性問題的研究。
 
  二、數(shù)據(jù)革命帶來的挑戰(zhàn)
 
  1、開放數(shù)據(jù)勢在必行。在數(shù)字化革命背景下,數(shù)據(jù)和思想快速傳播促進了科學(xué)創(chuàng)造力的提升。公共資助的研究項目數(shù)據(jù)應(yīng)能夠公開獲取和再利用,以推動科學(xué)領(lǐng)域的數(shù)據(jù)革命和科學(xué)技術(shù)的快速發(fā)展。
 
  2、數(shù)據(jù)開放支持可重復(fù)驗證。近期,許多學(xué)科領(lǐng)域?qū)W術(shù)論文研究結(jié)論有很大比例不可驗證的問題說明開放數(shù)據(jù)的重要性??茖W(xué)論文出版的同時,相關(guān)的數(shù)據(jù)、元數(shù)據(jù)以及計算機代碼的公開有助于其他人員對研究結(jié)論進行及時審查和驗證。同時,數(shù)據(jù)應(yīng)智能開放,即可發(fā)現(xiàn)、可獲取、可理解、可評價和可再利用。
 
  3、大規(guī)模支持數(shù)據(jù)發(fā)現(xiàn)。傳統(tǒng)的統(tǒng)計方法無法從大規(guī)模、大范圍和關(guān)聯(lián)的數(shù)據(jù)中挖掘出復(fù)雜的關(guān)系,因而需要更深入的數(shù)學(xué)方法(如拓撲方法等)從大數(shù)據(jù)得到有效的推論。數(shù)據(jù)密集的機器分析和機器學(xué)習(xí)對科學(xué)發(fā)現(xiàn)具有重要的意義,但人類通常難以理解機器識別的復(fù)雜模式,因此人機交互是需要重點關(guān)注的問題。
 
  4、需要加強道德約束。開放數(shù)據(jù)有可能侵犯數(shù)據(jù)提供者的個人隱私,在計算機環(huán)境下也存在個人數(shù)據(jù)的安全性問題,所以需要制定相應(yīng)的管理措施。開放數(shù)據(jù)可能會侵犯生成數(shù)據(jù)的研究人員的個人利益,有必要使用新的方法來評價和獎勵研究人員在這方面的貢獻。
 
  5、促進全球參與。最不發(fā)達的國家在收集、存儲和共享數(shù)據(jù)方面的能力較弱,無法全面參與到氣候變化、衛(wèi)生保健、資源保護等全球性的研究活動中,也不能從這些研究活動中受益,新興國家和發(fā)達國家應(yīng)幫助不發(fā)達國家發(fā)揮其科學(xué)研究的潛能。
 
  6、需要各層面的聯(lián)合行動。數(shù)據(jù)開放的實現(xiàn)需要個人、學(xué)科、國家和國際層面的系統(tǒng)化行動。研究資助機構(gòu)和研究執(zhí)行機構(gòu)應(yīng)提供資金支持研究人員更智能地開放數(shù)據(jù)。學(xué)科領(lǐng)域應(yīng)通過推動數(shù)據(jù)開放促進本學(xué)科的發(fā)展。一些國際組織應(yīng)促進開放數(shù)據(jù)系統(tǒng)和過程的發(fā)展,保證國際數(shù)據(jù)的獲取、互操作性和可持續(xù)性。
 
  三、開放數(shù)據(jù)的原則
 
  1、科學(xué)家有責(zé)任在論文發(fā)表后公開相關(guān)數(shù)據(jù)。便于其他人驗證數(shù)據(jù)的有效性和研究結(jié)論的正確性,也便于其他人重新利用這些數(shù)據(jù)。
 
  2、研究機構(gòu)和高校有責(zé)任為開放數(shù)據(jù)提供良好的支撐環(huán)境。如提供數(shù)據(jù)管理、保存和分析方面的培訓(xùn)以及圖書館和數(shù)據(jù)管理服務(wù)等;為參與數(shù)據(jù)開放的科研人員的職業(yè)發(fā)展制定激勵措施以及國家性或國際性標(biāo)準(zhǔn);發(fā)達國家的大學(xué)和其他科研機構(gòu)應(yīng)與發(fā)展中國家的相應(yīng)機構(gòu)在開放數(shù)據(jù)方面進行合作,共同提高數(shù)據(jù)密集型科研能力。
 
  3、出版商有責(zé)任向評審專家開放論文的相關(guān)數(shù)據(jù)。敦促研究人員對引用的數(shù)據(jù)進行準(zhǔn)確標(biāo)注;開放元數(shù)據(jù)以支持文本和數(shù)據(jù)挖掘,便于后續(xù)的分析。
 
  4、資助機構(gòu)需在資助項目中考慮開放數(shù)據(jù)的成本。為基礎(chǔ)設(shè)施和數(shù)據(jù)倉庫的長期可持續(xù)性提供資源和相關(guān)政策;在評價研究的影響時(尤其是引文指標(biāo))應(yīng)考慮數(shù)據(jù)創(chuàng)建者的貢獻。
 
  5、各國的專業(yè)協(xié)會、學(xué)術(shù)團體和科學(xué)院應(yīng)為開放數(shù)據(jù)工作制定指導(dǎo)方針和政策。
 
  6、圖書館、檔案館和資料庫有責(zé)任提供數(shù)據(jù)服務(wù)和技術(shù)標(biāo)準(zhǔn)。保證數(shù)據(jù)獲取的便捷性和長期性。
 
  7、在應(yīng)用實踐方面。應(yīng)考慮個人隱私、國家安全和商業(yè)利益等問題,數(shù)據(jù)開放是有邊界、有限制的;研究數(shù)據(jù)和元數(shù)據(jù)應(yīng)具備最大程度的可互操作性;開放數(shù)據(jù)應(yīng)盡可能地根據(jù)其內(nèi)容和背景與其他數(shù)據(jù)進行關(guān)聯(lián),從而使其價值最大化。
責(zé)任編輯:admin