0、引言
自2015年《國務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要的通知》提出, 要在“2018年底前建成國家政府?dāng)?shù)據(jù)統(tǒng)一開放平臺(tái)”以來, 如何建設(shè)和管理數(shù)據(jù)開放平臺(tái)成為一個(gè)各方關(guān)注的問題。截至目前, 一些省市級的數(shù)據(jù)開放平臺(tái)已先后建成并提供了許多寶貴的前期探索經(jīng)驗(yàn), 參見表1。但如表1統(tǒng)計(jì), 我國現(xiàn)有的地方政府?dāng)?shù)據(jù)開放平臺(tái)多采用專用模式, 即:針對特定機(jī)構(gòu)需求、采用少數(shù)企業(yè)專用技術(shù)體系開發(fā)。這一模式曾在世界范圍內(nèi)被普遍采用, 具有可靠性易于驗(yàn)證、易于實(shí)施和管理、項(xiàng)目風(fēng)險(xiǎn)低等優(yōu)點(diǎn), 但也存在開放性不足、不利于廣泛參與和創(chuàng)新的問題。因此, 在近年來的國際開放數(shù)據(jù)平臺(tái)建設(shè)潮流中, 專用模式已逐漸被開源模式取代。
表1 國內(nèi)省市級數(shù)據(jù)開放平臺(tái)建設(shè)情況一覽
國內(nèi)一些學(xué)者, 如:鮑靜等等提出, 采用“共享與開放的技術(shù)支撐與規(guī)范”是國際上的一種常見做法, 值得學(xué)習(xí)借鑒。2017年, 《國務(wù)院辦公廳關(guān)于印發(fā)政務(wù)信息系統(tǒng)整合共享實(shí)施方案的通知》也明確指出, 要“有效推進(jìn)政務(wù)信息系統(tǒng)整合共享, 切實(shí)避免各自為政、自成體系、重復(fù)投資、重復(fù)建設(shè)”。
什么是開放數(shù)據(jù)平臺(tái)建設(shè)的開源模式?開源模式是如何提出并逐漸成為主流的?發(fā)達(dá)國家如何借助開源模式發(fā)展開放數(shù)據(jù)平臺(tái)?如何從理論上解釋開源現(xiàn)象?本文嘗試基于世界各國數(shù)據(jù)開放平臺(tái)建設(shè)現(xiàn)狀進(jìn)行綜合案例研究以回答上述基本問題。希望本文對國外相關(guān)經(jīng)驗(yàn)的總結(jié)能起到拋磚引玉的作用, 為我國數(shù)據(jù)開放平臺(tái)建設(shè)提供一些可供借鑒的資料。
1、世界各國國家級數(shù)據(jù)統(tǒng)一開放平臺(tái)的建設(shè)現(xiàn)狀——基于60國數(shù)據(jù)
作為參考, 本文首先統(tǒng)計(jì)了全球60個(gè)國家的國家級數(shù)據(jù)開放平臺(tái)建設(shè)情況。選擇依據(jù)是Open Data Barometer開放數(shù)據(jù)指數(shù)。該指數(shù)由非營利性組織“互聯(lián)網(wǎng)基金會(huì)”統(tǒng)計(jì)。因60名以外多為欠發(fā)達(dá)地區(qū), 未有專項(xiàng)建設(shè)計(jì)劃, 故未納入比較。
1.1 建設(shè)國家數(shù)據(jù)統(tǒng)一開放平臺(tái)是致力于數(shù)據(jù)開放的國家的共同選擇
在60個(gè)國家中, 已建成數(shù)據(jù)統(tǒng)一開放平臺(tái)的國家為47例 (占78%) , 尚未建成的為13例, 其中我國計(jì)劃于2018年底前建成??梢娊ㄔO(shè)國家數(shù)據(jù)統(tǒng)一開放平臺(tái)是世界各國致力于開放數(shù)據(jù)的共同選擇、符合世界發(fā)展潮流。
1.2 多數(shù)國家選擇開源模式建設(shè)國家數(shù)據(jù)統(tǒng)一開放平臺(tái)
據(jù)統(tǒng)計(jì), 本文調(diào)查的60個(gè)國家中, 已建成數(shù)據(jù)開放平臺(tái)的有47國, 其中絕大多數(shù)采用開源模式, 共34例 (占72%) 。選擇部分開源的為2例, 選擇非開源的為11例。其中圍繞CKAN開源系統(tǒng)建設(shè)的最多, 為28例 (占60%) , 其他分別為:DKAN (4例) 、u Data (1例) 、OGPL (1例) (見圖1) 。其中, Socrata的部分技術(shù)工具和源代碼僅對政府用戶開放, 并非面向所有社會(huì)公眾開放, 因此本文將基于Socrata的開放數(shù)據(jù)平臺(tái)定義為部分開源。
開源模式 (Open-source Model) 是指不依賴少數(shù)機(jī)構(gòu)的封閉技術(shù)體系, 而是圍繞某一開源系統(tǒng)為基礎(chǔ)建設(shè)開放社區(qū)生態(tài), 強(qiáng)調(diào)所有系統(tǒng)工具面向全社會(huì)免費(fèi)開放共享、社會(huì)各界協(xié)同創(chuàng)新的分布式建設(shè)和治理模式。其中, 開源系統(tǒng)是指遵守開放源代碼協(xié)議的可自由分發(fā)、修改和重用的軟件系統(tǒng)。運(yùn)用開源模式建設(shè)開放數(shù)據(jù)平臺(tái), 意味著不僅開放數(shù)據(jù), 同時(shí)也開放所有用于數(shù)據(jù)平臺(tái)建設(shè)的系統(tǒng)工具, 使任何社會(huì)機(jī)構(gòu)和群體可以極低成本構(gòu)建自己的開放數(shù)據(jù)平臺(tái)。以英國為例介紹開源模式在國家數(shù)據(jù)開放平臺(tái)建設(shè)中的應(yīng)用發(fā)端和歷程。
圖1 47國國家數(shù)據(jù)開放平臺(tái)所用系統(tǒng)及案例數(shù)
1.3 英國政府如何建設(shè)國家開放數(shù)據(jù)平臺(tái):開源模式的提出和實(shí)踐
英國開放政府?dāng)?shù)據(jù)平臺(tái)是世界上最早提供政府?dāng)?shù)據(jù)開放的國家級平臺(tái)之一, 于2009年底內(nèi)部測試, 2010年初面向社會(huì)開放, 首批開放2 879個(gè)數(shù)據(jù)集。英國建設(shè)過程具有一定代表性, 開放數(shù)據(jù)之前已建成政府安全內(nèi)部網(wǎng) (相當(dāng)于我國的“電子政務(wù)內(nèi)網(wǎng)”) 及各部門電子政務(wù)系統(tǒng)。需要解決的關(guān)鍵問題是“數(shù)據(jù)孤島”問題, 使“內(nèi)網(wǎng)”各部門系統(tǒng)的數(shù)據(jù)互聯(lián)互通并以統(tǒng)一的交互方式向“外網(wǎng)”提供。當(dāng)時(shí)提出了兩種模式:
第一種是基于內(nèi)部閉環(huán)的專用模式, 即:各分支機(jī)構(gòu)僅以滿足自身業(yè)務(wù)需要為要求, 所有數(shù)據(jù)經(jīng)內(nèi)部閉環(huán)定期匯集到新增的開放數(shù)據(jù)中心平臺(tái)、統(tǒng)一處理后向公眾開放。此模式集中治理數(shù)據(jù), 無須制定公開標(biāo)準(zhǔn), 可以委托少數(shù)企業(yè)封閉開發(fā), 技術(shù)保密性較好, 可控性較強(qiáng)。但相應(yīng)的問題是:從技術(shù)治理角度而言, 中心平臺(tái)負(fù)擔(dān)過重, 易導(dǎo)致中心失效;從社會(huì)治理角度而言, 減少了各部門和社會(huì)機(jī)構(gòu)的協(xié)作機(jī)會(huì), 不利于全社會(huì)普遍參與, 與開放精神不相吻合, 易導(dǎo)致更新不及時(shí)、利用率低等問題。
第二種是發(fā)動(dòng)社會(huì)資源開放協(xié)作、分布式治理的開源模式, 即:中心平臺(tái)不負(fù)責(zé)直接管理所有數(shù)據(jù), 而是凝聚共識(shí)、制定標(biāo)準(zhǔn)、免費(fèi)提供通用工具幫助分支機(jī)構(gòu)自建符合標(biāo)準(zhǔn)的對外開放數(shù)據(jù)平臺(tái), 形成元數(shù)據(jù)可跨系統(tǒng)同步、原始數(shù)據(jù)可互操作的分布式開放數(shù)據(jù)平臺(tái)群落。全國中心平臺(tái)僅負(fù)責(zé)通過一個(gè)中心編目系統(tǒng)管理分布式數(shù)據(jù)平臺(tái)的元數(shù)據(jù), 各分布平臺(tái)的原始數(shù)據(jù)各自管理、自行更新。在收到用戶請求時(shí)中心平臺(tái)根據(jù)元數(shù)據(jù)描述從分布系統(tǒng)實(shí)時(shí)調(diào)用對應(yīng)的數(shù)據(jù)集, 從而建立全國數(shù)據(jù)互聯(lián)、服務(wù)互通的統(tǒng)一數(shù)據(jù)門戶。學(xué)術(shù)界長期以來認(rèn)為, 開源模式理論上可以降低中心平臺(tái)的工作負(fù)擔(dān)、減少重復(fù)建設(shè), 且有利于開放創(chuàng)新和提高服務(wù)水平。但由于涉及多級政府和社會(huì)主體, 實(shí)施難度更大。最終在學(xué)術(shù)界的倡議下, 英國政府采納了開源模式, 并主要實(shí)施了4項(xiàng)措施來保障新模式的執(zhí)行:
(1) 采取主要領(lǐng)導(dǎo)負(fù)責(zé)制。推進(jìn)工作由時(shí)任首相戈登主持, 具體工作由內(nèi)閣辦公廳直接負(fù)責(zé), 保證主導(dǎo)力量具備順利實(shí)施相關(guān)項(xiàng)目的權(quán)威性。具體推進(jìn)采用自上而下的模式:首先建設(shè)國家平臺(tái), 在此過程中制定統(tǒng)一標(biāo)準(zhǔn)、完成頂層設(shè)計(jì)、開發(fā)必要工具。在國家平臺(tái)取得一定成效后向地方推廣。
(2) 聘請英國計(jì)算機(jī)科學(xué)家Tim BernesLee為項(xiàng)目實(shí)施的負(fù)責(zé)人。Tim Bernes-Lee是世界萬維網(wǎng) (World Wide Web) 的發(fā)明者和萬維網(wǎng)基金會(huì)的發(fā)起人, 因推動(dòng)互聯(lián)網(wǎng)關(guān)鍵技術(shù)開源而享有盛譽(yù)。他的加入為英國政府提供了開源模式實(shí)施的必要經(jīng)驗(yàn), 并獲得了全世界開源技術(shù)社區(qū)的關(guān)注和支持。
(3) 與劍橋大學(xué)教授Rufus Pollock發(fā)起的開源公益組織“開放知識(shí)基金會(huì)”合作開發(fā)用于政府?dāng)?shù)據(jù)開放平臺(tái)建設(shè)的CKAN開源系統(tǒng)。與包括公益組織在內(nèi)的社會(huì)力量合作而非單獨(dú)開發(fā), 有助于吸納社會(huì)資源、降低政府部門支出、提高項(xiàng)目的開放性和透明度, 有利于形成全社會(huì)共同參與的開源生態(tài)系統(tǒng)。
(4) 制定鼓勵(lì)開放標(biāo)準(zhǔn)和開源系統(tǒng)的政策, 推動(dòng)開源生態(tài)建設(shè), 如:在2010年發(fā)布的“開源、開放標(biāo)準(zhǔn)和重用:政府行動(dòng)計(jì)劃”中提出鼓勵(lì)開源思維, 指出此舉不但將促進(jìn)政府內(nèi)部創(chuàng)新, 也有利于刺激外部市場增長從而對IT產(chǎn)業(yè)和整體經(jīng)濟(jì)產(chǎn)生外溢效應(yīng)。在2016年發(fā)布“技術(shù)代碼實(shí)踐標(biāo)準(zhǔn)”進(jìn)一步指出, 應(yīng)優(yōu)先考慮開源軟件, 并且如無特殊原因應(yīng)將所有政府新獲取的軟件開放源代碼。
英國選擇開源模式取得了成功, 并成為不少國家的效仿對象。以O(shè)pen Data Barometer排名前20的國家為例, 18例采用了英國開源系統(tǒng)CKAN。其中, 美國政府在2013年放棄了原有系統(tǒng), 基于CKAN重建了其國家開放數(shù)據(jù)平臺(tái)。英國公務(wù)員局局長John Manzoni提出, “政務(wù)系統(tǒng)開源是英國政府最正確的決定之一, 是國家軟實(shí)力的體現(xiàn)”。
2、發(fā)達(dá)國家省市級數(shù)據(jù)開放平臺(tái)的建設(shè)現(xiàn)狀——以英美兩國為例
考慮到地方 (省市級) 數(shù)據(jù)開放平臺(tái)從規(guī)模、需求和經(jīng)費(fèi)層面都可能與國家級平臺(tái)存在差異, 我們選擇美國全部50個(gè)州和GDP排名前50個(gè)城市的建設(shè)情況進(jìn)行了研究。選擇美國的原因是:國土面積、行政區(qū)劃與我國相似, 且是最早建設(shè)數(shù)據(jù)開放平臺(tái)的國家。為了考察地域差異的影響, 我們也補(bǔ)充了英國前20個(gè)城市的建設(shè)情況作為比較。英美兩國同期開始建設(shè), 都是公認(rèn)發(fā)展較好的國家, 可比性較強(qiáng)。未選擇兩國全部城市的原因是, 排名超出選擇范圍的城市都尚未建設(shè)開放數(shù)據(jù)平臺(tái)。
2.1 美國省市級數(shù)據(jù)開放平臺(tái)建設(shè)多采用Socrata為基礎(chǔ)的開源平臺(tái)
在美國50個(gè)州中, 目前有18個(gè)州建設(shè)了統(tǒng)一數(shù)據(jù)開放平臺(tái) (data.gov公布是40個(gè), 但是我們經(jīng)過實(shí)際確認(rèn), 其中大部分僅提供政策文件公開或僅地理數(shù)據(jù), 故未列入) 。在這18個(gè)州中:1個(gè)采用了DKAN, 13個(gè)采用了Socrata, 4個(gè)采用了非開源的專用系統(tǒng), 見圖2 (左) 。在前50大城市中, 有33個(gè)建設(shè)了數(shù)據(jù)開放平臺(tái), 其中:3個(gè)采用CKAN, 3個(gè)采用DKAN, 21個(gè)采用Socrata, 2個(gè)采用Junar, 4個(gè)采用專用系統(tǒng), 見圖2 (右) 。
2.2 英國市級數(shù)據(jù)開放平臺(tái)CKAN和Socrata采用率基本相當(dāng)
作為對比, 在英國前20大城市中, 有12個(gè)建設(shè)了數(shù)據(jù)開放平臺(tái), 其中:5個(gè)采用了CKAN, 5個(gè)采用了Socrata, 2個(gè)采用了自制系統(tǒng)。但英國大中型城市都采用CKAN, 僅小型城市采用Socrata, 導(dǎo)致CKAN的實(shí)際用戶數(shù)量和影響力仍高于Socrata。
圖2 美國已建成的地方數(shù)據(jù)開放平臺(tái)所用系統(tǒng)及占比
從英美兩國地方政府的選擇來看, 地域因素確實(shí)對其決策產(chǎn)生了一定影響。英國地方政府傾向于CKAN (由英國非盈利組織開發(fā)) , 美國地方政府明顯傾向于Socrata (由美國企業(yè)開發(fā)) 。結(jié)合法國也大力推動(dòng)本國的u Data開源系統(tǒng)建設(shè)來看, 發(fā)達(dá)地區(qū)已共同認(rèn)識(shí)到建設(shè)本地開源生態(tài)系統(tǒng)對開放數(shù)據(jù)事業(yè)和數(shù)據(jù)經(jīng)濟(jì)的可持續(xù)發(fā)展具有較大價(jià)值。為了這些長期收益, 有實(shí)力的地區(qū)寧愿選擇短期內(nèi)見效慢、投入大的方案。這就出現(xiàn)了中央-地方多種開源系統(tǒng)并存的可能性。以下以美國為例, 介紹開源系統(tǒng)整合在國家-地方多級數(shù)據(jù)平臺(tái)網(wǎng)絡(luò)方面的應(yīng)用情況。
2.3 美國國家和地方政府如何建設(shè)開放數(shù)據(jù)平臺(tái):利用開源系統(tǒng)整合多級開放數(shù)據(jù)網(wǎng)絡(luò)
美國推動(dòng)開放數(shù)據(jù)平臺(tái)建設(shè)與英國同期, 主要由奧巴馬政府推動(dòng)。2009年, 美國國家開放數(shù)據(jù)平臺(tái)data.gov上線, 成為世界上第一個(gè)此類平臺(tái)。但該平臺(tái)仍采用傳統(tǒng)的專用系統(tǒng)模式, 從各分支機(jī)構(gòu)收集上傳數(shù)據(jù)統(tǒng)一開放, 初期開放的數(shù)據(jù)集較少, 僅有47個(gè)。從2010年開始, 多個(gè)州市地方政府也開始建設(shè)本地開放數(shù)據(jù)平臺(tái), 大多購買本國Socrata公司的技術(shù)服務(wù)。2011年, 由于英國開源模式的成功, 美國和印度政府提出計(jì)劃合作發(fā)展一個(gè)名為“開放數(shù)據(jù)平臺(tái)” (OGPL:Open Data Platform) 的開源系統(tǒng)。但后來由于英國CKAN系統(tǒng)的良好發(fā)展勢頭, 到2013年美國放棄了OGPL計(jì)劃, 轉(zhuǎn)而基于CKAN重建。
2013年5月9日, 奧巴馬政府簽署13642號(hào)行政命令進(jìn)一步推動(dòng)數(shù)據(jù)開放, 并明確了具體執(zhí)行步驟。該行政令實(shí)際將具體開放數(shù)據(jù)的權(quán)利和責(zé)任下放到地方和分支機(jī)構(gòu), 但由中央政府制定標(biāo)準(zhǔn)、推廣開源系統(tǒng)工具和執(zhí)行過程監(jiān)督以統(tǒng)籌進(jìn)行, 避免各自為政。此行政令被認(rèn)為激活了機(jī)構(gòu)活力, 具有里程碑意義。此后兩年內(nèi)美國中央政府機(jī)構(gòu)新增開放數(shù)據(jù)集超過5萬個(gè), 37個(gè)地方政府機(jī)構(gòu)新增開放數(shù)據(jù)集3萬個(gè), 其中1萬個(gè)地方數(shù)據(jù)集采用中央政府建立的統(tǒng)一元數(shù)據(jù)標(biāo)準(zhǔn)并將元數(shù)據(jù)同步更新至中央平臺(tái)。2015年, 由于開源系統(tǒng)工具和開放機(jī)讀接口標(biāo)準(zhǔn)的推廣, 地方平臺(tái)和分支機(jī)構(gòu)到中央平臺(tái)的元數(shù)據(jù)更新已經(jīng)可以每天自動(dòng)完成而無需人工處理。
因此, 美國的開放數(shù)據(jù)平臺(tái)不像英國那樣有比較清晰的自上而下發(fā)展歷程, 而是中央和地方同時(shí)開始探索。在頂層設(shè)計(jì)尚未明確的情況下, 地方政府已經(jīng)開始先行先試。這一現(xiàn)象與我國過去幾年的發(fā)展有相似之處。但美國政府外包服務(wù)市場起步較早, 已發(fā)展得較為成熟。得益于高度市場競爭, 美國大部分地方政府實(shí)際采用了同一技術(shù)系統(tǒng), 即:Socrata, 相當(dāng)于依靠市場力量部分統(tǒng)一了標(biāo)準(zhǔn)。Socrata相比同期的CKAN實(shí)際在云服務(wù)技術(shù)上有優(yōu)勢, 可以大幅度降低管理成本, 對政府幾乎沒有技術(shù)要求, 因此不僅受到美國地方政府青睞, 在英國也被一些規(guī)模較小的城市采用。但Socrata最初不開源, 在2013年美國政府重建國家數(shù)據(jù)開放平臺(tái)時(shí)未被選中。為此, Socrata在2014年也不得不宣布開源, 但為商業(yè)利益考慮, 部分系統(tǒng)僅面向政府用戶開源 (因此被本文定義為部分開源) 。此外, 另一家美國企業(yè)Nu Civic于2013年開發(fā)了完全開源的數(shù)據(jù)平臺(tái)系統(tǒng)DKAN與之競爭, 被加州等地先后采用。自此, 美國實(shí)現(xiàn)了中央平臺(tái)采用CKAN, 地方和其他機(jī)構(gòu)采用多種開源系統(tǒng)競爭, 但基于開放元數(shù)據(jù)標(biāo)準(zhǔn)和開源機(jī)讀接口執(zhí)行自動(dòng)化數(shù)據(jù)整合、全社會(huì)共同參與的多級開源開放數(shù)據(jù)網(wǎng)絡(luò), 如圖3所示 (數(shù)據(jù)使用python從開源系統(tǒng)托管平臺(tái)government.github.com抓取, 由gephi可視化) 。一些典型項(xiàng)目包括:美國政府的data.gov、波士頓公共圖書館的開放元數(shù)據(jù)項(xiàng)目、布里斯托大學(xué)的開放科研數(shù)據(jù)項(xiàng)目等。圖3中可見, 英 (左上角節(jié)點(diǎn)群) 、美 (右上角節(jié)點(diǎn)群) 兩國內(nèi)部都形成了規(guī)模較大、互動(dòng)頻繁 (互動(dòng)頻次由連線的寬度表示) 的政府機(jī)構(gòu)-社會(huì)組織-企業(yè)構(gòu)成的開源網(wǎng)絡(luò), 彼此之間也建立了一定的聯(lián)系, 構(gòu)成了一定規(guī)模的國內(nèi)和跨國開源生態(tài)系統(tǒng)。
圖3 英美等國政府開源生態(tài)系統(tǒng)的網(wǎng)絡(luò)互動(dòng)關(guān)系
3、為何開源模式在全球開放數(shù)據(jù)平臺(tái)建設(shè)中取得成功:一種社會(huì)—技術(shù)系統(tǒng)理論的觀點(diǎn)
英美等國案例體現(xiàn)了開源模式的優(yōu)勢。這一優(yōu)勢無法單純從技術(shù)因素角度來解釋, 如早期開源的CKAN在云計(jì)算技術(shù)方面不如當(dāng)時(shí)尚未開源的Socrata, 但反而取得更好效果。近年來的研究成果表明, 社會(huì)因素在復(fù)雜信息系統(tǒng)建設(shè)過程中扮演了重要角色, 部分學(xué)者提出應(yīng)采用社會(huì)—技術(shù)因素綜合分析的理論框架進(jìn)行研究, 認(rèn)為開放數(shù)據(jù)平臺(tái)不是一個(gè)單純的技術(shù)平臺(tái), 而是一種多社會(huì)—技術(shù)資源互動(dòng)的生態(tài)系統(tǒng) (Socio-technical Ecosystem)。
社會(huì)—技術(shù)系統(tǒng)理論是面對復(fù)雜系統(tǒng)設(shè)計(jì)和實(shí)踐提出的一種研究范式。Bostrom和Heine等提出, “技術(shù)系統(tǒng)與過程、任務(wù)以及將輸入轉(zhuǎn)變?yōu)檩敵龅募夹g(shù)因素有關(guān)”, 而“社會(huì)系統(tǒng)與人的因素 (態(tài)度、技能、價(jià)值觀) , 人的關(guān)系網(wǎng)絡(luò), 回報(bào)機(jī)制以及權(quán)力結(jié)構(gòu)有關(guān)”, “技術(shù)系統(tǒng)與社會(huì)系統(tǒng)往往會(huì)發(fā)生交互作用”, 共同構(gòu)成社會(huì)—技術(shù)系統(tǒng)。
Trist等總結(jié)了這一范式與過去單純強(qiáng)調(diào)技術(shù)的研究范式的主要區(qū)別 (見表2)。
社會(huì)—技術(shù)系統(tǒng)研究范式在提出后較長時(shí)期內(nèi)并未引起信息系統(tǒng)建設(shè)領(lǐng)域的足夠重視, 原因主要為:一是信息系統(tǒng)建設(shè)多以技術(shù)人員主導(dǎo), 二是早期信息系統(tǒng)都較為簡單, 并不包含足夠復(fù)雜的社會(huì)結(jié)構(gòu)。這一情況直到社交網(wǎng)絡(luò)、維基百科等大規(guī)模Web2.0信息系統(tǒng)誕生后才有所改變。本文認(rèn)為開放數(shù)據(jù)平臺(tái)作為一種提供社會(huì)性公共服務(wù)的廣域復(fù)雜信息系統(tǒng), 正適用于社會(huì)—技術(shù)系統(tǒng)的理論模型, 且與本文案例研究所形成的證據(jù)鏈可以相互支持以解釋各國實(shí)踐經(jīng)驗(yàn)。
表2 兩種研究范式的對比
3.1 開放數(shù)據(jù)平臺(tái)建設(shè)不是單純的技術(shù)問題, 需要考慮到廣泛社會(huì)—技術(shù)資源的開放參與
過去的組織機(jī)構(gòu)信息化過程往往存在唯技術(shù)論傾向。近年來的研究表明, 這種不完整的分析框架和工作思路易造成項(xiàng)目失敗。例如, Meliha研究了歐洲公共管理機(jī)構(gòu)中的知識(shí)管理系統(tǒng)模型, 發(fā)現(xiàn)社會(huì)因素和技術(shù)因素共同作用于組織知識(shí)管理系統(tǒng)發(fā)展, 且前者在公共知識(shí)產(chǎn)生領(lǐng)域的影響往往更大。Reyes等研究了大量政府信息系統(tǒng)建設(shè)的失敗案例, 指出許多失敗不是來自技術(shù)因素, 而是社會(huì)和組織因素, 建議將信息系統(tǒng)建設(shè)視為一個(gè)社會(huì)—技術(shù)動(dòng)態(tài)互動(dòng)的過程不斷根據(jù)反饋進(jìn)行迭代優(yōu)化以提高實(shí)施的成功率。
世界各國開放數(shù)據(jù)平臺(tái)建設(shè)現(xiàn)狀也吻合社會(huì)—技術(shù)綜合分析的框架。例如, 美國建設(shè)開放數(shù)據(jù)平臺(tái)起步早于英國, 在信息技術(shù)研發(fā)方面也有一定優(yōu)勢。但到了2013年, 建設(shè)成效卻明顯不如英國, 最終借鑒了英國經(jīng)驗(yàn)重建其開放數(shù)據(jù)平臺(tái)。其原因就在于美國政府早期將之視為單純的技術(shù)問題, 采取大包大攬的封閉建設(shè)模式, 不重視社會(huì)子系統(tǒng)的作用。當(dāng)時(shí), 部分研究人員就指出這一模式并非最佳選擇。如:David Robinson在《政府?dāng)?shù)據(jù)與看不見的手》一文中提出“政府無須也不應(yīng)大包大攬, 應(yīng)當(dāng)理清自己的特長和職責(zé), 并針對不足引入第三方協(xié)助, 包括:私人機(jī)構(gòu)、公益組織或商業(yè)組織等”。英國從起始階段就更重視社會(huì)因素, 以發(fā)展開源系統(tǒng)為聯(lián)系紐帶盡可能吸納第三方社會(huì)技術(shù)資源, 取得了明顯效果。再如, 非洲開放銀行與Knoema公司合作, 借助后者的技術(shù)資源開發(fā)了非洲開放數(shù)據(jù)平臺(tái), 希望推動(dòng)非洲開放數(shù)據(jù)工作, 但由于與當(dāng)?shù)厣鐣?huì)系統(tǒng)脫節(jié), 收效甚微。
這些案例表明, 發(fā)展開放數(shù)據(jù)平臺(tái)不是一個(gè)單純的技術(shù)問題, 也不應(yīng)是政府單方面的行動(dòng), 而是一個(gè)需要多種社會(huì)—技術(shù)資源開放參與的系統(tǒng)優(yōu)化過程。開源模式的本質(zhì)是摒棄技術(shù)決定論的舊范式, 轉(zhuǎn)而采用社會(huì)—技術(shù)系統(tǒng)綜合優(yōu)化的新思維, 如英國“開放標(biāo)準(zhǔn)原則 (Open Standard Principles) ”和“政府信息技術(shù)戰(zhàn)略 (Government ICT strategy) ”指出:開源有助于政府與社會(huì)組織、科研機(jī)構(gòu)、企業(yè)、個(gè)人合作, 從而有利于構(gòu)建一個(gè)開放參與的良好生態(tài)環(huán)境。
3.2 開放數(shù)據(jù)平臺(tái)建設(shè)是多種社會(huì)—技術(shù)因素的互動(dòng)優(yōu)化, 因地制宜打造開源系統(tǒng)生態(tài)是成功的動(dòng)力
社會(huì)—技術(shù)系統(tǒng)理論認(rèn)為, 多種社會(huì)—技術(shù)資源在系統(tǒng)中不是簡單的堆疊、各自為政, 而是存在不同角色之間的互動(dòng)網(wǎng)絡(luò)關(guān)系和組織優(yōu)化過程。如Frank等的研究表明, 社會(huì)和技術(shù)資源賦能者是社會(huì)—技術(shù)系統(tǒng)中的關(guān)鍵角色, 他們之間的網(wǎng)絡(luò)組織和互動(dòng)是系統(tǒng)發(fā)展的主要推動(dòng)力量。在開放數(shù)據(jù)平臺(tái)建設(shè)過程中, 政府首要領(lǐng)導(dǎo)、關(guān)鍵技術(shù)專家、社會(huì)學(xué)家、社會(huì)機(jī)構(gòu)和企業(yè)的負(fù)責(zé)人往往扮演著賦能者的角色, 將多樣化的賦能者引入系統(tǒng)并建立溝通順暢、相互信任的社會(huì)—技術(shù)資源網(wǎng)絡(luò)生態(tài)是項(xiàng)目成功的動(dòng)力。
但由于各國各地區(qū)的情況不盡相同, 導(dǎo)致一個(gè)地區(qū)成功的社會(huì)—技術(shù)資源網(wǎng)絡(luò)未必能在另一個(gè)地區(qū)完全復(fù)制。例如, 盡管英美兩國最終都采用了開源模式, 實(shí)現(xiàn)了中央-地方-社會(huì)—企業(yè)的多級社會(huì)—技術(shù)資源構(gòu)成的開源合作網(wǎng)絡(luò), 還相互借鑒了彼此的經(jīng)驗(yàn), 但美英兩國的發(fā)展路徑不盡相同。相對而言, 英國路徑是自上而下推進(jìn), 政府與公益組織是主要賦能者;美國路徑則是中央和地方同時(shí)推進(jìn)、相互適應(yīng), 政府與商業(yè)機(jī)構(gòu)是主要賦能者。主要賦能者的差異也是美英兩國政府開源政策的差異。英國的開源政策更強(qiáng)調(diào)面向公眾開放, 而美國的政策更強(qiáng)調(diào)版權(quán)、安全和隱私。如英國的數(shù)字服務(wù)標(biāo)準(zhǔn) (Digital Service Standard) 提出要開源所有政府新建的數(shù)字服務(wù)系統(tǒng)。而2016年美國制定的聯(lián)邦源代碼政策 (Federal Source Code Policy) , 僅要求每個(gè)國家機(jī)構(gòu)在其每年新定制開發(fā)的軟件中開源至少20%的代碼。另外, 英國政府的所有開源系統(tǒng)和工具均面向公眾開放, 而美國政府則設(shè)立了政府開源軟件統(tǒng)一門戶網(wǎng)站code.gov以管理內(nèi)部開放問題。經(jīng)本文統(tǒng)計(jì), 目前該網(wǎng)站上托管的開源軟件涉及國際開發(fā)、商業(yè)、農(nóng)業(yè)、教育、國防等25個(gè)機(jī)構(gòu)的114個(gè)項(xiàng)目, 其中有41個(gè)項(xiàng)目 (37%) 僅限政府部門內(nèi)部開源, 需要聯(lián)系主管部門才能獲取源代碼, 并不對公眾開放 (即部分開源) 。
目前看來, 英國的建設(shè)現(xiàn)狀更開放、統(tǒng)一及有序, 而美國的建設(shè)現(xiàn)狀則更好地照顧了企業(yè)利益和商業(yè)運(yùn)作。因此在具體發(fā)展過程中, 在借鑒成功經(jīng)驗(yàn)的同時(shí), 還必須結(jié)合本地具體情況制定政策、確定主要賦能者、優(yōu)化社會(huì)—技術(shù)資源、構(gòu)建互動(dòng)網(wǎng)絡(luò)生態(tài)。
4、建議和討論
4.1 采用開源模式建設(shè)數(shù)據(jù)開放平臺(tái)
各級各地政府的數(shù)據(jù)開放平臺(tái)從功能上看高度相似, 各自封閉開發(fā)是一種效率較低的選擇, 存在以下缺點(diǎn):第一, 重復(fù)開發(fā), 浪費(fèi)資金;第二, 數(shù)據(jù)格式、標(biāo)準(zhǔn)難以統(tǒng)一, 不利于數(shù)據(jù)互聯(lián)互通;第三, 不利于社會(huì)—技術(shù)資源整合, 技術(shù)迭代慢、內(nèi)容更新少、利用率低。多國實(shí)踐現(xiàn)狀表明, 開源模式有助于解決上述問題。例如, 美國政府首席信息官Tony Scott總結(jié):美國政府各部門每年用于購買定制軟件的開銷高達(dá)60億美金, 采用開源系統(tǒng)通過政府內(nèi)部共享源代碼可大幅降低成本, 促進(jìn)政府的信息技術(shù)創(chuàng)新并有利于開源軟件社區(qū)發(fā)展形成技術(shù)外溢效應(yīng)。本文建議優(yōu)先采用開源模式建設(shè)數(shù)據(jù)開放平臺(tái)。
具體實(shí)現(xiàn)路徑有兩種可能: (1) 選擇已有的國外開源系統(tǒng)為基礎(chǔ), 如:CKAN和DKAN; (2) 選擇自行研發(fā)并發(fā)展本地開源生態(tài)系統(tǒng)。路徑1的優(yōu)點(diǎn)是:國外現(xiàn)有開源系統(tǒng)已比較成熟, 在多國實(shí)踐中得到驗(yàn)證, 全球開源社區(qū)發(fā)展完備, 功能更新速度快。故此路徑實(shí)施難度低, 投入成本小, 是目前世界上大多數(shù)國家的主流選擇。路徑2的優(yōu)點(diǎn)是:雖然投入大、見效慢, 但可以通過政府投入建立本地技術(shù)體系, 推動(dòng)數(shù)據(jù)技術(shù)研發(fā), 促進(jìn)開源生態(tài)建設(shè)和人才培養(yǎng), 長期收益更大。目前, 英、法、美等國均推動(dòng)本地開源生態(tài)系統(tǒng)建設(shè)。
4.2 基于云平臺(tái)部署數(shù)據(jù)開放平臺(tái)
云平臺(tái)是一種大規(guī)??砷_放使用的標(biāo)準(zhǔn)化計(jì)算基礎(chǔ)設(shè)施, 具有初期投入低、可擴(kuò)展性好、易管理等特點(diǎn)。從社會(huì)—技術(shù)系統(tǒng)分析框架出發(fā), 云平臺(tái)不僅是一種重要的技術(shù)資源, 而且有利于為政府—企業(yè)—社會(huì)組織的開源合作網(wǎng)絡(luò)提供統(tǒng)一的基礎(chǔ)設(shè)施, 促進(jìn)交流合作。從各國各地區(qū)實(shí)踐案例來看, 得到了廣泛采用并取得了良好效果。建議優(yōu)先考慮以云平臺(tái)為硬件基礎(chǔ)設(shè)施部署數(shù)據(jù)開放平臺(tái)。從國外的實(shí)踐來看, 國家級平臺(tái)及少數(shù)大型機(jī)構(gòu)平臺(tái)建設(shè)政府云, 而大多數(shù)中小型機(jī)構(gòu)采用政企合作、購買服務(wù)的模式在企業(yè)已有的公共云上托管數(shù)據(jù)開放平臺(tái)是一種常見選擇。
云服務(wù)一般可分為三個(gè)層次:基礎(chǔ)設(shè)施即服務(wù) (Iaa S) 、平臺(tái)即服務(wù) (Paa S) 、軟件即服務(wù) (Saa S) 。目前國內(nèi)的云平臺(tái)服務(wù)商大多僅為公共部門提供前兩個(gè)層次, 距離國外企業(yè)提供完整三個(gè)層次的云服務(wù)仍有差距。完整的云服務(wù)與開源模式結(jié)合, 可以更好地降低技術(shù)門檻和初期投入。不但有助于公共部門降低成本, 也有助于技術(shù)外溢和數(shù)字經(jīng)濟(jì)創(chuàng)新。
4.3 培育和依托本地開源社區(qū)生態(tài)
開放數(shù)據(jù)平臺(tái)需要吸納大量社會(huì)—技術(shù)資源來不斷更新改良其功能并利用數(shù)據(jù)開發(fā)出更多有益于全體人民的服務(wù)。這項(xiàng)工作不可能僅由政府或少數(shù)企業(yè)來完成。因此發(fā)動(dòng)群體智慧, 引入關(guān)鍵的社會(huì)—技術(shù)賦能者, 培育開源軟件社區(qū)生態(tài), 讓人民服務(wù)人民, 是開放數(shù)據(jù)平臺(tái)建設(shè)過程中公認(rèn)的最佳實(shí)踐。一些成功模式如英國的my Society.com和美國的codeforameria.org, 在各地幫助建立了上百個(gè)團(tuán)隊(duì)組成的開源合作網(wǎng)絡(luò), 為數(shù)據(jù)開放和利用做出了很大貢獻(xiàn)。
相關(guān)學(xué)術(shù)研究也指出, “建立一個(gè)健康的開源社區(qū)生態(tài)系統(tǒng)對于打造公共部門信息產(chǎn)品的可持續(xù)生態(tài)以實(shí)現(xiàn)長期發(fā)展至關(guān)重要”。建議我國主管部門出臺(tái)政策鼓勵(lì)類似非營利組織和開源社區(qū)的組建, 給予一定政策、數(shù)據(jù)、甚至經(jīng)費(fèi)支持。
4.4 盡快建立并明確聲明全國統(tǒng)一的數(shù)據(jù)開放使用授權(quán)協(xié)議等開放數(shù)據(jù)標(biāo)準(zhǔn)
我國目前各地平臺(tái)建設(shè)中標(biāo)準(zhǔn)不統(tǒng)一、不規(guī)范的情況比較嚴(yán)重, 阻礙了社會(huì)—技術(shù)資源協(xié)同網(wǎng)絡(luò)的形成。以數(shù)據(jù)開放使用授權(quán)協(xié)議為例, 根據(jù)對國內(nèi)已建成平臺(tái)的調(diào)查, 本文發(fā)現(xiàn)目前各地平臺(tái)的數(shù)據(jù)開放授權(quán)協(xié)議差異較大。有的平臺(tái)甚至沒有明確的授權(quán)協(xié)議, 僅以免責(zé)聲明代替。嚴(yán)格意義上來說, 沒有明確授權(quán)的開放數(shù)據(jù)甚至不能稱之為開放數(shù)據(jù)。在權(quán)責(zé)聲明不夠清晰的情況下, 潛在的法律擔(dān)憂將阻礙使用意愿。此外, 在數(shù)據(jù)混合使用時(shí), 多種的授權(quán)協(xié)議也容易造成混亂, 引發(fā)數(shù)據(jù)侵權(quán)、數(shù)據(jù)濫用等問題。從國外實(shí)踐來看, 一般由國家制定統(tǒng)一的“開放政府授權(quán)協(xié)議”。如無特別聲明, 則公共部門自身創(chuàng)建的所有數(shù)據(jù)可默認(rèn)適用該授權(quán)協(xié)議。一些可供參考的案例包括:英國的“公共部門信息開放政府授權(quán)協(xié)議” (Open Government Licence for public sector information) 、加拿大的“開放政府授權(quán)協(xié)議” (Open Government Licence) 和美國的政府工作版權(quán)協(xié)議 (Government Works Copyright) 等。
附錄
主要開放政府?dāng)?shù)據(jù)平臺(tái)的系統(tǒng)簡介