0、引言

  自2015年《國(guó)務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要的通知》提出, 要在“2018年底前建成國(guó)家政府?dāng)?shù)據(jù)統(tǒng)一開放平臺(tái)”以來(lái), 如何建設(shè)和管理數(shù)據(jù)開放平臺(tái)成為一個(gè)各方關(guān)注的問(wèn)題。截至目前, 一些省市級(jí)的數(shù)據(jù)開放平臺(tái)已先后建成并提供了許多寶貴的前期探索經(jīng)驗(yàn), 參見(jiàn)表1。但如表1統(tǒng)計(jì), 我國(guó)現(xiàn)有的地方政府?dāng)?shù)據(jù)開放平臺(tái)多采用專用模式, 即:針對(duì)特定機(jī)構(gòu)需求、采用少數(shù)企業(yè)專用技術(shù)體系開發(fā)。這一模式曾在世界范圍內(nèi)被普遍采用, 具有可靠性易于驗(yàn)證、易于實(shí)施和管理、項(xiàng)目風(fēng)險(xiǎn)低等優(yōu)點(diǎn), 但也存在開放性不足、不利于廣泛參與和創(chuàng)新的問(wèn)題。因此, 在近年來(lái)的國(guó)際開放數(shù)據(jù)平臺(tái)建設(shè)潮流中, 專用模式已逐漸被開源模式取代。

表1 國(guó)內(nèi)省市級(jí)數(shù)據(jù)開放平臺(tái)建設(shè)情況一覽

640.webp.jpg

  國(guó)內(nèi)一些學(xué)者, 如:鮑靜等等提出, 采用“共享與開放的技術(shù)支撐與規(guī)范”是國(guó)際上的一種常見(jiàn)做法, 值得學(xué)習(xí)借鑒。2017年, 《國(guó)務(wù)院辦公廳關(guān)于印發(fā)政務(wù)信息系統(tǒng)整合共享實(shí)施方案的通知》也明確指出, 要“有效推進(jìn)政務(wù)信息系統(tǒng)整合共享, 切實(shí)避免各自為政、自成體系、重復(fù)投資、重復(fù)建設(shè)”。

  什么是開放數(shù)據(jù)平臺(tái)建設(shè)的開源模式?開源模式是如何提出并逐漸成為主流的?發(fā)達(dá)國(guó)家如何借助開源模式發(fā)展開放數(shù)據(jù)平臺(tái)?如何從理論上解釋開源現(xiàn)象?本文嘗試基于世界各國(guó)數(shù)據(jù)開放平臺(tái)建設(shè)現(xiàn)狀進(jìn)行綜合案例研究以回答上述基本問(wèn)題。希望本文對(duì)國(guó)外相關(guān)經(jīng)驗(yàn)的總結(jié)能起到拋磚引玉的作用, 為我國(guó)數(shù)據(jù)開放平臺(tái)建設(shè)提供一些可供借鑒的資料。

  1、世界各國(guó)國(guó)家級(jí)數(shù)據(jù)統(tǒng)一開放平臺(tái)的建設(shè)現(xiàn)狀——基于60國(guó)數(shù)據(jù)

  作為參考, 本文首先統(tǒng)計(jì)了全球60個(gè)國(guó)家的國(guó)家級(jí)數(shù)據(jù)開放平臺(tái)建設(shè)情況。選擇依據(jù)是Open Data Barometer開放數(shù)據(jù)指數(shù)。該指數(shù)由非營(yíng)利性組織“互聯(lián)網(wǎng)基金會(huì)”統(tǒng)計(jì)。因60名以外多為欠發(fā)達(dá)地區(qū), 未有專項(xiàng)建設(shè)計(jì)劃, 故未納入比較。

  1.1 建設(shè)國(guó)家數(shù)據(jù)統(tǒng)一開放平臺(tái)是致力于數(shù)據(jù)開放的國(guó)家的共同選擇

  在60個(gè)國(guó)家中, 已建成數(shù)據(jù)統(tǒng)一開放平臺(tái)的國(guó)家為47例 (占78%) , 尚未建成的為13例, 其中我國(guó)計(jì)劃于2018年底前建成??梢?jiàn)建設(shè)國(guó)家數(shù)據(jù)統(tǒng)一開放平臺(tái)是世界各國(guó)致力于開放數(shù)據(jù)的共同選擇、符合世界發(fā)展潮流。

  1.2 多數(shù)國(guó)家選擇開源模式建設(shè)國(guó)家數(shù)據(jù)統(tǒng)一開放平臺(tái)

  據(jù)統(tǒng)計(jì), 本文調(diào)查的60個(gè)國(guó)家中, 已建成數(shù)據(jù)開放平臺(tái)的有47國(guó), 其中絕大多數(shù)采用開源模式, 共34例 (占72%) 。選擇部分開源的為2例, 選擇非開源的為11例。其中圍繞CKAN開源系統(tǒng)建設(shè)的最多, 為28例 (占60%) , 其他分別為:DKAN (4例) 、u Data (1例) 、OGPL (1例) (見(jiàn)圖1) 。其中, Socrata的部分技術(shù)工具和源代碼僅對(duì)政府用戶開放, 并非面向所有社會(huì)公眾開放, 因此本文將基于Socrata的開放數(shù)據(jù)平臺(tái)定義為部分開源。

  開源模式 (Open-source Model) 是指不依賴少數(shù)機(jī)構(gòu)的封閉技術(shù)體系, 而是圍繞某一開源系統(tǒng)為基礎(chǔ)建設(shè)開放社區(qū)生態(tài), 強(qiáng)調(diào)所有系統(tǒng)工具面向全社會(huì)免費(fèi)開放共享、社會(huì)各界協(xié)同創(chuàng)新的分布式建設(shè)和治理模式。其中, 開源系統(tǒng)是指遵守開放源代碼協(xié)議的可自由分發(fā)、修改和重用的軟件系統(tǒng)。運(yùn)用開源模式建設(shè)開放數(shù)據(jù)平臺(tái), 意味著不僅開放數(shù)據(jù), 同時(shí)也開放所有用于數(shù)據(jù)平臺(tái)建設(shè)的系統(tǒng)工具, 使任何社會(huì)機(jī)構(gòu)和群體可以極低成本構(gòu)建自己的開放數(shù)據(jù)平臺(tái)。以英國(guó)為例介紹開源模式在國(guó)家數(shù)據(jù)開放平臺(tái)建設(shè)中的應(yīng)用發(fā)端和歷程。

640.webp (1).jpg

圖1 47國(guó)國(guó)家數(shù)據(jù)開放平臺(tái)所用系統(tǒng)及案例數(shù)

  1.3 英國(guó)政府如何建設(shè)國(guó)家開放數(shù)據(jù)平臺(tái):開源模式的提出和實(shí)踐

  英國(guó)開放政府?dāng)?shù)據(jù)平臺(tái)是世界上最早提供政府?dāng)?shù)據(jù)開放的國(guó)家級(jí)平臺(tái)之一, 于2009年底內(nèi)部測(cè)試, 2010年初面向社會(huì)開放, 首批開放2 879個(gè)數(shù)據(jù)集。英國(guó)建設(shè)過(guò)程具有一定代表性, 開放數(shù)據(jù)之前已建成政府安全內(nèi)部網(wǎng) (相當(dāng)于我國(guó)的“電子政務(wù)內(nèi)網(wǎng)”) 及各部門電子政務(wù)系統(tǒng)。需要解決的關(guān)鍵問(wèn)題是“數(shù)據(jù)孤島”問(wèn)題, 使“內(nèi)網(wǎng)”各部門系統(tǒng)的數(shù)據(jù)互聯(lián)互通并以統(tǒng)一的交互方式向“外網(wǎng)”提供。當(dāng)時(shí)提出了兩種模式:

  第一種是基于內(nèi)部閉環(huán)的專用模式, 即:各分支機(jī)構(gòu)僅以滿足自身業(yè)務(wù)需要為要求, 所有數(shù)據(jù)經(jīng)內(nèi)部閉環(huán)定期匯集到新增的開放數(shù)據(jù)中心平臺(tái)、統(tǒng)一處理后向公眾開放。此模式集中治理數(shù)據(jù), 無(wú)須制定公開標(biāo)準(zhǔn), 可以委托少數(shù)企業(yè)封閉開發(fā), 技術(shù)保密性較好, 可控性較強(qiáng)。但相應(yīng)的問(wèn)題是:從技術(shù)治理角度而言, 中心平臺(tái)負(fù)擔(dān)過(guò)重, 易導(dǎo)致中心失效;從社會(huì)治理角度而言, 減少了各部門和社會(huì)機(jī)構(gòu)的協(xié)作機(jī)會(huì), 不利于全社會(huì)普遍參與, 與開放精神不相吻合, 易導(dǎo)致更新不及時(shí)、利用率低等問(wèn)題。

  第二種是發(fā)動(dòng)社會(huì)資源開放協(xié)作、分布式治理的開源模式, 即:中心平臺(tái)不負(fù)責(zé)直接管理所有數(shù)據(jù), 而是凝聚共識(shí)、制定標(biāo)準(zhǔn)、免費(fèi)提供通用工具幫助分支機(jī)構(gòu)自建符合標(biāo)準(zhǔn)的對(duì)外開放數(shù)據(jù)平臺(tái), 形成元數(shù)據(jù)可跨系統(tǒng)同步、原始數(shù)據(jù)可互操作的分布式開放數(shù)據(jù)平臺(tái)群落。全國(guó)中心平臺(tái)僅負(fù)責(zé)通過(guò)一個(gè)中心編目系統(tǒng)管理分布式數(shù)據(jù)平臺(tái)的元數(shù)據(jù), 各分布平臺(tái)的原始數(shù)據(jù)各自管理、自行更新。在收到用戶請(qǐng)求時(shí)中心平臺(tái)根據(jù)元數(shù)據(jù)描述從分布系統(tǒng)實(shí)時(shí)調(diào)用對(duì)應(yīng)的數(shù)據(jù)集, 從而建立全國(guó)數(shù)據(jù)互聯(lián)、服務(wù)互通的統(tǒng)一數(shù)據(jù)門戶。學(xué)術(shù)界長(zhǎng)期以來(lái)認(rèn)為, 開源模式理論上可以降低中心平臺(tái)的工作負(fù)擔(dān)、減少重復(fù)建設(shè), 且有利于開放創(chuàng)新和提高服務(wù)水平。但由于涉及多級(jí)政府和社會(huì)主體, 實(shí)施難度更大。最終在學(xué)術(shù)界的倡議下, 英國(guó)政府采納了開源模式, 并主要實(shí)施了4項(xiàng)措施來(lái)保障新模式的執(zhí)行:

  (1) 采取主要領(lǐng)導(dǎo)負(fù)責(zé)制。推進(jìn)工作由時(shí)任首相戈登主持, 具體工作由內(nèi)閣辦公廳直接負(fù)責(zé), 保證主導(dǎo)力量具備順利實(shí)施相關(guān)項(xiàng)目的權(quán)威性。具體推進(jìn)采用自上而下的模式:首先建設(shè)國(guó)家平臺(tái), 在此過(guò)程中制定統(tǒng)一標(biāo)準(zhǔn)、完成頂層設(shè)計(jì)、開發(fā)必要工具。在國(guó)家平臺(tái)取得一定成效后向地方推廣。

  (2) 聘請(qǐng)英國(guó)計(jì)算機(jī)科學(xué)家Tim BernesLee為項(xiàng)目實(shí)施的負(fù)責(zé)人。Tim Bernes-Lee是世界萬(wàn)維網(wǎng) (World Wide Web) 的發(fā)明者和萬(wàn)維網(wǎng)基金會(huì)的發(fā)起人, 因推動(dòng)互聯(lián)網(wǎng)關(guān)鍵技術(shù)開源而享有盛譽(yù)。他的加入為英國(guó)政府提供了開源模式實(shí)施的必要經(jīng)驗(yàn), 并獲得了全世界開源技術(shù)社區(qū)的關(guān)注和支持。

  (3) 與劍橋大學(xué)教授Rufus Pollock發(fā)起的開源公益組織“開放知識(shí)基金會(huì)”合作開發(fā)用于政府?dāng)?shù)據(jù)開放平臺(tái)建設(shè)的CKAN開源系統(tǒng)。與包括公益組織在內(nèi)的社會(huì)力量合作而非單獨(dú)開發(fā), 有助于吸納社會(huì)資源、降低政府部門支出、提高項(xiàng)目的開放性和透明度, 有利于形成全社會(huì)共同參與的開源生態(tài)系統(tǒng)。

  (4) 制定鼓勵(lì)開放標(biāo)準(zhǔn)和開源系統(tǒng)的政策, 推動(dòng)開源生態(tài)建設(shè), 如:在2010年發(fā)布的“開源、開放標(biāo)準(zhǔn)和重用:政府行動(dòng)計(jì)劃”中提出鼓勵(lì)開源思維, 指出此舉不但將促進(jìn)政府內(nèi)部創(chuàng)新, 也有利于刺激外部市場(chǎng)增長(zhǎng)從而對(duì)IT產(chǎn)業(yè)和整體經(jīng)濟(jì)產(chǎn)生外溢效應(yīng)。在2016年發(fā)布“技術(shù)代碼實(shí)踐標(biāo)準(zhǔn)”進(jìn)一步指出, 應(yīng)優(yōu)先考慮開源軟件, 并且如無(wú)特殊原因應(yīng)將所有政府新獲取的軟件開放源代碼。

  英國(guó)選擇開源模式取得了成功, 并成為不少國(guó)家的效仿對(duì)象。以O(shè)pen Data Barometer排名前20的國(guó)家為例, 18例采用了英國(guó)開源系統(tǒng)CKAN。其中, 美國(guó)政府在2013年放棄了原有系統(tǒng), 基于CKAN重建了其國(guó)家開放數(shù)據(jù)平臺(tái)。英國(guó)公務(wù)員局局長(zhǎng)John Manzoni提出, “政務(wù)系統(tǒng)開源是英國(guó)政府最正確的決定之一, 是國(guó)家軟實(shí)力的體現(xiàn)”。

  2、發(fā)達(dá)國(guó)家省市級(jí)數(shù)據(jù)開放平臺(tái)的建設(shè)現(xiàn)狀——以英美兩國(guó)為例

  考慮到地方 (省市級(jí)) 數(shù)據(jù)開放平臺(tái)從規(guī)模、需求和經(jīng)費(fèi)層面都可能與國(guó)家級(jí)平臺(tái)存在差異, 我們選擇美國(guó)全部50個(gè)州和GDP排名前50個(gè)城市的建設(shè)情況進(jìn)行了研究。選擇美國(guó)的原因是:國(guó)土面積、行政區(qū)劃與我國(guó)相似, 且是最早建設(shè)數(shù)據(jù)開放平臺(tái)的國(guó)家。為了考察地域差異的影響, 我們也補(bǔ)充了英國(guó)前20個(gè)城市的建設(shè)情況作為比較。英美兩國(guó)同期開始建設(shè), 都是公認(rèn)發(fā)展較好的國(guó)家, 可比性較強(qiáng)。未選擇兩國(guó)全部城市的原因是, 排名超出選擇范圍的城市都尚未建設(shè)開放數(shù)據(jù)平臺(tái)。

  2.1 美國(guó)省市級(jí)數(shù)據(jù)開放平臺(tái)建設(shè)多采用Socrata為基礎(chǔ)的開源平臺(tái)

  在美國(guó)50個(gè)州中, 目前有18個(gè)州建設(shè)了統(tǒng)一數(shù)據(jù)開放平臺(tái) (data.gov公布是40個(gè), 但是我們經(jīng)過(guò)實(shí)際確認(rèn), 其中大部分僅提供政策文件公開或僅地理數(shù)據(jù), 故未列入) 。在這18個(gè)州中:1個(gè)采用了DKAN, 13個(gè)采用了Socrata, 4個(gè)采用了非開源的專用系統(tǒng), 見(jiàn)圖2 (左) 。在前50大城市中, 有33個(gè)建設(shè)了數(shù)據(jù)開放平臺(tái), 其中:3個(gè)采用CKAN, 3個(gè)采用DKAN, 21個(gè)采用Socrata, 2個(gè)采用Junar, 4個(gè)采用專用系統(tǒng), 見(jiàn)圖2 (右) 。

  2.2 英國(guó)市級(jí)數(shù)據(jù)開放平臺(tái)CKAN和Socrata采用率基本相當(dāng)

  作為對(duì)比, 在英國(guó)前20大城市中, 有12個(gè)建設(shè)了數(shù)據(jù)開放平臺(tái), 其中:5個(gè)采用了CKAN, 5個(gè)采用了Socrata, 2個(gè)采用了自制系統(tǒng)。但英國(guó)大中型城市都采用CKAN, 僅小型城市采用Socrata, 導(dǎo)致CKAN的實(shí)際用戶數(shù)量和影響力仍高于Socrata。

640.webp (2).jpg

圖2 美國(guó)已建成的地方數(shù)據(jù)開放平臺(tái)所用系統(tǒng)及占比

  從英美兩國(guó)地方政府的選擇來(lái)看, 地域因素確實(shí)對(duì)其決策產(chǎn)生了一定影響。英國(guó)地方政府傾向于CKAN (由英國(guó)非盈利組織開發(fā)) , 美國(guó)地方政府明顯傾向于Socrata (由美國(guó)企業(yè)開發(fā)) 。結(jié)合法國(guó)也大力推動(dòng)本國(guó)的u Data開源系統(tǒng)建設(shè)來(lái)看, 發(fā)達(dá)地區(qū)已共同認(rèn)識(shí)到建設(shè)本地開源生態(tài)系統(tǒng)對(duì)開放數(shù)據(jù)事業(yè)和數(shù)據(jù)經(jīng)濟(jì)的可持續(xù)發(fā)展具有較大價(jià)值。為了這些長(zhǎng)期收益, 有實(shí)力的地區(qū)寧愿選擇短期內(nèi)見(jiàn)效慢、投入大的方案。這就出現(xiàn)了中央-地方多種開源系統(tǒng)并存的可能性。以下以美國(guó)為例, 介紹開源系統(tǒng)整合在國(guó)家-地方多級(jí)數(shù)據(jù)平臺(tái)網(wǎng)絡(luò)方面的應(yīng)用情況。

  2.3 美國(guó)國(guó)家和地方政府如何建設(shè)開放數(shù)據(jù)平臺(tái):利用開源系統(tǒng)整合多級(jí)開放數(shù)據(jù)網(wǎng)絡(luò)

  美國(guó)推動(dòng)開放數(shù)據(jù)平臺(tái)建設(shè)與英國(guó)同期, 主要由奧巴馬政府推動(dòng)。2009年, 美國(guó)國(guó)家開放數(shù)據(jù)平臺(tái)data.gov上線, 成為世界上第一個(gè)此類平臺(tái)。但該平臺(tái)仍采用傳統(tǒng)的專用系統(tǒng)模式, 從各分支機(jī)構(gòu)收集上傳數(shù)據(jù)統(tǒng)一開放, 初期開放的數(shù)據(jù)集較少, 僅有47個(gè)。從2010年開始, 多個(gè)州市地方政府也開始建設(shè)本地開放數(shù)據(jù)平臺(tái), 大多購(gòu)買本國(guó)Socrata公司的技術(shù)服務(wù)。2011年, 由于英國(guó)開源模式的成功, 美國(guó)和印度政府提出計(jì)劃合作發(fā)展一個(gè)名為“開放數(shù)據(jù)平臺(tái)” (OGPL:Open Data Platform) 的開源系統(tǒng)。但后來(lái)由于英國(guó)CKAN系統(tǒng)的良好發(fā)展勢(shì)頭, 到2013年美國(guó)放棄了OGPL計(jì)劃, 轉(zhuǎn)而基于CKAN重建。

  2013年5月9日, 奧巴馬政府簽署13642號(hào)行政命令進(jìn)一步推動(dòng)數(shù)據(jù)開放, 并明確了具體執(zhí)行步驟。該行政令實(shí)際將具體開放數(shù)據(jù)的權(quán)利和責(zé)任下放到地方和分支機(jī)構(gòu), 但由中央政府制定標(biāo)準(zhǔn)、推廣開源系統(tǒng)工具和執(zhí)行過(guò)程監(jiān)督以統(tǒng)籌進(jìn)行, 避免各自為政。此行政令被認(rèn)為激活了機(jī)構(gòu)活力, 具有里程碑意義。此后兩年內(nèi)美國(guó)中央政府機(jī)構(gòu)新增開放數(shù)據(jù)集超過(guò)5萬(wàn)個(gè), 37個(gè)地方政府機(jī)構(gòu)新增開放數(shù)據(jù)集3萬(wàn)個(gè), 其中1萬(wàn)個(gè)地方數(shù)據(jù)集采用中央政府建立的統(tǒng)一元數(shù)據(jù)標(biāo)準(zhǔn)并將元數(shù)據(jù)同步更新至中央平臺(tái)。2015年, 由于開源系統(tǒng)工具和開放機(jī)讀接口標(biāo)準(zhǔn)的推廣, 地方平臺(tái)和分支機(jī)構(gòu)到中央平臺(tái)的元數(shù)據(jù)更新已經(jīng)可以每天自動(dòng)完成而無(wú)需人工處理。

  因此, 美國(guó)的開放數(shù)據(jù)平臺(tái)不像英國(guó)那樣有比較清晰的自上而下發(fā)展歷程, 而是中央和地方同時(shí)開始探索。在頂層設(shè)計(jì)尚未明確的情況下, 地方政府已經(jīng)開始先行先試。這一現(xiàn)象與我國(guó)過(guò)去幾年的發(fā)展有相似之處。但美國(guó)政府外包服務(wù)市場(chǎng)起步較早, 已發(fā)展得較為成熟。得益于高度市場(chǎng)競(jìng)爭(zhēng), 美國(guó)大部分地方政府實(shí)際采用了同一技術(shù)系統(tǒng), 即:Socrata, 相當(dāng)于依靠市場(chǎng)力量部分統(tǒng)一了標(biāo)準(zhǔn)。Socrata相比同期的CKAN實(shí)際在云服務(wù)技術(shù)上有優(yōu)勢(shì), 可以大幅度降低管理成本, 對(duì)政府幾乎沒(méi)有技術(shù)要求, 因此不僅受到美國(guó)地方政府青睞, 在英國(guó)也被一些規(guī)模較小的城市采用。但Socrata最初不開源, 在2013年美國(guó)政府重建國(guó)家數(shù)據(jù)開放平臺(tái)時(shí)未被選中。為此, Socrata在2014年也不得不宣布開源, 但為商業(yè)利益考慮, 部分系統(tǒng)僅面向政府用戶開源 (因此被本文定義為部分開源) 。此外, 另一家美國(guó)企業(yè)Nu Civic于2013年開發(fā)了完全開源的數(shù)據(jù)平臺(tái)系統(tǒng)DKAN與之競(jìng)爭(zhēng), 被加州等地先后采用。自此, 美國(guó)實(shí)現(xiàn)了中央平臺(tái)采用CKAN, 地方和其他機(jī)構(gòu)采用多種開源系統(tǒng)競(jìng)爭(zhēng), 但基于開放元數(shù)據(jù)標(biāo)準(zhǔn)和開源機(jī)讀接口執(zhí)行自動(dòng)化數(shù)據(jù)整合、全社會(huì)共同參與的多級(jí)開源開放數(shù)據(jù)網(wǎng)絡(luò), 如圖3所示 (數(shù)據(jù)使用python從開源系統(tǒng)托管平臺(tái)government.github.com抓取, 由gephi可視化) 。一些典型項(xiàng)目包括:美國(guó)政府的data.gov、波士頓公共圖書館的開放元數(shù)據(jù)項(xiàng)目、布里斯托大學(xué)的開放科研數(shù)據(jù)項(xiàng)目等。圖3中可見(jiàn), 英 (左上角節(jié)點(diǎn)群) 、美 (右上角節(jié)點(diǎn)群) 兩國(guó)內(nèi)部都形成了規(guī)模較大、互動(dòng)頻繁 (互動(dòng)頻次由連線的寬度表示) 的政府機(jī)構(gòu)-社會(huì)組織-企業(yè)構(gòu)成的開源網(wǎng)絡(luò), 彼此之間也建立了一定的聯(lián)系, 構(gòu)成了一定規(guī)模的國(guó)內(nèi)和跨國(guó)開源生態(tài)系統(tǒng)。

640.webp (3).jpg

圖3 英美等國(guó)政府開源生態(tài)系統(tǒng)的網(wǎng)絡(luò)互動(dòng)關(guān)系

  3、為何開源模式在全球開放數(shù)據(jù)平臺(tái)建設(shè)中取得成功:一種社會(huì)—技術(shù)系統(tǒng)理論的觀點(diǎn)

  英美等國(guó)案例體現(xiàn)了開源模式的優(yōu)勢(shì)。這一優(yōu)勢(shì)無(wú)法單純從技術(shù)因素角度來(lái)解釋, 如早期開源的CKAN在云計(jì)算技術(shù)方面不如當(dāng)時(shí)尚未開源的Socrata, 但反而取得更好效果。近年來(lái)的研究成果表明, 社會(huì)因素在復(fù)雜信息系統(tǒng)建設(shè)過(guò)程中扮演了重要角色, 部分學(xué)者提出應(yīng)采用社會(huì)—技術(shù)因素綜合分析的理論框架進(jìn)行研究, 認(rèn)為開放數(shù)據(jù)平臺(tái)不是一個(gè)單純的技術(shù)平臺(tái), 而是一種多社會(huì)—技術(shù)資源互動(dòng)的生態(tài)系統(tǒng) (Socio-technical Ecosystem)。

  社會(huì)—技術(shù)系統(tǒng)理論是面對(duì)復(fù)雜系統(tǒng)設(shè)計(jì)和實(shí)踐提出的一種研究范式。Bostrom和Heine等提出, “技術(shù)系統(tǒng)與過(guò)程、任務(wù)以及將輸入轉(zhuǎn)變?yōu)檩敵龅募夹g(shù)因素有關(guān)”, 而“社會(huì)系統(tǒng)與人的因素 (態(tài)度、技能、價(jià)值觀) , 人的關(guān)系網(wǎng)絡(luò), 回報(bào)機(jī)制以及權(quán)力結(jié)構(gòu)有關(guān)”, “技術(shù)系統(tǒng)與社會(huì)系統(tǒng)往往會(huì)發(fā)生交互作用”, 共同構(gòu)成社會(huì)—技術(shù)系統(tǒng)。

  Trist等總結(jié)了這一范式與過(guò)去單純強(qiáng)調(diào)技術(shù)的研究范式的主要區(qū)別 (見(jiàn)表2)。

  社會(huì)—技術(shù)系統(tǒng)研究范式在提出后較長(zhǎng)時(shí)期內(nèi)并未引起信息系統(tǒng)建設(shè)領(lǐng)域的足夠重視, 原因主要為:一是信息系統(tǒng)建設(shè)多以技術(shù)人員主導(dǎo), 二是早期信息系統(tǒng)都較為簡(jiǎn)單, 并不包含足夠復(fù)雜的社會(huì)結(jié)構(gòu)。這一情況直到社交網(wǎng)絡(luò)、維基百科等大規(guī)模Web2.0信息系統(tǒng)誕生后才有所改變。本文認(rèn)為開放數(shù)據(jù)平臺(tái)作為一種提供社會(huì)性公共服務(wù)的廣域復(fù)雜信息系統(tǒng), 正適用于社會(huì)—技術(shù)系統(tǒng)的理論模型, 且與本文案例研究所形成的證據(jù)鏈可以相互支持以解釋各國(guó)實(shí)踐經(jīng)驗(yàn)。

表2 兩種研究范式的對(duì)比

640.webp (4).jpg

  3.1 開放數(shù)據(jù)平臺(tái)建設(shè)不是單純的技術(shù)問(wèn)題, 需要考慮到廣泛社會(huì)—技術(shù)資源的開放參與

  過(guò)去的組織機(jī)構(gòu)信息化過(guò)程往往存在唯技術(shù)論傾向。近年來(lái)的研究表明, 這種不完整的分析框架和工作思路易造成項(xiàng)目失敗。例如, Meliha研究了歐洲公共管理機(jī)構(gòu)中的知識(shí)管理系統(tǒng)模型, 發(fā)現(xiàn)社會(huì)因素和技術(shù)因素共同作用于組織知識(shí)管理系統(tǒng)發(fā)展, 且前者在公共知識(shí)產(chǎn)生領(lǐng)域的影響往往更大。Reyes等研究了大量政府信息系統(tǒng)建設(shè)的失敗案例, 指出許多失敗不是來(lái)自技術(shù)因素, 而是社會(huì)和組織因素, 建議將信息系統(tǒng)建設(shè)視為一個(gè)社會(huì)—技術(shù)動(dòng)態(tài)互動(dòng)的過(guò)程不斷根據(jù)反饋進(jìn)行迭代優(yōu)化以提高實(shí)施的成功率。

  世界各國(guó)開放數(shù)據(jù)平臺(tái)建設(shè)現(xiàn)狀也吻合社會(huì)—技術(shù)綜合分析的框架。例如, 美國(guó)建設(shè)開放數(shù)據(jù)平臺(tái)起步早于英國(guó), 在信息技術(shù)研發(fā)方面也有一定優(yōu)勢(shì)。但到了2013年, 建設(shè)成效卻明顯不如英國(guó), 最終借鑒了英國(guó)經(jīng)驗(yàn)重建其開放數(shù)據(jù)平臺(tái)。其原因就在于美國(guó)政府早期將之視為單純的技術(shù)問(wèn)題, 采取大包大攬的封閉建設(shè)模式, 不重視社會(huì)子系統(tǒng)的作用。當(dāng)時(shí), 部分研究人員就指出這一模式并非最佳選擇。如:David Robinson在《政府?dāng)?shù)據(jù)與看不見(jiàn)的手》一文中提出“政府無(wú)須也不應(yīng)大包大攬, 應(yīng)當(dāng)理清自己的特長(zhǎng)和職責(zé), 并針對(duì)不足引入第三方協(xié)助, 包括:私人機(jī)構(gòu)、公益組織或商業(yè)組織等”。英國(guó)從起始階段就更重視社會(huì)因素, 以發(fā)展開源系統(tǒng)為聯(lián)系紐帶盡可能吸納第三方社會(huì)技術(shù)資源, 取得了明顯效果。再如, 非洲開放銀行與Knoema公司合作, 借助后者的技術(shù)資源開發(fā)了非洲開放數(shù)據(jù)平臺(tái), 希望推動(dòng)非洲開放數(shù)據(jù)工作, 但由于與當(dāng)?shù)厣鐣?huì)系統(tǒng)脫節(jié), 收效甚微。

  這些案例表明, 發(fā)展開放數(shù)據(jù)平臺(tái)不是一個(gè)單純的技術(shù)問(wèn)題, 也不應(yīng)是政府單方面的行動(dòng), 而是一個(gè)需要多種社會(huì)—技術(shù)資源開放參與的系統(tǒng)優(yōu)化過(guò)程。開源模式的本質(zhì)是摒棄技術(shù)決定論的舊范式, 轉(zhuǎn)而采用社會(huì)—技術(shù)系統(tǒng)綜合優(yōu)化的新思維, 如英國(guó)“開放標(biāo)準(zhǔn)原則 (Open Standard Principles) ”和“政府信息技術(shù)戰(zhàn)略 (Government ICT strategy) ”指出:開源有助于政府與社會(huì)組織、科研機(jī)構(gòu)、企業(yè)、個(gè)人合作, 從而有利于構(gòu)建一個(gè)開放參與的良好生態(tài)環(huán)境。

  3.2 開放數(shù)據(jù)平臺(tái)建設(shè)是多種社會(huì)—技術(shù)因素的互動(dòng)優(yōu)化, 因地制宜打造開源系統(tǒng)生態(tài)是成功的動(dòng)力

  社會(huì)—技術(shù)系統(tǒng)理論認(rèn)為, 多種社會(huì)—技術(shù)資源在系統(tǒng)中不是簡(jiǎn)單的堆疊、各自為政, 而是存在不同角色之間的互動(dòng)網(wǎng)絡(luò)關(guān)系和組織優(yōu)化過(guò)程。如Frank等的研究表明, 社會(huì)和技術(shù)資源賦能者是社會(huì)—技術(shù)系統(tǒng)中的關(guān)鍵角色, 他們之間的網(wǎng)絡(luò)組織和互動(dòng)是系統(tǒng)發(fā)展的主要推動(dòng)力量。在開放數(shù)據(jù)平臺(tái)建設(shè)過(guò)程中, 政府首要領(lǐng)導(dǎo)、關(guān)鍵技術(shù)專家、社會(huì)學(xué)家、社會(huì)機(jī)構(gòu)和企業(yè)的負(fù)責(zé)人往往扮演著賦能者的角色, 將多樣化的賦能者引入系統(tǒng)并建立溝通順暢、相互信任的社會(huì)—技術(shù)資源網(wǎng)絡(luò)生態(tài)是項(xiàng)目成功的動(dòng)力。

  但由于各國(guó)各地區(qū)的情況不盡相同, 導(dǎo)致一個(gè)地區(qū)成功的社會(huì)—技術(shù)資源網(wǎng)絡(luò)未必能在另一個(gè)地區(qū)完全復(fù)制。例如, 盡管英美兩國(guó)最終都采用了開源模式, 實(shí)現(xiàn)了中央-地方-社會(huì)—企業(yè)的多級(jí)社會(huì)—技術(shù)資源構(gòu)成的開源合作網(wǎng)絡(luò), 還相互借鑒了彼此的經(jīng)驗(yàn), 但美英兩國(guó)的發(fā)展路徑不盡相同。相對(duì)而言, 英國(guó)路徑是自上而下推進(jìn), 政府與公益組織是主要賦能者;美國(guó)路徑則是中央和地方同時(shí)推進(jìn)、相互適應(yīng), 政府與商業(yè)機(jī)構(gòu)是主要賦能者。主要賦能者的差異也是美英兩國(guó)政府開源政策的差異。英國(guó)的開源政策更強(qiáng)調(diào)面向公眾開放, 而美國(guó)的政策更強(qiáng)調(diào)版權(quán)、安全和隱私。如英國(guó)的數(shù)字服務(wù)標(biāo)準(zhǔn) (Digital Service Standard) 提出要開源所有政府新建的數(shù)字服務(wù)系統(tǒng)。而2016年美國(guó)制定的聯(lián)邦源代碼政策 (Federal Source Code Policy) , 僅要求每個(gè)國(guó)家機(jī)構(gòu)在其每年新定制開發(fā)的軟件中開源至少20%的代碼。另外, 英國(guó)政府的所有開源系統(tǒng)和工具均面向公眾開放, 而美國(guó)政府則設(shè)立了政府開源軟件統(tǒng)一門戶網(wǎng)站code.gov以管理內(nèi)部開放問(wèn)題。經(jīng)本文統(tǒng)計(jì), 目前該網(wǎng)站上托管的開源軟件涉及國(guó)際開發(fā)、商業(yè)、農(nóng)業(yè)、教育、國(guó)防等25個(gè)機(jī)構(gòu)的114個(gè)項(xiàng)目, 其中有41個(gè)項(xiàng)目 (37%) 僅限政府部門內(nèi)部開源, 需要聯(lián)系主管部門才能獲取源代碼, 并不對(duì)公眾開放 (即部分開源) 。

  目前看來(lái), 英國(guó)的建設(shè)現(xiàn)狀更開放、統(tǒng)一及有序, 而美國(guó)的建設(shè)現(xiàn)狀則更好地照顧了企業(yè)利益和商業(yè)運(yùn)作。因此在具體發(fā)展過(guò)程中, 在借鑒成功經(jīng)驗(yàn)的同時(shí), 還必須結(jié)合本地具體情況制定政策、確定主要賦能者、優(yōu)化社會(huì)—技術(shù)資源、構(gòu)建互動(dòng)網(wǎng)絡(luò)生態(tài)。

  4、建議和討論

  4.1 采用開源模式建設(shè)數(shù)據(jù)開放平臺(tái)

  各級(jí)各地政府的數(shù)據(jù)開放平臺(tái)從功能上看高度相似, 各自封閉開發(fā)是一種效率較低的選擇, 存在以下缺點(diǎn):第一, 重復(fù)開發(fā), 浪費(fèi)資金;第二, 數(shù)據(jù)格式、標(biāo)準(zhǔn)難以統(tǒng)一, 不利于數(shù)據(jù)互聯(lián)互通;第三, 不利于社會(huì)—技術(shù)資源整合, 技術(shù)迭代慢、內(nèi)容更新少、利用率低。多國(guó)實(shí)踐現(xiàn)狀表明, 開源模式有助于解決上述問(wèn)題。例如, 美國(guó)政府首席信息官Tony Scott總結(jié):美國(guó)政府各部門每年用于購(gòu)買定制軟件的開銷高達(dá)60億美金, 采用開源系統(tǒng)通過(guò)政府內(nèi)部共享源代碼可大幅降低成本, 促進(jìn)政府的信息技術(shù)創(chuàng)新并有利于開源軟件社區(qū)發(fā)展形成技術(shù)外溢效應(yīng)。本文建議優(yōu)先采用開源模式建設(shè)數(shù)據(jù)開放平臺(tái)。

  具體實(shí)現(xiàn)路徑有兩種可能: (1) 選擇已有的國(guó)外開源系統(tǒng)為基礎(chǔ), 如:CKAN和DKAN; (2) 選擇自行研發(fā)并發(fā)展本地開源生態(tài)系統(tǒng)。路徑1的優(yōu)點(diǎn)是:國(guó)外現(xiàn)有開源系統(tǒng)已比較成熟, 在多國(guó)實(shí)踐中得到驗(yàn)證, 全球開源社區(qū)發(fā)展完備, 功能更新速度快。故此路徑實(shí)施難度低, 投入成本小, 是目前世界上大多數(shù)國(guó)家的主流選擇。路徑2的優(yōu)點(diǎn)是:雖然投入大、見(jiàn)效慢, 但可以通過(guò)政府投入建立本地技術(shù)體系, 推動(dòng)數(shù)據(jù)技術(shù)研發(fā), 促進(jìn)開源生態(tài)建設(shè)和人才培養(yǎng), 長(zhǎng)期收益更大。目前, 英、法、美等國(guó)均推動(dòng)本地開源生態(tài)系統(tǒng)建設(shè)。

  4.2 基于云平臺(tái)部署數(shù)據(jù)開放平臺(tái)

  云平臺(tái)是一種大規(guī)??砷_放使用的標(biāo)準(zhǔn)化計(jì)算基礎(chǔ)設(shè)施, 具有初期投入低、可擴(kuò)展性好、易管理等特點(diǎn)。從社會(huì)—技術(shù)系統(tǒng)分析框架出發(fā), 云平臺(tái)不僅是一種重要的技術(shù)資源, 而且有利于為政府—企業(yè)—社會(huì)組織的開源合作網(wǎng)絡(luò)提供統(tǒng)一的基礎(chǔ)設(shè)施, 促進(jìn)交流合作。從各國(guó)各地區(qū)實(shí)踐案例來(lái)看, 得到了廣泛采用并取得了良好效果。建議優(yōu)先考慮以云平臺(tái)為硬件基礎(chǔ)設(shè)施部署數(shù)據(jù)開放平臺(tái)。從國(guó)外的實(shí)踐來(lái)看, 國(guó)家級(jí)平臺(tái)及少數(shù)大型機(jī)構(gòu)平臺(tái)建設(shè)政府云, 而大多數(shù)中小型機(jī)構(gòu)采用政企合作、購(gòu)買服務(wù)的模式在企業(yè)已有的公共云上托管數(shù)據(jù)開放平臺(tái)是一種常見(jiàn)選擇。

  云服務(wù)一般可分為三個(gè)層次:基礎(chǔ)設(shè)施即服務(wù) (Iaa S) 、平臺(tái)即服務(wù) (Paa S) 、軟件即服務(wù) (Saa S) 。目前國(guó)內(nèi)的云平臺(tái)服務(wù)商大多僅為公共部門提供前兩個(gè)層次, 距離國(guó)外企業(yè)提供完整三個(gè)層次的云服務(wù)仍有差距。完整的云服務(wù)與開源模式結(jié)合, 可以更好地降低技術(shù)門檻和初期投入。不但有助于公共部門降低成本, 也有助于技術(shù)外溢和數(shù)字經(jīng)濟(jì)創(chuàng)新。

  4.3 培育和依托本地開源社區(qū)生態(tài)

  開放數(shù)據(jù)平臺(tái)需要吸納大量社會(huì)—技術(shù)資源來(lái)不斷更新改良其功能并利用數(shù)據(jù)開發(fā)出更多有益于全體人民的服務(wù)。這項(xiàng)工作不可能僅由政府或少數(shù)企業(yè)來(lái)完成。因此發(fā)動(dòng)群體智慧, 引入關(guān)鍵的社會(huì)—技術(shù)賦能者, 培育開源軟件社區(qū)生態(tài), 讓人民服務(wù)人民, 是開放數(shù)據(jù)平臺(tái)建設(shè)過(guò)程中公認(rèn)的最佳實(shí)踐。一些成功模式如英國(guó)的my Society.com和美國(guó)的codeforameria.org, 在各地幫助建立了上百個(gè)團(tuán)隊(duì)組成的開源合作網(wǎng)絡(luò), 為數(shù)據(jù)開放和利用做出了很大貢獻(xiàn)。

  相關(guān)學(xué)術(shù)研究也指出, “建立一個(gè)健康的開源社區(qū)生態(tài)系統(tǒng)對(duì)于打造公共部門信息產(chǎn)品的可持續(xù)生態(tài)以實(shí)現(xiàn)長(zhǎng)期發(fā)展至關(guān)重要”。建議我國(guó)主管部門出臺(tái)政策鼓勵(lì)類似非營(yíng)利組織和開源社區(qū)的組建, 給予一定政策、數(shù)據(jù)、甚至經(jīng)費(fèi)支持。

  4.4 盡快建立并明確聲明全國(guó)統(tǒng)一的數(shù)據(jù)開放使用授權(quán)協(xié)議等開放數(shù)據(jù)標(biāo)準(zhǔn)

  我國(guó)目前各地平臺(tái)建設(shè)中標(biāo)準(zhǔn)不統(tǒng)一、不規(guī)范的情況比較嚴(yán)重, 阻礙了社會(huì)—技術(shù)資源協(xié)同網(wǎng)絡(luò)的形成。以數(shù)據(jù)開放使用授權(quán)協(xié)議為例, 根據(jù)對(duì)國(guó)內(nèi)已建成平臺(tái)的調(diào)查, 本文發(fā)現(xiàn)目前各地平臺(tái)的數(shù)據(jù)開放授權(quán)協(xié)議差異較大。有的平臺(tái)甚至沒(méi)有明確的授權(quán)協(xié)議, 僅以免責(zé)聲明代替。嚴(yán)格意義上來(lái)說(shuō), 沒(méi)有明確授權(quán)的開放數(shù)據(jù)甚至不能稱之為開放數(shù)據(jù)。在權(quán)責(zé)聲明不夠清晰的情況下, 潛在的法律擔(dān)憂將阻礙使用意愿。此外, 在數(shù)據(jù)混合使用時(shí), 多種的授權(quán)協(xié)議也容易造成混亂, 引發(fā)數(shù)據(jù)侵權(quán)、數(shù)據(jù)濫用等問(wèn)題。從國(guó)外實(shí)踐來(lái)看, 一般由國(guó)家制定統(tǒng)一的“開放政府授權(quán)協(xié)議”。如無(wú)特別聲明, 則公共部門自身創(chuàng)建的所有數(shù)據(jù)可默認(rèn)適用該授權(quán)協(xié)議。一些可供參考的案例包括:英國(guó)的“公共部門信息開放政府授權(quán)協(xié)議” (Open Government Licence for public sector information) 、加拿大的“開放政府授權(quán)協(xié)議” (Open Government Licence) 和美國(guó)的政府工作版權(quán)協(xié)議 (Government Works Copyright) 等。

  附錄

主要開放政府?dāng)?shù)據(jù)平臺(tái)的系統(tǒng)簡(jiǎn)介

640.webp (5).jpg

責(zé)任編輯:李泰民