中國國家圖書館是綜合性研究圖書館,是國家總書庫和全國圖書館元數(shù)據(jù)中心,它同時(shí)履行國立圖書館和公共圖書館的職能,承擔(dān)著為中央國家領(lǐng)導(dǎo)機(jī)關(guān)、重點(diǎn)科研、教育、生產(chǎn)單位和社會(huì)公眾服務(wù)的任務(wù)。2008年5月1日,隨著《政府信息公開條例》的實(shí)施,公共圖書館被賦予了“政府信息公開窗口”的職責(zé),而為了更好地滿足公眾需求,國家圖書館與北京拓爾思信息技術(shù)股份有限公司(簡(jiǎn)稱TRS)簽署合作協(xié)議,將應(yīng)用TRS產(chǎn)品建設(shè)“國圖政府信息整合發(fā)布平臺(tái)”,以構(gòu)建一個(gè)方便、快捷的政府公開信息整合服務(wù)門戶,使公眾可以像應(yīng)用Google一樣搜索分布在全國各地政府網(wǎng)站上的政府公開信息,以及國家圖書館收藏的各類政府出版物和學(xué)術(shù)文獻(xiàn)。
國家圖書館作為全國圖書館界國際化和現(xiàn)代化發(fā)展的風(fēng)向標(biāo),它在全國圖書館標(biāo)準(zhǔn)化、規(guī)范化、數(shù)字化、網(wǎng)絡(luò)化建設(shè)中發(fā)揮著骨干作用,為此筆者對(duì)國家圖書館數(shù)字資源部主任王志庚進(jìn)行了獨(dú)家專訪,以期望在政府信息公開的新形式下,把國圖在數(shù)字資源建設(shè)方面的豐富經(jīng)驗(yàn)及先進(jìn)做法展現(xiàn)給大家,從而推動(dòng)整個(gè)圖書館界在政府公開信息開發(fā)和利用領(lǐng)域的發(fā)展。
筆者:隨著各級(jí)政府部門對(duì)政府信息公開目錄的建設(shè),政府信息公開資源的開發(fā)利用可能成為今后幾年市場(chǎng)的趨勢(shì),那么國圖對(duì)于“政府公開信息整合平臺(tái)”這個(gè)政府信息公開領(lǐng)域的首個(gè)垂直搜索引擎系統(tǒng),有什么預(yù)期的建設(shè)目標(biāo)和建設(shè)效益?
王志庚:圖書館是搜集信息,整理信息,提供信息服務(wù)的場(chǎng)所,圖書館員要做的事情就是給“書”找人,給人找“書”,而政府信息就是我們搜集的對(duì)象之一。
2008年5月1日《政府信息公開條例》的頒布,對(duì)于圖書館來說是一個(gè)發(fā)展契機(jī),圖書館成為了政府開放信息的查詢窗口。政府信息公開的行為本身是政府行為,它們有層次、分地域、分不同行業(yè)和部門,同時(shí)政府信息公開的格式也各不相同。但政府信息本身是有關(guān)聯(lián)性的,不是孤立的,從中央到地方,到各部門,怎樣引用、摘述、流轉(zhuǎn)、整合這些政府信息公開資源,都需要由我們這樣的專業(yè)機(jī)構(gòu)介入。利用成熟的文獻(xiàn)信息管理方法和工具,把政府公開信息納入到圖書館信息整合的流程中來,這樣就能把資源盤活了,因此我們要建設(shè)政府公開信息的整合服務(wù)平臺(tái)。政府的義務(wù)是公開,而圖書館的義務(wù)是整合和服務(wù)。按照我們的設(shè)想,國圖整合中央級(jí)的政府信息,各省館整合省級(jí)和地縣級(jí)政府信息,通過國圖的開先河,帶動(dòng)兄弟圖書館在政府信息整合方面的統(tǒng)籌協(xié)調(diào)發(fā)展。
另外,從信息長(zhǎng)期保留和存檔的角度來看,政府網(wǎng)站上的許多信息需要長(zhǎng)期保存,如,我們現(xiàn)在行政體制在改革,很多中央部委不存在了,但曾經(jīng)發(fā)布在那些部委網(wǎng)站上的公開信息,對(duì)今后的學(xué)者了解近當(dāng)代中國行政生態(tài)是很重要的參考依據(jù)和文獻(xiàn)素材,所以說,政府網(wǎng)絡(luò)信息需要圖書館去做信息整合和服務(wù)。
筆者:《政府信息公開條例》實(shí)施至今,關(guān)于政府信息公開的訴訟案件已有幾十起,如山東某記者要求環(huán)保局把企業(yè)排污指標(biāo)公布出來,但公布這些信息對(duì)于環(huán)保局來說是個(gè)大工程,它需要花很大力氣做整理工作,而國家限定只能收取檢索費(fèi)、復(fù)制費(fèi)和郵寄費(fèi)等三項(xiàng)費(fèi)用,并只收成本價(jià)格,如有的地方規(guī)定依申請(qǐng)公開一條信息為3毛錢,因此政府就面臨著此類依申請(qǐng)公開“3毛錢”的尷尬。在這方面我國還處于一個(gè)空白階段,而在國外這種非常專業(yè)的服務(wù)卻由第三方做,您怎么看待這個(gè)問題?
王志庚:這屬于增值服務(wù)的范疇,在我個(gè)人看來,由第三方承接政府信息資源的增值服務(wù)也是中國市場(chǎng)未來的一個(gè)趨勢(shì),目前在政府信息資源的增值服務(wù)方面,國家圖書館涉及到兩點(diǎn):
政府信息資源的數(shù)字化,十幾年以前的政府信息大多都不是數(shù)字化形式的,這就涉及一個(gè)數(shù)字化的問題,如:涉及政府檔案性質(zhì)的東西需要公開,但它們是紙制出版物,為了讓紙制文獻(xiàn)被檢索、發(fā)現(xiàn)和利用,降低整個(gè)社會(huì)發(fā)現(xiàn)和索取利用的成本,就需要把非數(shù)字化的信息數(shù)字化后放到網(wǎng)上,這也是國圖在做的事情,這是一個(gè)增值點(diǎn)。
另外一個(gè)增值點(diǎn)是“泛”政府信息的整合和服務(wù),也就是公開目錄未涉及的相關(guān)內(nèi)容,比如:政府組織的各類會(huì)議和公共活動(dòng),這些都能衍生出來很多內(nèi)容,可能是孤立的網(wǎng)站、視頻等會(huì)議資料,這些就是“泛”政府信息;還有一類是政府官員出席活動(dòng)的講話,或者政府官員的博客,這些都涉及我國的政治發(fā)展,也需要我們國家政府管理好;另外一類是正式的政府出版物,它們屬于商業(yè)信息資源。
還有,未來不排除國家圖書館提供“依申請(qǐng)公開窗口”的可能性,當(dāng)公眾有需要時(shí),通過國圖提出請(qǐng)求,國圖再到相關(guān)部門處找到信息源,并經(jīng)過加工提供給請(qǐng)求者,但國圖作為公共服務(wù)的部門,提供信息是公益服務(wù),如果涉及費(fèi)用,也只有成本費(fèi),不會(huì)贏利。
政府信息公開有自己的目錄和元數(shù)據(jù)標(biāo)準(zhǔn)。國家圖書館有自己的知識(shí)組織語言,有分類法,有主題詞表,其中主題詞表是目前國內(nèi)唯一面向海量應(yīng)用的知識(shí)組織工具,用這個(gè)詞表來整合政府公開信息所產(chǎn)生的增值作用,值得期待。
筆者:從標(biāo)準(zhǔn)的制定來講,目前政府信息公開主要是在網(wǎng)站上進(jìn)行呈現(xiàn),一旦在網(wǎng)站上呈現(xiàn),它的存儲(chǔ)或元數(shù)據(jù)的提取,就完全是按照網(wǎng)站利用或展現(xiàn)的手法來規(guī)定一些字段或元數(shù)據(jù),但它們沒有圖書館那么深厚的元數(shù)據(jù)描述基礎(chǔ),或不全面和不科學(xué),在標(biāo)準(zhǔn)制定方面雖然國辦制定了標(biāo)準(zhǔn),但是落實(shí)到網(wǎng)站上標(biāo)準(zhǔn)在走形,您怎么看待這個(gè)問題?
王志庚:我們也一直在關(guān)注和調(diào)研這個(gè)問題,不同政府網(wǎng)站的元數(shù)據(jù)框架差異很大,有些甚至完全為了視覺效果,為了迎合網(wǎng)民瀏覽和閱讀的習(xí)慣,迎合用戶的感受和體驗(yàn)來制定元數(shù)據(jù)標(biāo)準(zhǔn),但實(shí)際上從整合和管理資源的角度講,這種做法不利于信息資源長(zhǎng)久的、可持續(xù)的保存和增值利用。
這種現(xiàn)象的主要原因是信息公開還是初級(jí)階段,很多政府特別是基層政府還沒有完全反應(yīng)過來,甚至不知道應(yīng)該怎么做,只知道公開,公開有什么標(biāo)準(zhǔn)、什么步驟、什么程序,沒有什么參考的依據(jù)。同時(shí)信息公開資源的開發(fā)利用是一個(gè)鏈條,信息源頭不規(guī)范,也就是上游不規(guī)范,帶來了下游整合難度非常大。
因此,我非常希望相關(guān)管理部門盡早成立一個(gè)高層的技術(shù)研究工作組,制定并出臺(tái)政府信息加工和發(fā)布的相關(guān)數(shù)據(jù)、平臺(tái)和協(xié)議的標(biāo)準(zhǔn)規(guī)范,這一規(guī)范既要適應(yīng)未來互聯(lián)網(wǎng)的技術(shù)發(fā)展需求,同時(shí)還要兼顧數(shù)字出版、數(shù)字教育、數(shù)字科研和數(shù)字圖書館等系統(tǒng)既有的元數(shù)據(jù)以及系統(tǒng)互操作方面的標(biāo)準(zhǔn)和規(guī)范。
筆者:國務(wù)院7月份針對(duì)各省市信息公開的建設(shè)情況組織了一次調(diào)研,在這期間有關(guān)人士提出檔案館、圖書館以后會(huì)不會(huì)成為政府信息公開的容災(zāi)備份中心?基于此觀點(diǎn),您覺得對(duì)于電子政務(wù)服務(wù)商來說,2009年圖書館、檔案館會(huì)不會(huì)在政府信息公開方面做些事情?尤其是地方?
王志庚:我國的新聞出版管理規(guī)定中有一套成熟的出版物繳存制度,對(duì)于全國所有的出版社或其他出版機(jī)構(gòu),只要出版一本書、一本期刊或一份報(bào)紙,就必須向國家圖書館免費(fèi)提供一定數(shù)量的樣品,國圖具有無償接受繳送的權(quán)利。這也是大多數(shù)發(fā)達(dá)國家都在執(zhí)行的國家出版物存檔制度。
但我國的政府出版物,特別是過去的政府出版物好多是內(nèi)部資料,它沒有明確的繳存制度,所以圖書館特別希望在這次政府信息公開中能夠把公共圖書館,特別是省及以下級(jí)圖書館作為當(dāng)?shù)卣霭嫖锏姆ǘㄊ绽U單位。只有這樣,圖書館才能實(shí)現(xiàn)對(duì)政府信息的長(zhǎng)期備份保存,不管是紙制的出版物繳存,還是光盤,或網(wǎng)絡(luò)形式的政府信息。
文化館、檔案館、圖書館作為政府信息的法定收繳機(jī)構(gòu),或稱容災(zāi)備份基地,國際早有這樣的潮流。另外,現(xiàn)在國際上一個(gè)很大的趨勢(shì):“圖文檔合流”,就是圖書館、文化館、檔案館的合并,這三者融合的動(dòng)因,有些是出于財(cái)務(wù)性需要,由于國家經(jīng)費(fèi)有限所致“記憶機(jī)構(gòu)”的體制性合并的現(xiàn)象,主要的誘因是記憶機(jī)構(gòu)的功能性融合,這是網(wǎng)絡(luò)環(huán)境下“記憶機(jī)構(gòu)”集體實(shí)現(xiàn)價(jià)值再造的主動(dòng)性發(fā)展訴求,是現(xiàn)代信息社會(huì)共建共享發(fā)展的必然結(jié)果。
筆者:網(wǎng)絡(luò)上有那么多信息,但大家還找不到信息,這就需要用垂直搜索,行業(yè)門戶去細(xì)分服務(wù)。而政府信息公開就是很大的服務(wù),那么它的服務(wù)會(huì)不會(huì)細(xì)分?會(huì)怎樣細(xì)分?
王志庚:我覺得肯定要出現(xiàn)細(xì)分,無論從供給方還是從需求方,都有細(xì)分的要求。我們這里看細(xì)分有兩點(diǎn),一個(gè)是分層服務(wù),另一個(gè)是分類服務(wù),也就是分內(nèi)容、分主題的服務(wù)。
分層服務(wù)是按行政機(jī)構(gòu)建設(shè),國圖整合中央,服務(wù)中央;省圖整合省和地縣級(jí)信息,服務(wù)地方;還有其他的業(yè)態(tài),如:搜索引擎或一些商業(yè)機(jī)構(gòu),也可能會(huì)做這樣服務(wù)。在我們來看分層服務(wù)的內(nèi)容主要有兩種,一種是信息本身的獲取和瀏覽,另一種是一般的檢索發(fā)現(xiàn)提供的這種增值服務(wù),這是服務(wù)本身的附加值。
分類服務(wù)方面,從圖書館來講法律方面,特別是商務(wù)、經(jīng)濟(jì),以及文化都是增值服務(wù)的熱點(diǎn)。
在商業(yè)方面,如:區(qū)域政府會(huì)公布招商引資條例,不同的開發(fā)區(qū)域會(huì)有不同的優(yōu)惠措施,這些都是政府信息。這些信息往往會(huì)隨著時(shí)間變化而變化或隨著中央指示精神而變化,企業(yè)對(duì)這類信息的需求非常迫切。
關(guān)于法律信息,在國際化的大進(jìn)程中,中國法律的海外需求非常多,外國人想知道中國政府的態(tài)度和我們國內(nèi)的法律和政策環(huán)境,這需要法律信息的外銷問題。
TRS:Google 和Baidu 等搜索引擎的排序,采用PageRank算法,網(wǎng)頁關(guān)聯(lián)的越多,排序越靠前。這種信息關(guān)聯(lián)在政府公開信息增值服務(wù)中是不是關(guān)鍵點(diǎn)?
王志庚:信息關(guān)聯(lián)是信息(知識(shí))服務(wù)中非常核心的內(nèi)容,分兩個(gè)層次,一個(gè)是文本層,一個(gè)是語義層,我們所說的信息關(guān)聯(lián),和搜索引擎提供的信息關(guān)聯(lián)有著本質(zhì)的區(qū)別,我們把他叫作語義分析,把信息本身放到上下文中,利用圖書館的人工或自動(dòng)的方法或模型測(cè)算出來,這一網(wǎng)頁或信息本身與他相關(guān)知識(shí)點(diǎn)是什么,這些知識(shí)點(diǎn)又會(huì)衍生出來為用戶推薦什么信息,這個(gè)往往具備搜索引擎所不具備的。搜索引擎會(huì)根據(jù)點(diǎn)擊量和流量,還有一個(gè)排名問題,我說的這個(gè)是一個(gè)語義上的關(guān)聯(lián),信息進(jìn)庫是孤立的,經(jīng)過增值處理,組織之后所有信息都是關(guān)聯(lián)的,一個(gè)新聞或網(wǎng)頁會(huì)成為一條線,一個(gè)線會(huì)帶一個(gè)面,一個(gè)面會(huì)沿展成一個(gè)立體。
國家圖書館正在建設(shè)的國家數(shù)字圖書館已經(jīng)籌建了若干中文語義服務(wù)的基礎(chǔ)設(shè)施。比如,我們的一個(gè)服務(wù)叫關(guān)鍵詞分配的技術(shù),任何信息符合端口可進(jìn)來,出去就是標(biāo)準(zhǔn)的東西出來,這是一種基礎(chǔ)服務(wù)。政府網(wǎng)站給關(guān)鍵詞的時(shí)候,你把你的文本放到國圖的箱子里,出去的時(shí)候就有國圖給你的若干個(gè)標(biāo)準(zhǔn)的關(guān)鍵詞,這個(gè)關(guān)鍵詞是全國統(tǒng)一的,這將是一個(gè)開放的網(wǎng)絡(luò)服務(wù),當(dāng)然還有很多,我們可以把這種知識(shí)服務(wù)稱為未來語義網(wǎng)絡(luò)的基礎(chǔ)設(shè)施。
筆者:您今天談到的兩點(diǎn),一個(gè)是打造政府信息的數(shù)字圖書館,另一個(gè)是建設(shè)語義網(wǎng)絡(luò)的基礎(chǔ)設(shè)施,無論從技術(shù)方面還是應(yīng)用方面我想都會(huì)給讀者很大的啟發(fā)。
王志庚:國圖將要與TRS合作的“國圖政府信息整合發(fā)布平臺(tái)”項(xiàng)目在國際上就沒有同行業(yè)在做,它是與網(wǎng)絡(luò)信息采集保存相關(guān),與信息整合服務(wù)、文本挖掘知識(shí)組合。我們圖書館人必須把政府信息整合服務(wù)作為圖書館價(jià)值再造和戰(zhàn)略發(fā)展的一個(gè)新領(lǐng)域,我們也有一個(gè)愿景:希望公眾找信息去圖書館,圖書館是一個(gè)可信賴的政府公開信息的收集者、組織者和增值服務(wù)者。