一、導(dǎo)言

 
  政府信息資源是一切產(chǎn)生于政府內(nèi)部或雖然產(chǎn)生于政府外部但對(duì)政府活動(dòng)有影響的信息資源的統(tǒng)稱(chēng)。由于政府總以某種方式與人們的工作和生活的每一方面直接或間接相聯(lián)系,因此,政府信息資源的總量常常多得驚人,甚至達(dá)到無(wú)法計(jì)數(shù)的地步。據(jù)統(tǒng)計(jì),目前各級(jí)政府部門(mén)大約集聚了全社會(huì)信息資源總量的80%。這些信息資源常常比一般的信息資源更有價(jià)值,其質(zhì)量和可信度也較高,并且直接關(guān)系到國(guó)民經(jīng)濟(jì)與社會(huì)發(fā)展的狀況和水平。如何加強(qiáng)管理、綜合開(kāi)發(fā)和有效利用這些資源已經(jīng)成為各級(jí)政府工作的當(dāng)務(wù)之急,也是一個(gè)值得研究和探討的新領(lǐng)域。
 
  二、研究現(xiàn)狀
 
 ?、眹?guó)外政府信息資源定位服務(wù)由于元數(shù)據(jù)能夠處理各種形式的信息,包括數(shù)字化及非數(shù)字化的信息,特別是能較好地解決網(wǎng)絡(luò)信息的發(fā)現(xiàn)、控制和管理問(wèn)題,因此,目前在國(guó)際上已廣泛應(yīng)用在包括政府信息、博物館藏品、檔案等各種類(lèi)型的信息中。目前政府信息的元數(shù)據(jù)格式主要有兩種:政府信息指引服務(wù)(Government I Locater Service,GILS)及都柏林核心元 數(shù)據(jù)集(Dublin Core,DC)。其中依照GIL 發(fā)展指引服務(wù)的國(guó)家較多,包括美國(guó)、 加拿大、日本、俄羅斯等;以Dublin 為構(gòu)建系統(tǒng)標(biāo)準(zhǔn)的有澳大利亞。在系統(tǒng) 規(guī)格方面,主要遵循Z39.50(信息檢索 應(yīng)用服務(wù)定義和協(xié)議規(guī)范,1996年被 ISO正式確定為信息檢索的國(guó)際標(biāo)準(zhǔn)) 的信息檢索標(biāo)準(zhǔn),可跨資料庫(kù)、跨機(jī)構(gòu) 組織,甚至跨國(guó)界,以單一檢索界面檢 索所需的政府信息資源,使政府信息資 源的共享朝著全球一體化的方向發(fā)展。 美國(guó)等發(fā)達(dá)國(guó)家從20世紀(jì)70-80年 代就開(kāi)始研究和出臺(tái)了一系列管理政策,對(duì)政府信息資源進(jìn)行管理。為了整合政府的公共信息資源,為公眾提供單一窗口的政府信息導(dǎo)航、檢索與定位服務(wù),1994年12月,美國(guó)商務(wù)部將政府信息定位服務(wù)GILS計(jì)劃作為聯(lián)邦政府信息處理標(biāo)準(zhǔn)(FIPS 192)頒發(fā),公布正式建立GILS政府信息定位服務(wù)。此公告要求所有政府機(jī)構(gòu)必須實(shí)行GILS檢索系統(tǒng)的使用。美國(guó)將GILS作為政府信息基礎(chǔ)設(shè)施的核心組成部分進(jìn)行建設(shè)。
 
  ⒉我國(guó)政務(wù)信息資源目錄體系建設(shè)
 
  為充分發(fā)揮信息資源開(kāi)發(fā)利用在信息化建設(shè)中的重要作用,《中共中央辦公廳國(guó)務(wù)院辦公廳關(guān)于加強(qiáng)信息資源開(kāi)發(fā)利用工作的若干意見(jiàn)》(中辦發(fā)[2004Core34號(hào))、《國(guó)家信息化領(lǐng)導(dǎo)小組關(guān)于我國(guó)電子政務(wù)建設(shè)指導(dǎo)意見(jiàn)》(中辦發(fā)[200217號(hào))兩個(gè)文件中都明確提出了建設(shè)政務(wù)信息資源目錄體系的任務(wù)。為貫徹文件精神,加快政務(wù)信息資源開(kāi)發(fā)利用建設(shè),解決政府部門(mén)間信息資源的查詢(xún)和共享,促進(jìn)跨行業(yè)、跨部門(mén)、跨地區(qū)的互連互通,國(guó)務(wù)院信息化工作辦公室組織相關(guān)部門(mén)編寫(xiě)了政務(wù)信息資源目錄體系標(biāo)準(zhǔn)。國(guó)家電子政務(wù)標(biāo)準(zhǔn)化總體組于2004年11月組建了政務(wù)信息資源目錄體系與交換體系標(biāo)準(zhǔn)編寫(xiě)組,積極開(kāi)展該標(biāo)準(zhǔn)編寫(xiě)工作,并廣泛、認(rèn)真地征求專(zhuān)家、部委、地方各方面的意見(jiàn)和建議,對(duì)該標(biāo)準(zhǔn)予以反復(fù)修改,最終形成了政務(wù)信息資源目錄體系與交換體系》標(biāo)準(zhǔn)征求意見(jiàn)稿。國(guó)家標(biāo)準(zhǔn)委2005年8月正式批準(zhǔn)成立了政務(wù)信息資源目錄體系與交換體系標(biāo)準(zhǔn)工作組,并于9月底召開(kāi)了該工作組會(huì)議,通過(guò)了該標(biāo)準(zhǔn)的征求意見(jiàn)稿。
 
  《政務(wù)信息資源目錄體系與交換體系》中將政務(wù)信息資源目錄體系定為:采集、存儲(chǔ)、使用和管理政務(wù)信資源目錄內(nèi)容,通過(guò)元數(shù)據(jù)信息的定位和發(fā)現(xiàn),實(shí)現(xiàn)政務(wù)信息資源共享的統(tǒng)。從實(shí)踐意義上看,建設(shè)政務(wù)信息源目錄體系,就是要對(duì)部門(mén)間政務(wù)信資源進(jìn)行梳理和整合,進(jìn)行分級(jí)、分點(diǎn)、分布式的組織和管理。它體現(xiàn)了種政務(wù)資源的內(nèi)在關(guān)聯(lián),是信息資源享和服務(wù)的一套工具;是方便信息資檢索、定位和共享的應(yīng)用服務(wù)體系。
 
  三、關(guān)鍵技術(shù)研究
 
 ?、痹獢?shù)據(jù)抽取技術(shù)
 

  政務(wù)信息資源目錄體系中元數(shù)據(jù)式,將遵循國(guó)家《政務(wù)信息資源目錄系》標(biāo)準(zhǔn)中的核心元數(shù)據(jù)標(biāo)準(zhǔn)。元數(shù)抽取技術(shù)是指從Web頁(yè)面等格式化態(tài)的政務(wù)信息資源中,依照某一元數(shù)標(biāo)準(zhǔn),自動(dòng)生產(chǎn)元數(shù)據(jù)的技術(shù)。元數(shù)抽取基于采集系統(tǒng)和存儲(chǔ)系統(tǒng)實(shí)現(xiàn),其原理如圖1所示。

image.png

 
 ?、挪杉到y(tǒng)
 
  采集系統(tǒng)針對(duì)一個(gè)專(zhuān)題,分以下步進(jìn)行數(shù)據(jù)采集:
 
  ——利用搜索引擎,對(duì)設(shè)定的專(zhuān)進(jìn)行泛搜索,確定探索的范圍;
 
  ——利用網(wǎng)絡(luò)蜘蛛,在確定的探索范圍內(nèi)進(jìn)行泛探索,探尋可能有價(jià)值站點(diǎn)
 
  ——對(duì)有價(jià)值的信息源進(jìn)行監(jiān)視,定時(shí)捕獲更新的內(nèi)容;
 
  ——數(shù)據(jù)清洗,對(duì)捕獲的內(nèi)容進(jìn)行清洗,只保留關(guān)注的有價(jià)值的信息。
 
 ?、拼鎯?chǔ)系統(tǒng)
 
  存儲(chǔ)系統(tǒng)把捕獲的Web頁(yè)面分解為元數(shù)據(jù),并對(duì)其分類(lèi)保存。在這里,存儲(chǔ)的概念不僅是把數(shù)據(jù)放到數(shù)據(jù)庫(kù)或者保存到硬盤(pán)上,更重要的是根據(jù)一定的目錄體系標(biāo)準(zhǔn),把數(shù)據(jù)分解為元數(shù)據(jù),然后進(jìn)行存儲(chǔ)。
 
  ⒉元數(shù)據(jù)管理技術(shù)
 
  政務(wù)信息資源目錄體系中元數(shù)據(jù)的管理包括元數(shù)據(jù)的命名、發(fā)布和訪(fǎng)問(wèn),并為用戶(hù)提供統(tǒng)一的訪(fǎng)問(wèn)接口。目錄體系中的所有元數(shù)據(jù)構(gòu)成元數(shù)據(jù)目錄。在元數(shù)據(jù)目錄中,采用統(tǒng)一的結(jié)構(gòu)來(lái)描述元數(shù)據(jù),并提供訪(fǎng)問(wèn)API(Applicat Programming Interface,應(yīng)用程序接口),通過(guò)API可以插入、更新、刪除、查詢(xún)目錄中的數(shù)據(jù)。它為元數(shù)據(jù)目錄提供統(tǒng)一的邏輯視圖,實(shí)際的元數(shù)據(jù)目錄可以是多個(gè)異構(gòu)的、分布式的副本的目錄。
 
  《政務(wù)信息資源目錄體系》標(biāo)準(zhǔn)中對(duì)于元數(shù)據(jù)的命名規(guī)則、編碼方式以及目錄接口API等技術(shù)要求都有明確描述,在實(shí)現(xiàn)中只要嚴(yán)格遵循這些描述即可。
 
  ⒊目錄服務(wù)技術(shù)
 
  在現(xiàn)實(shí)應(yīng)用中,目錄服務(wù)被賦予兩種范圍的含義。其一是較為含混的:任何一個(gè)提供分布的用戶(hù)命名管理的系統(tǒng) 服務(wù)都被冠以目錄服務(wù)的名稱(chēng)。例如Email系統(tǒng)中的用戶(hù)帳號(hào)管理系統(tǒng),NTDomain管理系統(tǒng)等。另一個(gè)較為嚴(yán)格:目錄服務(wù)被定義成基于X.500系列建議的基于分布網(wǎng)絡(luò)信息處理的、有層次結(jié)構(gòu)的目標(biāo)管理體系。例如,Novell公司的Novell目錄服務(wù)(NDS),基于LDAP(Lightweight Directory ACC輕量級(jí)目錄訪(fǎng)問(wèn)協(xié)議)的Internet目錄訪(fǎng)問(wèn)服務(wù),等等。目前,人們基本采用后者的定義來(lái)判斷一種服務(wù)是否為目錄服務(wù)。
 
  目錄服務(wù)提供元數(shù)據(jù)目錄的統(tǒng)一邏輯視圖,實(shí)現(xiàn)單一系統(tǒng)映像。在實(shí)際應(yīng)用中,元數(shù)據(jù)目錄可以采用分布式存儲(chǔ),每個(gè)管理域可以設(shè)置一個(gè)元數(shù)據(jù)目錄。政務(wù)信息資源目錄體系的所有服務(wù)都使用元數(shù)據(jù)目錄中存儲(chǔ)的信息,并通過(guò)目錄服務(wù)協(xié)議訪(fǎng)問(wèn)元數(shù)據(jù)。應(yīng)用程序的其它服務(wù)在使用元數(shù)據(jù)信息時(shí),通過(guò)元目錄服務(wù)協(xié)議訪(fǎng)問(wèn)元數(shù)據(jù)。各服務(wù)之間需要通過(guò)軟件進(jìn)行相互協(xié)同。異構(gòu)形式的網(wǎng)絡(luò)應(yīng)用,如Email、數(shù)據(jù)庫(kù)服務(wù)、Internet/Intranet訪(fǎng)問(wèn)等,采用同構(gòu)的目錄服務(wù)。多種應(yīng)用共享一套資源信息,避免了管理上的重復(fù)操作和多系統(tǒng)間的不協(xié)調(diào),提高了應(yīng)用系統(tǒng)的身份驗(yàn)證安全等級(jí),降低了管理的復(fù)雜度,也方便了用戶(hù)的使用(參見(jiàn)圖2)。

 image.png 

  基于LDAP實(shí)現(xiàn)的政務(wù)信息資源目錄體系,可順利地訪(fǎng)問(wèn)所有授權(quán)的網(wǎng)絡(luò)資源。具有能在單臺(tái)服務(wù)器或全球多服務(wù)器網(wǎng)絡(luò)上管理所有網(wǎng)絡(luò)資源的強(qiáng)大功能,是一種跨平臺(tái)、跨地域的目錄服務(wù),且在不同的服務(wù)器上只需登錄一次,就可享受到政務(wù)信息資源目錄體系的服務(wù)。
 
  四、系統(tǒng)設(shè)計(jì)實(shí)現(xiàn)
 
 ?、斌w系框架
 
  政務(wù)信息資源目錄體系框架由信息庫(kù)系統(tǒng)、標(biāo)準(zhǔn)規(guī)范、技術(shù)支撐平臺(tái)、管理機(jī)制和服務(wù)模式構(gòu)成。目錄體系建設(shè)和使用過(guò)程中存在三類(lèi)角色:信息提供者、信息使用者和目錄信息管理者,信息提供者確保編目信息的正確性和實(shí)時(shí)性,信息管理者負(fù)責(zé)目錄信息的管理、安全、服務(wù)(參見(jiàn)圖3)。

 image.png

  ⒉系統(tǒng)架構(gòu)
 

  目錄體系分為國(guó)家目錄中心、省級(jí)目錄中心、地市目錄中心和縣級(jí)目錄中心四級(jí)。目錄中心是獨(dú)立或托管的平臺(tái)系統(tǒng)(參見(jiàn)圖4)。在國(guó)家目錄中心建立一個(gè)統(tǒng)一的全國(guó)各目錄中心網(wǎng)絡(luò)地址表,各級(jí)目錄中心能夠獲得全國(guó)各地的目錄中心網(wǎng)絡(luò)地址,實(shí)現(xiàn)各級(jí)目錄中心跨地區(qū)的目錄中心訪(fǎng)問(wèn)。各目錄中心為同級(jí)各部門(mén)建立固定的目錄區(qū)域。各部門(mén)需要進(jìn)行一次確定身份的登錄注冊(cè)。每個(gè)部門(mén)負(fù)責(zé)維護(hù)目錄中心的各自的部門(mén)資源服務(wù)目錄及資源目錄。

image.png 

  ⒊技術(shù)架構(gòu)
 
  政務(wù)信息資源目錄體系從技術(shù)架構(gòu)角度劃分為四個(gè)系統(tǒng):編目系統(tǒng)、目錄報(bào)送系統(tǒng)、目錄管理系統(tǒng)和目錄服務(wù)系統(tǒng),如圖5所示。

image.png  

 ?、啪幠肯到y(tǒng)
 
  基于核心元數(shù)據(jù)標(biāo)準(zhǔn)開(kāi)發(fā)的元數(shù)據(jù)生成工具,從不同形態(tài)的政務(wù)信息資源中,抽取出元數(shù)據(jù),生成目錄。其主要功能如下:
 
  ——元數(shù)據(jù)生成:針對(duì)已有目錄,采用轉(zhuǎn)換方式生成元數(shù)據(jù);針對(duì)網(wǎng)頁(yè)、數(shù)據(jù)庫(kù)、電子文件,采用自動(dòng)抽取的方式生成元數(shù)據(jù);針對(duì)其他資源,也可利用手工方式進(jìn)行元數(shù)據(jù)錄入。
 
  ——資源編碼:使用資源編碼的前段碼并賦予后段碼,生成資源ID。
 
  ——資源分類(lèi):對(duì)政務(wù)資源進(jìn)行分類(lèi),以自動(dòng)為主,以手工為輔。
 
  ⑵目錄報(bào)送系統(tǒng)
 
  政務(wù)信息資源目錄體系利用電子政務(wù)專(zhuān)網(wǎng)實(shí)現(xiàn)元數(shù)據(jù)報(bào)送。數(shù)據(jù)報(bào)送系統(tǒng)的功能主要將各部門(mén)前置機(jī)的元數(shù)據(jù)報(bào)送到所對(duì)應(yīng)的目錄服務(wù)中心。
 
 ?、悄夸浌芾硐到y(tǒng)
 
  目錄管理系統(tǒng)包括數(shù)據(jù)互訪(fǎng)平臺(tái)、元數(shù)據(jù)管理平臺(tái)和系統(tǒng)管理平臺(tái)。通過(guò)各平臺(tái)實(shí)現(xiàn)對(duì)目錄數(shù)據(jù)服務(wù)的集中管理。它們各自的主要功能如下:
 
  ——數(shù)據(jù)互訪(fǎng)平臺(tái):構(gòu)筑一個(gè)抽象層的數(shù)據(jù)服務(wù)平臺(tái),構(gòu)筑邏輯上集中,物理上分散的虛擬數(shù)據(jù)庫(kù),并按照標(biāo)準(zhǔn)來(lái)對(duì)外提供目錄數(shù)據(jù)發(fā)布和目錄數(shù)據(jù)注冊(cè)服務(wù)。
 
  ——元數(shù)據(jù)管理平臺(tái):用于管理元數(shù)據(jù)的注冊(cè)、更新、刪除,并擔(dān)負(fù)元數(shù)據(jù)有效性檢查的工作。
 
  ——系統(tǒng)管理平臺(tái):提供了數(shù)據(jù)庫(kù)系統(tǒng)和接口組件服務(wù)器的配置,數(shù)據(jù)的備份、遷移、認(rèn)證,用戶(hù)管理等功能,是提高系統(tǒng)運(yùn)行可靠性和提高系統(tǒng)可維護(hù)性的關(guān)鍵。
 
 ?、饶夸浄?wù)系統(tǒng)
 
  發(fā)布系統(tǒng)通過(guò)發(fā)布與查詢(xún)服務(wù)器將元數(shù)據(jù)按照多種分類(lèi)方式發(fā)布到政務(wù)目錄中心網(wǎng)站,供使用者進(jìn)行瀏覽、查詢(xún)。發(fā)布方式依據(jù)資源分類(lèi)標(biāo)準(zhǔn),在Web頁(yè)面展現(xiàn)數(shù)據(jù),并以多種查詢(xún)方式向用戶(hù)提供目錄服務(wù)。
 
  五、結(jié)束語(yǔ)
 
  政務(wù)信息資源目錄體系建設(shè)是一項(xiàng)長(zhǎng)期、細(xì)致、復(fù)雜的工作,同時(shí)是信息時(shí)代一項(xiàng)嶄新的課題,其涉及的范圍廣、部門(mén)多。因此在其具體建設(shè)實(shí)施時(shí)必須遵循國(guó)家制定的相關(guān)標(biāo)準(zhǔn)和規(guī)范,將不同種類(lèi)信息資源進(jìn)行統(tǒng)一描述,并根據(jù)應(yīng)用需求建立各種目錄分類(lèi)方法,為存放分散、種類(lèi)繁多的政務(wù)信息資源提供檢索和導(dǎo)航服務(wù)。政務(wù)信息資源目錄體系的逐漸完善,必將促進(jìn)對(duì)政務(wù)信息資源的進(jìn)一步開(kāi)發(fā)和利用。
責(zé)任編輯:admin