5月1日,醞釀已久、自去年4月5日公布的《政府信息公開條例》即將正式實施,自即日起,各級政府網站的政府信息公開目錄亦將正式上線。

  目前全國各類政府網站加起來有1.3萬家之多,光是這些政府網站信息公開目錄的搭建,就已經是一個總規(guī)模達數(shù)十億元的浩大工程。 

  國內一些市場研究機構發(fā)布的報告也顯示,到2010年,中國的電子政務市場將達到數(shù)千億以上。

  互聯(lián)網技術所引爆的全球信息化浪潮已經極大改變了全球商業(yè)格局,世界被碾平,競爭在加劇,一時間,中國企業(yè)像發(fā)現(xiàn)了新大陸一樣紛紛加入到長尾市場和商業(yè)藍海的角逐中,而語義互聯(lián)、人工智能、IPv6、NGN等網絡技術的演進,也為中國提供了一個二次崛起的歷史契機。然后,肇始于互聯(lián)網技術的信息化浪潮將多大程度上改變中國政治體制的樣貌,至今卻仍是一個謎。

  不過,有跡象顯示,這個謎團的揭開已經指日可待。5月1日,醞釀已久、自去年4月5日公布的《政府信息公開條例》(以下簡稱《條例》)即將正式實施,自即日起,各級政府網站的政府信息公開目錄亦將正式上線。無論是對比以往的信息屏蔽、尋租盛行,還是寄望于未來,以政府規(guī)章規(guī)格頒行的《條例》,都被人們視為中國繼《行政許可法》之后政府的“又一次自我革命”。

  信息公開時代浮現(xiàn)

  “信息公開的意義比電子政務的意義要大,沒有信息公開就沒有電子政務?!敝袊ù髮W法治政府研究院博士后研究員林鴻潮向本報記者表示,現(xiàn)有的信息管理不是保密不夠,而是公開不夠。我國現(xiàn)行的《保密法》,實施非常嚴格,但我國迄今還沒有一部“公開法”。

  的確是這樣。對一些政府部門來說,信息不僅意味著權力和利益,也意味著政績,因此各個部門大多對信息的公開謹小慎微,不肯輕易示人。

  信息的不對稱容易滋生政府官員的瀆職、濫用職權、政令不通等現(xiàn)象,數(shù)不勝數(shù)的腐敗案件都是暗箱操作的結果。比如,就衛(wèi)生部來說,2003年非典疫情,本質上就是由衛(wèi)生系統(tǒng)政府信息的公開不夠導致的,使得疫情信息沒有及時、準確地發(fā)布,甚至被故意屏蔽或歪曲、淡化。就教育部來說,目前假文憑、假學歷的泛濫,也是因為信息不公開所致,使很多用人單位對文憑的真實性將信將疑。

  然而,即將實施的《條例》將在多大程度上改變個別部門本應向民眾公布的信息私有化的做法,卻還是一個問題。據(jù)統(tǒng)計,截至目前全國已有200多家網站編制了信息公開目錄,但更多的政府網站則按兵不動。即使開設了相關頻道或欄目的網站,公開目錄的編制也存在明顯偏差。

  “目前各級政府所編制的政府信息公開目錄主要存在兩個問題:一是缺少一套全國統(tǒng)一的政府信息公開的標準,包括資源目錄體系、數(shù)據(jù)交換體系等;二是缺少一套科學的、可操作性強的評價體系。這兩套體系完備后,應用層面的問題基本就解決了。”北京拓爾思信息技術股份有限公司(以下簡稱TRS)市場部經理賀兆輝如此表示。

  難點與拐點

  構建政府新型信息公開體系,這樣一個革命性和顛覆性的系統(tǒng)工程,必然耗時耗力,也必然面臨各種意見分歧。

  比如,即將上線的政府信息公開目錄是基于各級政府現(xiàn)有的網站增設一個一級欄目,還是搭建一個專門的政府信息公開目錄網站平臺,或者二者同時并存?如果是單獨搭建平臺,則可能與各級政府部門的電子政務門戶形成兩張皮。并且,以往各級部委和各級政府在搭建電子政務平臺時已經投入了很多費用,另起爐灶單設信息公開平臺也會導致重復投入。

  另一個技術難點是,面對政府海量信息資源,如何進行有效快速的梳理和編目工作,為此,就需要一套根據(jù)語法、語義等規(guī)則對信息進行抽取和分類,進而滿足從主題、應用等多個角度對政府信息資源進行管理、識別、定位、發(fā)現(xiàn)、評估與選擇的工具。

  據(jù)悉,全國政府信息公開工作的主管部門很早就意識到了上述問題。今年1月,政府信息公開工作主管部門還特別召集全國各高校信息資源編目專家以及各部門代表成立了政府信息公開研究小組,討論政府信息公開目錄的可行性,其中就包括討論應該訂哪些元數(shù)據(jù),哪些類目體系。在考察了包括TRS等廠商在內的國內搜索和文本挖掘技術之后,研究小組此前對政府信息公開目錄在技術可行性上的疑慮最終渙然冰釋。

  解密政府信息公開目錄

  賀兆輝告訴記者,要搭建政府信息公開目錄,有幾個核心的技術體系不可或缺。

  首先是文本智能技術。文本智能有兩塊。一塊是元數(shù)據(jù)和內容概要的抽取,這個技術不是提取關鍵詞那樣簡單,而是需要把信息中的元數(shù)據(jù)和關鍵信息塊精準地抽取出來。元數(shù)據(jù)和信息塊抽取出來后,還要用語義分析技術判斷信息塊與文本的相關性,使得內容概要能夠準確表達每條信息的主要內容,元數(shù)據(jù)能夠準確描述每條信息的基本屬性,這方面TRS的文本挖掘技術起了主要作用。

  “目前針對于互聯(lián)網信息的智能處理技術還很不理想,是因為普通互聯(lián)網上的信息太雜了,智能抽取不太現(xiàn)實,而政府公開信息則有著一定的規(guī)則性,可以用條條框框去規(guī)約,這樣規(guī)則抽取就發(fā)揮作用了。但是,只是采用規(guī)則抽取效果不一定好,必須結合語義分析。”賀兆輝介紹說。

  其次是自動分類技術。政府部門的編目體系一級已經有21個欄目,二級更多達150個欄目,要把這么海量的文章自動匹配,并分到每個目錄下,不僅要做到智能抽取,還要能夠進行自動分類。這樣,分類后的內容到了目錄庫以后,才可以進行全文檢索。據(jù)了解,TRS的全文檢索在全國部委以上政府網站的使用率達70%以上。

  “文本智能技術是編目體系的關鍵點,有了這個技術還不夠,還要加上知識庫,這個系統(tǒng)才能‘活’。TRS在很多領域積累了龐大的后臺支持庫儲備,憑著這些儲備,TRS有信心拿出一個相當成熟的政府信息公開目錄解決方案?!?/p>

  TRS高級研發(fā)工程師孫麗華表示,盡管目前對如何編制目錄體系仍然存在一些分歧,但規(guī)則+語義分析+知識庫三者融合的技術路線,已經提供了一個接近完美的解決方案。

  記者了解到,目前國內外一些IT廠商如IBM等也正在研究文本智能技術在政府信息公開目錄中的應用問題。

  商機與轉機

  顯而易見,政府信息公開目錄的上線,將給信息化服務提供商帶來巨大的商業(yè)機會。目前,全國各類政府網站加起來有1.3萬家之多,光是這些政府網站信息公開目錄的搭建,就已經是一個總規(guī)模達數(shù)十億元的浩大工程。國內一些市場研究機構發(fā)布的報告也顯示,到2010年,中國的電子政務市場將達到數(shù)千億以上,信息公開相關應用系統(tǒng)的建設將是其中的核心。盡管目前還只有TRS一家發(fā)布了政府信息公開目錄服務平臺解決方案,但更多的信息化解決方案提供商仍有巨大的市場空間,如萬方數(shù)據(jù)、航天四創(chuàng)、今日投資、富士通等等。

  公開信息顯示,到2010年,覆蓋全國的、統(tǒng)一的電子政務網絡將基本建成,屆時政府網站目錄體系與交換體系、信息安全基礎設施將初步建立,重點應用系統(tǒng)將實現(xiàn)互聯(lián)互通,政務信息資源公開和共享機制將初步建立,50%以上的行政許可項目將能夠實現(xiàn)在線處理。到那時,中國將真正進入信息公開時代。

責任編輯:admin