從“網(wǎng)絡數(shù)據(jù)可管理”走到“網(wǎng)絡數(shù)據(jù)已被管理”,是網(wǎng)絡架構形式到網(wǎng)絡內容管理的全新轉變。在大型企業(yè)網(wǎng)內部,特別是那些網(wǎng)絡信息更新較快、信息化程度較高的企業(yè),選擇一個行之有效的解決方案,將企業(yè)內部資源整合、細分、歸類,乃至動態(tài)分析,已經(jīng)成為提高工作效能、降低運維和溝通成本的最大訴求。
網(wǎng)絡信息的膨脹,使得數(shù)據(jù)管理問題日漸嚴峻。盡管互聯(lián)網(wǎng)數(shù)據(jù)仍然無序,但是大型企業(yè)網(wǎng)數(shù)據(jù),已經(jīng)能夠走向有序性。企業(yè)搜索引擎,這一類正在崛起的方案和市場,使得企業(yè)網(wǎng)數(shù)據(jù)有序化的轉型得以實現(xiàn)。
遺憾的是,基于傳統(tǒng)網(wǎng)絡結構的搜索引擎和搜索工具,并不能解決企業(yè)客戶在應對內部信息尋找和整合時的需求。為了讓企業(yè)用戶更多地了解企業(yè)搜索技術,了解企業(yè)搜索引擎帶來的價值,同時,也讓產品設計商和開發(fā)商能夠更接近用戶的需求,從而更快推動企業(yè)搜索市場的發(fā)展,《計算機世界》舉辦“2006年企業(yè)搜索市場熱點研討會”,專業(yè)企業(yè)搜索提供商、資深分析師、行業(yè)典型用戶,第三方專家,話題直指企業(yè)搜索市場應用及趨勢。
大部分企業(yè)的內部網(wǎng)數(shù)據(jù),正在以每年200%的速度增長,其中,有80%的數(shù)據(jù),以各種文檔文件、郵件和圖片等非結構化形式,散落于企業(yè)內計算機系統(tǒng)中的各個角落,而這些數(shù)據(jù)總量遠遠超過了互聯(lián)網(wǎng)上信息的總量。
《計算機世界》報副總編輯 林潤華:首先,很高興能夠邀請到各位專家參與到這次關于“企業(yè)搜索”的討論中來。一段時間以來,我們在密切關注企業(yè)內部搜索的相關技術、市場、需求,以及產品,或者說,我們在關注“知識化搜索引擎”的問題。
對于企業(yè)而言,數(shù)據(jù)管理的難度,不是隨著數(shù)據(jù)增加量成倍數(shù)增加,而是呈指數(shù)增加。根據(jù)我們的觀察,互聯(lián)網(wǎng)搜索技術對于企業(yè)內部數(shù)據(jù)而言,局限性大,有時甚至不能起到作用。我們考慮,通過對“企業(yè)搜索工具及價值”的關注和討論,讓更多的人,特別是企業(yè)用戶,更了解企業(yè)搜索的特性,特別是和傳統(tǒng)互聯(lián)網(wǎng)搜索觀念不一樣的地方。
我們也在想,如果在一個企業(yè)或者很多企業(yè)當中,或者在政府部門當中,采用企業(yè)或者智能化的搜索技術,會不會給企業(yè)內部辦公效率的提高帶來直接明顯的變化?建立一個知識化的內部網(wǎng)絡,以及其上的知識化企業(yè),能夠給企業(yè)發(fā)展和競爭力帶來多大的好處?
需求足夠強烈
與此同時,已經(jīng)有調查數(shù)據(jù)顯示,企業(yè)發(fā)布到互聯(lián)網(wǎng)上的數(shù)據(jù),只占企業(yè)有效信息總量的1%~2%。有超過98%的數(shù)據(jù)存儲在企業(yè)內部。面對如此不成比例的數(shù)據(jù)量,專業(yè)企業(yè)搜索市場的未來預期相當龐大,然而,企業(yè)對內部數(shù)據(jù)的認識,大多仍然停留在“很重要,但是不知道如何讓重要變得必要”的階段?,F(xiàn)階段企業(yè)用戶對企業(yè)搜索技術的了解究竟有多少?企業(yè)搜索的解決方案提供商,是否真的時時刻刻在考慮更加貼近用戶的需求?
首都之窗運行管理中心技術總監(jiān) 王喆:從外在看,首都之窗是政府的門戶網(wǎng)站,主要的任務是傳達政府的相關信息。從內部看,首都之窗是一個圍繞政府信息的大數(shù)據(jù)庫。我們也一直在考慮搜索的問題。2003年我們跟百度談了一個項目,百度想賣一個搜索引擎給首都之窗,但是我覺得搜索引擎對首都之窗而言意義不大。后來的項目中,我們要求百度做了ASP服務,但到目前效果都不是太好,這也可能也跟百度本身側重點有關系。
政府網(wǎng)站的應用本身跟其他網(wǎng)站的搜索引擎有一些不同。政府網(wǎng)站有一個“群”的概念,有點像大的總公司和一大群小分公司的感覺,政府門戶有的時候更像垂直門戶,網(wǎng)民到我這兒搜的不是娛樂性的東西,可能更關注于某一方面的、集中度更高的信息。
對于企業(yè)搜索引擎的需求,首都之窗是很明顯的。例如首都之窗的“北京市投訴熱線”,作為北京市所有市民都可以使用的網(wǎng)上投訴平臺,這個系統(tǒng)是向公眾開放的。由于這個機制很方便,各種投訴量相當高,系統(tǒng)本身效果不錯,但首都之窗希望能有一個產品,從大量的信件里面收集和整理出來一些輔助領導決策的信息來。比如最近一段時間,老百姓對什么樣的東西最熱衷,或者什么樣的東西影響將來市領導的決策等,領導做決策的依據(jù)越多,所做出決策速度和準確度就越高。
政府里面的資源真是多得不得了,我去政府各個部門調研,看到各類信息資源白白的閑置著覺得特別可惜,但是確實是出于安全問題,不能隨意訪問。這就需要人工整理分類,然而政府部門公務員是有限的。必須有一個手段,高效又安全的共享一些有用的信息。其實從我們角度上來講,關鍵的并不是能不能實現(xiàn)一個網(wǎng)群搜索,而是能不能把我們資源整合起來提供出去。
北京交通大學網(wǎng)絡信息中心主任 賈卓生:企業(yè)搜索的需求是明顯存在的,這種需求不僅是政府比較多,高等學府更是突出。以學校為例,互聯(lián)網(wǎng)上搜索引擎搜索出來的東西,很多是對教授和學生沒有太大幫助的。我們學校每年都要花二三百萬購買幾十個數(shù)據(jù)庫資料,信息量非常大,但是到目前卻沒有一個有效的搜索系統(tǒng),這樣老師要花很長的時間查找資料。而且各學校、各部門的系統(tǒng)中的都有很多的教學資料、課件、教案、書籍等資源,沒有方便地統(tǒng)計和歸類系統(tǒng),這些信息也就混亂無序,學生沒有辦法把這些資料搜集出來。企業(yè)搜索工具和它們提供的方案,可能能夠解決這個問題。
但是我要強調的是,教育界更加需要企業(yè)級搜索的可能是中小學。我參加過北京市中小學專家整體方案的監(jiān)督工作,各種方案的驗收我都參加了,有一些中小學重復建設太多?,F(xiàn)在大學都聯(lián)網(wǎng)了,可以互相訪問,而中小學還是比較分散的,又沒有互聯(lián),學科重復建設比較多,如果能在各中小學中使用企業(yè)搜索,使得資源能夠共享,那就太好了。
產品不能孤立
應對用戶需求,以及或隱或現(xiàn)的龐大市場,企業(yè)搜索方案提供商們一方面期待良多,一方面也不無思慮。如何能為企業(yè)客戶創(chuàng)造出真正的價值,而不是僅僅畫餅充饑?如何為企業(yè)搜索提供全面的解決之道,而不是僅僅提供一個搜索工具?更進一步,如何企業(yè)搜索和最終的企業(yè)效能提速有機整合起來,而不僅僅是作為一個遙遠的方向?不同產品提供商,有各自的不同考慮和觀點。
北京拓爾思(TRS)信息技術有限公司市場部經(jīng)理何東炯:這需要對照國內外的情況來看,TRS是國內做企業(yè)搜索引擎最早的公司,也是在這個領域專注的公司,我們已經(jīng)發(fā)現(xiàn)了一些問題。例如在國外,和企業(yè)內網(wǎng)數(shù)據(jù)相關的設計,往往由咨詢顧問公司完成,有專門的數(shù)據(jù)設計和管理架構隊伍來做應用;但是在國內,我們甚至找不到合適的顧問和實施隊伍。這樣帶來的第一個問題就是,概念普及上要緩慢得多。如果一個工作,做的人那么少,那么能夠得到推廣的機會就會少很多。很多情況下,不是企業(yè)不重視網(wǎng)內數(shù)據(jù),而是它們還不知道內網(wǎng)數(shù)據(jù)的管理可以做到系統(tǒng)化、知識化。
搜索產品市場的現(xiàn)狀,和數(shù)據(jù)庫市場不一樣,后者已經(jīng)經(jīng)過長時間普及教育,企業(yè)已經(jīng)普遍認識到其重要性,而且圍繞數(shù)據(jù)庫軟件設計開發(fā)有大量的從業(yè)人員,而搜索產品市場目前仍然還處于推廣期,這個期間有多長,并不僅僅取決于我們廠商多努力,而取決于整個產業(yè)環(huán)境,從政府到媒體、從參與者的數(shù)量到企業(yè)內網(wǎng)的成熟度等。
對于企業(yè)搜索這種專業(yè)細分的行業(yè)市場,缺乏咨詢人才是當前的一個重要問題,產業(yè)鏈上沒有單獨的咨詢顧問環(huán)節(jié),往往廠商既做咨詢又做實施,國外廠商不是這樣“玩”的,這樣做的效果也很難最優(yōu)化。
北京賽金傳媒科技有限公司首席運營官陳一宏:TRS的考慮是正確的,其實這也是我們的重點關注問題。我想要補充的一點是,軟件方案,應當盡量實現(xiàn)聯(lián)動,這樣才能使價值得到提升,企業(yè)搜索引擎也一樣。一定要能夠和現(xiàn)有網(wǎng)絡的內部系統(tǒng)結合起來。這方面可以看一看IBM,它們的思路之一,就是將軟件和企業(yè)內網(wǎng)的其他各種應用相結合,例如將呼叫系統(tǒng)和調度系統(tǒng)結合起來,和數(shù)據(jù)庫結合起來,這些才是它的關鍵競爭力。IBM的用武之地,不是單獨的軟件開發(fā),而是軟件的相互嵌入和整合。
要考慮“漢語特征”
針對企業(yè)搜索引擎應用的思路,可以充滿公立的關懷特征,甚至不帶任何企業(yè)的標簽。但是在產品形態(tài)和功能實現(xiàn)上,不同的企業(yè)必然有自身的特征和定位,而客戶又將如何選擇?
TRS公司產品經(jīng)理賀兆輝:或許我更適合談一談這方面的情況。其實產品的本質就是為了解決問題,這方面我確實也有些感想。
在最近我接觸的客戶中,已經(jīng)有一些認識到企業(yè)搜索引擎中蘊藏巨大能量了,例如海爾、索尼,它們都是從業(yè)務角度出發(fā)去考慮問題,考慮得很詳細、很深刻。還有,無論是企業(yè)間的知識共享,還是商業(yè)數(shù)據(jù)庫的相互合作,在國內的需求和趨勢都是明顯的。企業(yè)搜索工具,不僅要能夠實現(xiàn)互聯(lián)網(wǎng)信息的優(yōu)化搜索,還應當能夠真正地搞清楚企業(yè)內部數(shù)據(jù)的整合工作如何進行,并加以實現(xiàn)。
也有一些廠商提到,它們可以做這個、可以做那個,但是最終的結果呢,還 是互聯(lián)網(wǎng)的那一套,其實這不是很好,會給這個新興行業(yè)的發(fā)展造成不利影響。在研討會上談企業(yè)自己的產品,可能不太合適,我想強調的一點是,現(xiàn)在進入國內的國外企業(yè)搜索產品,都有一個根本性的問題,就是中文處理瓶頸。對中文的識別和處理,可以說是國內企業(yè)網(wǎng)內數(shù)據(jù)管理的根本性特征之一,針對這種特征,用國外產品加入漢化,或者使用漢化插件,并不能解決根本性問題。企業(yè)搜索不單單是產品的問題,本身還是個綜合解決方案,是一個整體性方案的全面整合。我可以舉一個最簡單的例子,“乒乓球拍賣”這個詞的檢索和理解上,就可以看出TRS和國外產品之間的不同,在中文處理方面的大量積累,是TRS的優(yōu)勢,而這點國外廠商顯然還不能適應。
何東炯:企業(yè)搜索的數(shù)據(jù)量與互聯(lián)網(wǎng)不一樣,用戶對企業(yè)搜索的要求更高,這就要求信息檢索要更精確、更全面。信息異構性的整合和信息安全管理也是我們一直思考的問題。在TRS產品的構建過程中,企業(yè)原來管理系統(tǒng)、業(yè)務系統(tǒng)包括內部組織結構的規(guī)劃,以及多級安全的措施,都必須給予充分的考慮。
還有一個更重要的問題是,很多人認為企業(yè)搜索就是購買產品、集成到現(xiàn)有系統(tǒng)中就完了,但這不是正確的思路。雖然TRS是一個企業(yè)搜索方案提供商,按照商業(yè)合同部署產品并且保證上線就可以了,但是我們還是一直在呼吁客戶要重視,企業(yè)搜索不是終點,不是將所有信息匯集起來就行了,一定要深挖其價值,這才是搜索的目標所在。企業(yè)搜索出來的信息,可以提供給領導作為決策輔助,或者提供給市場人員做營銷分析,甚至可以提供給企業(yè)戰(zhàn)略發(fā)展作為金融情報和戰(zhàn)略指導,企業(yè)應當分析自身的搜索信息目的,以便于尋求適合的企業(yè)搜索廠商,通過企業(yè)搜索把信息整合起來,挖掘信息的價值。
陳一宏:經(jīng)常有一個誤導,把搜索和知識管理混為一談。由于概念的誤導,使用戶對企業(yè)產品要求過高,那帶來的結果是什么?就是失望。使用不可能實現(xiàn)過高的期望的產品,用戶就會發(fā)現(xiàn)這兒也不好用,那兒也不好用,其結果只能是失望。
我研究過國外一些案例,國外企業(yè)在使用企業(yè)搜索軟件時,往往通過幾個步驟去完成。第一,把各類信息統(tǒng)一搜索上來;第二,找到內容與內容的關聯(lián);第三,用自動化的技術解決標語、分類和熱點查詢和分析的問題。也就是說,國外企業(yè)在做企業(yè)搜索時,也沒有做到特別大。企業(yè)要先搞清企業(yè)級搜索是什么,要實現(xiàn)什么,不要將企業(yè)搜索的需求定的過高、過虛。企業(yè)搜索不僅要有大規(guī)模的采集技術,更要有精妙的算法,如果在一個企業(yè)內部,信息系統(tǒng)并沒有互聯(lián),企業(yè)級搜索也就無法實現(xiàn)。
期待仍有很多
計算機世界傳媒集團信息中心主任 周群:我想對于企業(yè)而言,在選擇產品和解決方案過程中,還是要先確定自己想要獲得什么樣的“企業(yè)搜索”。是企業(yè)內部一些信息的搜索還是外部一些信息的搜索?如何在搜索的同時,繼續(xù)保存企業(yè)內部信息“權限”的分配?無論是大學還是企業(yè),大家希望的是有工具實現(xiàn)信息的條理化、更高效的共享和查詢,但絕不是實現(xiàn)所有信息的共開。
除了權限以外,雖然“企業(yè)搜索”相比互聯(lián)網(wǎng)搜索是小量的,但如何把企業(yè)外的信息整合起來,也是希望企業(yè)搜索工具提供商關注的問題?,F(xiàn)階段“企業(yè)搜索”的方法是,由服務器進行信息檢索,然后再整合起來。而內外部如何進行整合是一個問題。有人做互聯(lián)網(wǎng)搜索、也有人做桌面搜索,但桌面搜索是否起到連接的作用,這是個問題。
計世在線經(jīng)理饒漸平:“企業(yè)搜索”是比較重要,一方面是因為購買者是企業(yè),應用的成功和失敗,帶來的反應都比較大。
我個人理解,“企業(yè)搜索”本身就不是寬泛定義。我們通常說搜索,其實指的是廣義搜索,就是在互聯(lián)網(wǎng)大海里面去“撈”,希望的是“多”、“全”;而企業(yè)搜索則是力求“精”、“準”。所以我覺得,隨著技術增加,由于信息源搜索能力的增強,用戶市場,包括商業(yè)目的市場也會變化,這可能會導致企業(yè)搜索市場在發(fā)展過程中出現(xiàn)一些轉變,例如商業(yè)機密問題如何規(guī)避,企業(yè)內網(wǎng)整理所得的關鍵數(shù)據(jù)會不會因為泄露導致致命性威脅?
王喆:政府的數(shù)據(jù)這樣的擔憂就更多了,拿出來會遇到很嚴重的安全問題。這些數(shù)據(jù)不是一年、兩年才形成的,已經(jīng)積累了多少年了,互聯(lián)網(wǎng)才有幾年,那種海量程度,真的拿出來要比互聯(lián)網(wǎng)現(xiàn)在的量高出不止一、兩倍,權限判斷幾乎全得靠人工處理,因為電腦不可能自己知道什么重要什么不重要,因而這是個很難解決的問題。
賈卓生:還有一個問題是當資料本身的劃分就模糊時,該怎么辦。就拿大學來說,高校網(wǎng)絡中的資料專業(yè)性、綜合性很強,有幾十個專業(yè)的資料很難劃分門類,而且各大學把BBS都限制在校內,跨學校之間資料的搜索就顯得很困難,但很多學生還是希望能看到清華、北大的資料是什么樣的,實際上各大名校的BBS已經(jīng)有了很多討論群,比如清華BBS對某個技術的討論,誰都可以加入討論,這已經(jīng)形成了跨學校間的技術討論群,上述資料與討論群要整合起來,目前仍然有一定困難。
企業(yè)要有革新意識
對于網(wǎng)絡信息更新較為迅速、信息化程度較高的企業(yè)來說,如何做才能很好地整合內部資源,提高工作效能,降低溝通成本?每個用戶都有自己的應用特點,企業(yè)搜索將會如何發(fā)展呢?
何東炯:從用戶角度看,要一次性投入就達到所有數(shù)據(jù)百分之百的整理完畢,顯然是期待過高了。如果將企業(yè)搜索引擎看作一個工具,或許更現(xiàn)實一些。企業(yè)除了在搜索的基礎上要做應用,可能還要做很多工作,而這個工作是個性化的。原因在于,企業(yè)搜索市場仍在成長中,還沒有形成同質化的產品,或者說同質化的完全成熟的產品。每個用戶都有自己的應用特點,所以說選擇軟件提供商,只是第一步,是選擇核心需求的滿足,而在這之后,就要偏重測試應用,這對于用戶而言,既能理解,也能接受。
而關于保密性問題,完全可以進行內部整合,為不同權限的人,制定不同的搜索和范圍,最終也能起到各級別的信息歸類。比如公安部門的搜索引擎項目,第一步需要把公安部下面各地的一千多個網(wǎng)站上的所有案件信息、人口信息深度整合,但是在不同的級別,看到的信息量是不一樣的,這樣就能很好地解決問題。
陳一宏:企業(yè)采用企業(yè)搜索是必然趨勢,但是怎么上、多大規(guī)劃,要看實際情況。對于現(xiàn)在的技術需求,要有一個和諧的匹配。一個“企業(yè)搜索”平臺能否用的好,在于你的規(guī)劃,使用上也需要企業(yè)有技巧和想法。在這個前提下,如果能夠好好掌握,能夠帶來很大的好處。
何東炯:是的,通過今天的討論,無論是廠商還是用戶,對需求和考慮的理解都多了一些,收獲不少。盡管當前企業(yè)搜索市場還不是很成熟,用戶需求變化幅度也比較大,整個市場模式也還需要探索。現(xiàn)在雖然我代表的是廠商、是TRS,但是原先我也做過用戶、做過甲方,從用戶角度一定要清楚自己的需求,廠商那邊才好配合,如果廠商完全給你編需求,第一不適合你的情況,第二很難用好。另外,企業(yè)搜索也好,CRM也好,ERP也好,最好是一把手工程。部、局等部門用戶的考慮終究會有不同,有的關心社區(qū),有的關心文檔庫,有的關心保密,有分歧就很難有好的規(guī)劃。
最后,我還想提前宣傳一下,我們TRS于8月16日在北京國際會議中心也會舉辦“TRS垂直搜索引擎應用研討沙龍”,屆時TRS將攜搜索市場的專家與廣大用戶朋友們共同探討新搜索引擎服務模式的應用,也希望感興趣的朋友能夠登錄TRS網(wǎng)站進行參與。
王喆:對于搜索之所以造成企業(yè)級搜索不好用的現(xiàn)狀,主要原因并不在提供商,而是現(xiàn)在大多數(shù)企業(yè)的內網(wǎng)數(shù)據(jù)資源質量不高,或者就是各個部門搞了很多壁壘的前提下,想純靠技術來實現(xiàn)信息整理的完整性,這其實不是很現(xiàn)實的一件事情。
很多領導經(jīng)常說,技術這個東西不是問題,我們從來不考慮技術,電子政務,七分是政務,三分是電子,只要我們能想到的,技術就能實現(xiàn)。但是我每次都跟領導說,其實要說技術能實現(xiàn)的話,我也贊成,但是一定有兩個條件,第一無限金錢,第二無限時間。給我一千億,再給我一千年,我什么都能做到,現(xiàn)在不是什么都能做到,要想配合企業(yè)搜索達到理想的目標。
我們最近也一直在討論這個問題,廠商要不斷的研發(fā)中文分詞。中文有一個特點,如果分詞分不好的話,或素材再好,做出來的效果也不好。這方面,國內公司的優(yōu)勢要比國外廠商好一些。建議國內廠商能通過比較規(guī)范的標準或者一系列的基礎工作實施,能夠使得基礎數(shù)據(jù)或者信息資源能夠做到更加規(guī)范,梳理所有企業(yè)信息、政務公開的項目,梳理所有公共服務的項目,慢慢把這些基礎的東西都做好,都規(guī)范化一點,這樣的給未來的企業(yè)搜索提供更好的基礎環(huán)境,讓企業(yè)搜索發(fā)揮比較好的效率。
企業(yè)搜索熱度幾何
2006-08-09 03:08 來源: 中國計算機用戶 查看: 次 分享11
免責聲明:除非特別注明,國脈電子政務網(wǎng)所載內容及圖片來源于互聯(lián)網(wǎng)、微信公眾號等公開渠道,不代表本站觀點,僅供參考、交流之目的。轉載的稿件及圖片版權歸原作者或機構所有,如有侵權,請聯(lián)系刪除。
關注國脈電子政務網(wǎng),政府CIO的思想陣地與交流平臺,5000位政府CIO在這里讀懂“互聯(lián)網(wǎng)+政務”
