近日,國內(nèi)最大的搜索技術提供商北京拓爾思(TRS)信息技術有限公司,發(fā)布了其最新研制出的新一代企業(yè)搜索引擎平臺——TRS 全文數(shù)據(jù)庫系統(tǒng)第六版(TRS Database Server V6),這也是TRS繼去年發(fā)布了企業(yè)搜索引擎第5版(V5)后再次推出的全新企業(yè)搜索產(chǎn)品。

  據(jù)了解,TRS 全文數(shù)據(jù)庫系統(tǒng)第六版,從性能和功能上,帶有極為突出的亮點,主要包括有:面向海量數(shù)據(jù)高并發(fā)檢索需求的集群技術、比互聯(lián)網(wǎng)搜索引擎更為可靠有效的高查全率和查準率保證、以及面向企業(yè)異構(gòu)數(shù)據(jù)整合需要的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)統(tǒng)一搜索技術。

  TRS高效能集群檢索技術填補國內(nèi)外空白

  TRS Database Server是國內(nèi)首家在用戶實際應用項目中成功部署了集群檢索應用的企業(yè)搜索產(chǎn)品,這些項目包括中華人民共和國中央人民政府門戶搜索引擎、政府某部信息專網(wǎng)搜索引擎和新華社多媒體數(shù)據(jù)庫等重量級項目。

  集群(Cluster)檢索應用源自當前信息規(guī)模的爆炸式膨脹和信息資源共享的普遍需求,特別是對占信息資源總量80%以上的非結(jié)構(gòu)化數(shù)據(jù)而言,檢索要應對兩方面的挑戰(zhàn),第一:當數(shù)據(jù)規(guī)模達到T級時,單臺服務器已經(jīng)遠遠不能滿足數(shù)據(jù)存儲和管理需要,因此需要部署多臺服務器進行分布式存儲,但必須實現(xiàn)統(tǒng)一檢索;第二:在多用戶高并發(fā)訪問的情況下,海量數(shù)據(jù)規(guī)模使檢索性能急劇降低,必須采用多臺服務器分擔檢索響應,保證檢索效率。調(diào)研結(jié)果顯示,當前海量數(shù)據(jù)環(huán)境下的檢索服務效率已經(jīng)成為專利機構(gòu)、圖書情報機構(gòu)、媒體和政府等信息資源集中的單位提供高質(zhì)量信息服務的瓶頸。

  TRS 產(chǎn)品負責人介紹:通過TRS 集群服務器(TRS Cluster Server)可以管理和調(diào)度幾百臺TRS Database Server V6服務器,實現(xiàn)了海量數(shù)據(jù)分布存儲和高并發(fā)訪問負載均衡,并支持兩種手段的組合運用,可保證用戶系統(tǒng)在海量數(shù)據(jù)和高并發(fā)環(huán)境下的分布式檢索的高性能。同時,通過集群也能輕松實現(xiàn)消除單點故障的高可用系統(tǒng),滿足用戶的可靠性要求。

  TRS Database Server V6的內(nèi)核實現(xiàn),采用了最新優(yōu)化算法,改良了緩存(CACHE)機制,并針對近年軟硬件平臺發(fā)展,比如64位處理器和操作系統(tǒng)、多處理器(SMP)體系結(jié)構(gòu)等實現(xiàn)了相應支持和優(yōu)化,淋漓盡致地發(fā)揮出最新軟硬件平臺的優(yōu)勢,令單機環(huán)境系統(tǒng)性能較上一版本取得了成倍的提升。在項目實際運行評測中,尤其是在海量數(shù)據(jù)高并發(fā)環(huán)境下,TRS Database Server V6檢索性能優(yōu)異,遠遠超過了國內(nèi)外同類企業(yè)搜索產(chǎn)品。

  超越互聯(lián)網(wǎng)搜索引擎的高查全率和查準率

  用戶在使用Google等互聯(lián)網(wǎng)搜索引擎時,經(jīng)??梢园l(fā)現(xiàn)搜索引擎顯示的搜索數(shù)目并不準確:搜索引擎顯示搜索到幾十萬條信息,實際通過翻頁可以看到展示出來的信息也就幾百條。而且,有些明明符合條件的信息可能就是搜不出來。這與互聯(lián)網(wǎng)搜索引擎面對網(wǎng)頁數(shù)據(jù)特性所采取的PageRank、TOP N、結(jié)果預估等算法或策略相關。相應的,統(tǒng)計表明,搜索用戶絕大部分的訪問限于搜索結(jié)果的前幾個頁面。然而,企業(yè)搜索的應用環(huán)境、用戶需求和互聯(lián)網(wǎng)搜索有很大不同,企業(yè)搜索是為組織業(yè)務決策和運轉(zhuǎn)而服務的,要做到精準,需要全面獲取搜索結(jié)果并且不能有任何疏漏,因而需要保證高查全率和查準率。

  TRS全文數(shù)據(jù)庫系統(tǒng)V6支持多種索引策略、全方位檢索手段、智能檢索輔助、內(nèi)容相關度排序等功能,使得TRS全文數(shù)據(jù)庫系統(tǒng)V6在保證用戶查準的同時,提供100%查全手段,滿足企業(yè)搜索引擎對查全和查準的雙重要求。

  結(jié)構(gòu)化和非結(jié)構(gòu)化統(tǒng)一搜索解決異構(gòu)數(shù)據(jù)搜索難題

  除強調(diào)信息檢索的全面和準確之外,企業(yè)級搜索面對的另一個難題就是復雜的數(shù)據(jù)異構(gòu)性,即組織中各種類型的數(shù)據(jù)存放在不同的系統(tǒng)中,既有非結(jié)構(gòu)化數(shù)據(jù)也有結(jié)構(gòu)化數(shù)據(jù),既有關系數(shù)據(jù)庫系統(tǒng),也有OA系統(tǒng)、網(wǎng)站內(nèi)容管理系統(tǒng)、文件系統(tǒng)、以及郵件系統(tǒng)等等。結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)統(tǒng)一搜索和管理是TRS企業(yè)搜索引擎的一大亮點,TRS數(shù)據(jù)庫在存貯方面提供多種結(jié)構(gòu)化數(shù)據(jù)類型,檢索方面實現(xiàn)結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的聯(lián)合檢索,并可以對檢索結(jié)果進行分類統(tǒng)計,這些都是傳統(tǒng)全文檢索系統(tǒng)或者搜索引擎所不能提供的領先和創(chuàng)新的功能。在異構(gòu)數(shù)據(jù)集成方面,TRS提供了多種接口工具實現(xiàn)與不同系統(tǒng)的數(shù)據(jù)同步。

  另外,TRS全文數(shù)據(jù)庫V6所實現(xiàn)的實時動態(tài)索引以及多級訪問安全機制,保證了企業(yè)搜索所必備的即時性和安全性,為搭建基于企業(yè)搜索的各類應用,如信息服務、競爭情報、知識管理、決策支持,應急預警等提供了功能強大、完備和可靠的核心支撐平臺。

  TRS總經(jīng)理施水才表示:“TRS全文數(shù)據(jù)庫系統(tǒng)V6是TRS在企業(yè)搜索領域的又一創(chuàng)新突破,新的集群檢索實現(xiàn)在國內(nèi)外均處于領先地位,完全可以搭建包括行業(yè)垂直搜索引擎在內(nèi)的大規(guī)模搜索服務應用。TRS在搜索領域耕耘十幾年,在大中華地區(qū)已經(jīng)擁有2000多家企業(yè)級客戶,國內(nèi)市場占有率已經(jīng)遠遠超過其他廠商之和,贏得了用戶的信任和青睞,成為搜索產(chǎn)品的首選品牌”。

責任編輯:admin