谷歌最近發(fā)現(xiàn),互聯(lián)網(wǎng)上的獨立URL數(shù)量超過了1萬億個。 

  谷歌高管本周五在該公司博客上表示,這應(yīng)當(dāng)歸功于谷歌的工程師。谷歌工程師發(fā)現(xiàn),互聯(lián)網(wǎng)上每天新增加數(shù)十億個網(wǎng)頁。 

  在公布這一數(shù)字的同時,谷歌還趁機炫耀了自己的索引數(shù)據(jù)庫規(guī)模。谷歌互聯(lián)網(wǎng)搜索基礎(chǔ)架構(gòu)團隊的軟件工程師杰西·阿爾帕特(Jesse Alpert)和尼桑·哈賈吉(Nissan Hajaj)在博客中寫道,“我們沒有對這1萬億個網(wǎng)頁中的每個網(wǎng)頁進行索引——許多網(wǎng)頁彼此相似,或者是自動生成的內(nèi)容,這些網(wǎng)頁對搜索用戶沒有什么用處。但我們對擁有最完整的索引數(shù)據(jù)庫感到自豪,我們的目標(biāo)是索引世界上的所有數(shù)據(jù)?!?nbsp;

  過去谷歌一直公開宣揚其索引數(shù)據(jù)庫的規(guī)模,各大搜索引擎廠商經(jīng)常為此爭得不可開交。后來它們發(fā)現(xiàn),大多數(shù)搜索用戶通常只會翻看兩頁搜索結(jié)果,有關(guān)索引數(shù)據(jù)庫規(guī)模的口水仗也因此而結(jié)束。換句話說,最重要的是向用戶提供10-20個相關(guān)度較高的鏈接,或者是直接回答用戶的問題,因為沒有用戶會從5000個搜索結(jié)果中查找自己想要的信息。谷歌公布的這一信息是否會導(dǎo)致雅虎、微軟和Ask.com的激烈反應(yīng)還不得而知。 

  阿爾帕特和哈賈吉在博客中還寫道,目前,谷歌不停地下載整個web,收集更新網(wǎng)頁的信息,并每天對所有web鏈接進行數(shù)次處理。

責(zé)任編輯:admin