谷歌完成新一代搜索“咖啡因”索引系統(tǒng)
咖啡因占據(jù)了Google資料庫約1億GB的儲(chǔ)存空間,而且以每天數(shù)十萬GB的速度增加,必須要有62.5萬臺(tái)最大容量的iPod才能儲(chǔ)存等量的資料。
6月10日消息,據(jù)國外媒體報(bào)道,Google日前宣布已完成新一代的搜索引擎“咖啡因”(Caffeine)的索引系統(tǒng) ,咖啡因除了是Google有史以來所提供規(guī)模最大的網(wǎng)絡(luò)內(nèi)容收藏外,其所提供的新訊息也比舊版索引多上50%。
咖啡因是Google打造的新一代搜索引擎架構(gòu),主要目的包括加大搜索規(guī)模,以及改善索引速度、精確性與全面性等,于去年8月開始邀請(qǐng)開發(fā)人員進(jìn)行測(cè)試。
Google軟件工程師Carrie Grimes說明了咖啡因索引系統(tǒng)與前一代索引系統(tǒng)的相異之處,指出舊版是由許多階層所構(gòu)成,某些階層更新的速度快于其他層,但主要的階層平均數(shù)周才更新一次,為了更新舊索引的階層,Google必須分析整個(gè)網(wǎng)絡(luò),因此在新資訊現(xiàn)身及Google將其索引間存有不小的時(shí)間差。
咖啡因的索引更新則采用了全然不同的方式,Google針對(duì)小部分網(wǎng)絡(luò)進(jìn)行分析,而非一次分析整個(gè)網(wǎng)絡(luò),而且一天24小時(shí)持續(xù)更新其全球索引,因此只要Google一發(fā)現(xiàn)新的網(wǎng)頁,就會(huì)直接把它加進(jìn)索引中,這代表使用者比以前更容易找到更新的資訊。
Grimes表示,咖啡因每秒可平行處理數(shù)十萬的頁面,這些頁面若用紙張堆起來有3哩高,同時(shí)咖啡因占據(jù)了Google資料庫約1億GB的儲(chǔ)存空間,而且以每天數(shù)十萬GB的速度增加,必須要有62.5萬臺(tái)最大容量的iPod才能儲(chǔ)存等量的資料。
由于咖啡因改善了索引網(wǎng)絡(luò)內(nèi)容的速度,因此當(dāng)一個(gè)新的博客甚至論壇文章出現(xiàn)時(shí),使用者將可比過去更快速地通過Google找到相關(guān)內(nèi)容的連結(jié)。
Grimes指出,咖啡因是為未來所設(shè)計(jì)的,因此它不僅資訊較新,同時(shí)也是一個(gè)供Google打造更快速且更全面搜索引擎的基礎(chǔ),以配合網(wǎng)絡(luò)上日益增加的資訊量,并提供更具關(guān)聯(lián)性的搜索結(jié)果,未來幾個(gè)月Google將會(huì)持續(xù)改善該架構(gòu)功能。
不過,隨著新索引系統(tǒng)的完成,Google移除了先前開放測(cè)試的網(wǎng)頁,并表示該公司相信咖啡因已準(zhǔn)備就緒,很快就會(huì)更廣泛地啟用該服務(wù).