桌面搜索哪家強(qiáng)? 15款文件搜索軟件橫向評測
時間:2023-03-17 00:06:01 | 來源:電子商務(wù)
時間:2023-03-17 00:06:01 來源:電子商務(wù)
隨著數(shù)字化時代的到來,我們計算機(jī)上的文檔不斷增多。有時我們想找某個文檔,只模糊記得一些片段,卻怎么都找不到它。多虧了有Everything等軟件幫我們高效地定位文件名,但很多時候我們需要搜索文件里面的內(nèi)容,這就要借助專業(yè)的文件內(nèi)容搜索軟件。網(wǎng)上這類軟件多如牛毛,每家都說它最強(qiáng),可實(shí)際效果到底怎樣,還是通過測試讓數(shù)據(jù)說話吧。
我們找到了互聯(lián)網(wǎng)上15款最新的文件內(nèi)容搜索軟件(其中7款收費(fèi)、8款免費(fèi)),這些軟件均采用先索引后檢索的設(shè)計來提高搜索速度。為保證測試環(huán)境的純凈,我們在虛擬機(jī)Vmware下新安裝了Windows 10進(jìn)行了測試,主要測試各軟件對中文搜索的支持情況。我們還對用戶關(guān)心的索引時間、搜索時間、搜索準(zhǔn)確度等指標(biāo)進(jìn)行了全面對比。 軟件版本情況如下:
我們從互聯(lián)網(wǎng)上搜羅了2000個文檔文件作為測試數(shù)據(jù),覆蓋了常見的各類文檔,具體類型分布如下:
經(jīng)過簡單的測試,我們發(fā)現(xiàn)其中9款軟件對中文的支持很糟糕,這些軟件后續(xù)就不再做進(jìn)一步測試。以下是這些軟件搜“技術(shù)”一詞的結(jié)果(基準(zhǔn)數(shù)為1206個):
除去上述中文支持不好的9款軟件,我們對剩下的6款軟件進(jìn)行了詳細(xì)測試,分別測了索引時間、搜索時間、搜索準(zhǔn)確度三個維度。其中,搜索時間和搜索準(zhǔn)確度來自十個測試詞的數(shù)值取平均值,測試詞分別是“技術(shù)、保密、目的、會同、化工、五年、工程師、最大化、身份證、總經(jīng)理”;對于搜索準(zhǔn)確度,我們以各軟件成功匹配結(jié)果的合集(剔除重復(fù)和誤匹配)作為基準(zhǔn)分母,以正確匹配數(shù)減去誤匹配數(shù)作為分子,計算準(zhǔn)確率;部分軟件采用的是全盤索引,為了對比,我們采用純凈操作系統(tǒng)作為測試環(huán)境,因為系統(tǒng)文件中的文檔很少可以忽略不計。最終比對結(jié)果如下:
我們對測試結(jié)果進(jìn)行了總結(jié),分別給予了星級評價:
1、Google Desktop Search ★★★
Google公司作為搜索引擎一哥,2003年就推出Google桌面軟件,市場反映很好。但是,Google于2011年關(guān)閉了Google桌面項目,因此它對停更后的Win10支持很差,默認(rèn)情況連搜索結(jié)果的詳細(xì)頁面都無法打開。本次測試中,其索引速度最慢,但搜索速度和準(zhǔn)確度的表現(xiàn)還中規(guī)中距。如果您的系統(tǒng)為Win XP或Win7,可以試試這款軟件。
2、TextSeek(文本搜) ★★★★★
TextSeek(文本搜)是支持Windows、Mac和統(tǒng)信系統(tǒng)的國產(chǎn)桌面搜索軟件,本次測試因為需要對比索引,采用的是區(qū)域模式。這款軟件表現(xiàn)最為優(yōu)秀,索引時間最少,搜索準(zhǔn)確率大幅超出其他軟件。其主要缺點(diǎn)是搜索時間耗時最多,這可能是其實(shí)現(xiàn)高準(zhǔn)確度的代價。實(shí)測我們發(fā)現(xiàn),文檔數(shù)在10萬以下的,搜索時間還在可承受范圍。如果不在乎搜索時間或搜索范圍較小的話,TextSeek還支持無索引搜索的簡易模式。
3、AnyTXT Searcher ★★★
AnyTXT Searcher是基于全盤索引設(shè)計的國產(chǎn)搜索工具,搜索速度秒開。不支持指定搜索文件夾,因此首次索引耗時很久。索引速度、結(jié)果準(zhǔn)確度和軟件界面還有待提高。軟件免費(fèi),據(jù)稱使用若干次后需分享軟件到3個微信群,否則文檔預(yù)覽功能會受到限制。
4、Archivarius3000 ★★★★
Archivarius3000是來自塞浦路斯的多語言文檔搜索軟件,支持多種語言的語法和分詞,界面簡潔、清晰,索引速度和搜索準(zhǔn)確度僅次于TextSeek,搜索速度極快。缺點(diǎn)是中文搜索有時會出狀況,比如某些搜索詞會出現(xiàn)大量的誤匹配,究其原因,是將搜索詞錯誤分詞為單字進(jìn)行匹配,或者出現(xiàn)跨行、跨標(biāo)點(diǎn)符號匹配。
5、Recoll ★★★★
Recoll是一款開源的桌面搜索軟件,支持Windows、Mac和Linux系統(tǒng),最新的Windows版本需要捐款給作者才允許下載。本次測試中,Recoll的搜索準(zhǔn)確度和Archivarius3000不相伯仲,搜索速度也挺快。缺點(diǎn)是索引時間較長,生成的索引文件較大,還有中文界面實(shí)在不敢恭維,可能軟件作者中沒有中國人的緣故。
6、DocFetcher ★★★
DocFetcher是另一款開源的桌面搜索軟件,支持Windows、Mac和Linux系統(tǒng)。開源免費(fèi)版于2018年停止更新,作者20年底開始開發(fā)收費(fèi)版本DocFetcher Pro。本次測試中用的是免費(fèi)版,其搜索速度快,索引速度快。缺點(diǎn)是搜索準(zhǔn)確度較差,中文結(jié)果會出現(xiàn)遺漏或誤報的情況,特別是3字以上搜索詞的錯誤率明顯上升。