十分鐘,在本地搭建一個搜索引擎
時間:2023-03-17 05:36:01 | 來源:電子商務(wù)
時間:2023-03-17 05:36:01 來源:電子商務(wù)
假設(shè)有一堆詞,也有一堆內(nèi)容?,F(xiàn)在想知道:
- 每個詞的相關(guān)詞有哪些?
- 每個詞的相關(guān)內(nèi)容有哪些?
- 每個內(nèi)容的相關(guān)內(nèi)容有哪些?
利用上述詞與詞、詞與內(nèi)容、內(nèi)容與內(nèi)容的關(guān)聯(lián),來優(yōu)化頁面的推薦信息,使用戶和搜索引擎獲得更好的瀏覽體驗。
這些相關(guān)信息的推薦都可以通過搜索來實現(xiàn),這些推薦的信息無論是寫死的,還是實時查詢的,還是分時間緩存的,前提是都得有個搜索引擎。
如何本地搭建一個搜索引擎?
直接套一個開源搜索引擎即可
開源搜索引擎有哪些?
http://www.oschina.net/project/tag/130/search-engine本渣渣用過以下兩個
相比之下推薦 Xunsearch。
因為Coreseek多年未更新,且我覺得寫文檔的人可能語文沒學(xué)好
Xunsearch一直更新,用的人多,碰到問題解決方案比較好找,另外后端基于C/C++開發(fā),我一直感覺跟C沾邊的在性能上都比較好。所以下面十分鐘在本地搭建一個搜索引擎的教程,以xunsearch為例。
xunsearch官方主頁在:
http://www.xunsearch.com/10分鐘本地搭建搜索引擎示例
安裝
本渣渣很久之前就安裝過了,步驟極其簡單,直接照此處官方文檔操作就行
啟動xunsearch服務(wù)
本渣渣的xunsearch安裝在 /Users/sunjian/ 這個目錄下,執(zhí)行:
/Users/sunjian/xunsearch/bin/xs-ctl.sh start
將 /Users/sunjian/ 替換成各自的xunsearch安裝路徑,執(zhí)行后,即可啟動xunsearch服務(wù)
創(chuàng)建項目配置文件
在 /xunsearch/asdk/php/app/ 目錄下創(chuàng)建項目配置文件,文件名一般與項目名同名,且以 .ini 結(jié)尾
project.name:項目名稱
project.default_charset:編碼,一般都是utf-8
server.index 和 server.search為服務(wù)端口,直接粘貼即可
下面 [xxx] 和 type 是需要創(chuàng)建索引的字段名稱和對應(yīng)的數(shù)據(jù)類型。
比方說我抓過來一堆微信公眾號的數(shù)據(jù),放到mysql中,如下:
我希望可以通過關(guān)鍵詞對這些公眾號內(nèi)容的標(biāo)題 或者 正文進行搜索,找出與這個詞相關(guān)內(nèi)容,那么就需要對存放標(biāo)題和正文的字段創(chuàng)建索引,而id字段是每條記錄的唯一標(biāo)識,是mysql中的主鍵,所以也需要添加到索引中。
那么在xunsearch配置文件中,需要寫入創(chuàng)建索引用到的3個字段:id title 和 contont
字段名稱寫在 [ ] 內(nèi),分別對應(yīng)在mysql中的字段名稱
type為這個字段對應(yīng)的數(shù)據(jù)類型,這個數(shù)據(jù)類型不是mysql中的數(shù)據(jù)類型,是在xunsearch對應(yīng)的數(shù)據(jù)類型,有如下幾種:
很明顯,標(biāo)題數(shù)據(jù)對應(yīng)的類型為title,正文對應(yīng)的字段類型為body。
ps:配置文件文檔:
http://www.xunsearch.com/doc/php/guide/ini.guide新建索引
ps:索引操作說明文檔
http://www.xunsearch.com/doc/php/guide/util.indexer測試搜索
ps:搜索測試文檔:
http://www.xunsearch.com/doc/php/guide/util.quest在web目錄下創(chuàng)建xunsearch前端搜索頁面骨架
ps:生成搜索代碼文檔:
http://www.xunsearch.com/doc/php/guide/util.skel本地開啟PHP環(huán)境
MAC本地,打開/etc/apache2/httpd.conf,將取消本行注釋
重啟Apache:
sudo apachectl restart
ps:如果你本地已經(jīng)開啟PHP環(huán)境請略過這步,如果是win系統(tǒng)請百度對應(yīng)的開啟php環(huán)境的方法
瀏覽器打開本地localhost下生成的xunsearch前端搜索頁面
詞的相關(guān)內(nèi)容:
內(nèi)容的相關(guān)內(nèi)容:
===================================================
知識星球-->日后有福利發(fā)之,比如一段能寫黃段子的Python代碼微信公眾號---->右下角