国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

所在位置：首頁 > 營銷資訊 > 電子商務(wù) > 打造一個藍(lán)奏云網(wǎng)盤搜索引擎

打造一個藍(lán)奏云網(wǎng)盤搜索引擎

時間：2023-03-27 09:48:01 | 來源：電子商務(wù)

時間：2023-03-27 09:48:01 來源：電子商務(wù)

目前存在的網(wǎng)盤搜索引擎好多，可以歸于兩類：

1.搜索引擎索引
2.爬蟲入庫索引

第一種：搜索引擎索引
這種索引方式是目前比較主流的方式，依靠百度，谷歌建立索引鏈接，當(dāng)用戶進(jìn)行搜索的時候，網(wǎng)盤搜索引擎會抓取谷歌和百度已經(jīng)收錄的頁面然后反饋給用戶。

第二種：爬蟲入庫索引
通過爬蟲（python或者其他語言）進(jìn)行對網(wǎng)盤站點(diǎn)的資源爬取，將資源統(tǒng)一存放到數(shù)據(jù)庫，通過分詞將搜索結(jié)果展現(xiàn)給用戶。

這兩種方式各有優(yōu)缺點(diǎn)，第一種屬于間接搜索，如果搜索引擎不收錄該站點(diǎn)資源，那么將無從搜索。第二種屬于直接搜索，資源準(zhǔn)確度較高，但是實(shí)時更新速度比不上第一種。

下面進(jìn)入主題，說說塵心盤搜索的技術(shù)搜索模式
地址：https://pan.ischenxin.com/

很早之前就想打造一個藍(lán)奏云的網(wǎng)盤搜索引擎，無奈之前時間一直不充裕，終于有時間可以做開發(fā)了。

藍(lán)奏云的優(yōu)點(diǎn)：不限速速度快。
藍(lán)奏云的缺點(diǎn)：非會員上傳限制100M

缺點(diǎn)導(dǎo)致資源不會太大，視頻內(nèi)容肯定就非常少了，但其他類的資源，比如app，音樂，小說肯定非常豐富。

由于藍(lán)奏云的Robots限制了百度對其網(wǎng)頁的收錄，使用百度高級搜索語法是沒有搜索結(jié)果的，但是谷歌就可以搜索到。

本身也沒有想著使用搜索引擎的方式去做引擎，只是抱著嚴(yán)謹(jǐn)?shù)膽B(tài)度搜索看一看。

廢話太多，下面進(jìn)入主題。

技術(shù)架構(gòu)：
1.前端使用Vue+Element UI ，本身前端不復(fù)雜，就沒有使用webpack打包
2.后端使用了PHP+Apache+Mysql 經(jīng)典的后端組合
3.分詞引擎使用了國人開源的xunsearch 漢語嘛當(dāng)然是國人最懂漢語了
4.爬蟲使用了基于python的Scrapy 分布式進(jìn)行資源的爬取

整套系統(tǒng)的復(fù)雜點(diǎn)在于分詞，因?yàn)閿?shù)據(jù)庫存儲資源后，由于數(shù)據(jù)的龐大，若使用數(shù)據(jù)庫查詢語句 like，效率和吞吐量肯定滿足不了。此時分詞的重要性就顯得非常重要了，將數(shù)據(jù)庫存儲標(biāo)題的字段進(jìn)行分詞，然后建立全文索引鏈，這樣大大提高了搜索速度和吞吐量。

雖然mysql目前是支持中文的全文索引的，但是效率和分詞的結(jié)果非常不理想，尋找了幾個分詞引擎，最后選擇了xunsearch，百萬級搜索速度只有幾毫秒，有需要的朋友可以百度xunsearch了解下，使用并不復(fù)雜，文檔寫的有點(diǎn)亂，還是需要認(rèn)真多分析幾遍的。

爬蟲還是萬年不變的python，使用西瓜皮作為爬蟲框架，一共有三臺服務(wù)器分布式爬取，由于藍(lán)奏的種種限制，目前資源入庫的速度還算是理想。這里有一點(diǎn)需要說明，爬蟲和分詞并不是實(shí)時響應(yīng)的，每爬取一段時間后，服務(wù)器會進(jìn)行分詞處理，資源存在一定的滯后，這個后期會在優(yōu)化這個滯后的時間。

關(guān)鍵詞：索引,打造

解決方案&服務(wù)

客戶&案例

營銷資訊

關(guān)于我們

微信公眾號

版權(quán)所有? 億企邦 1997-2025 保留一切法律許可權(quán)利。

為了最佳展示效果，本站不支持IE9及以下版本的瀏覽器，建議您使用谷歌Chrome瀏覽器。點(diǎn)擊下載Chrome瀏覽器

關(guān)閉

国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

快捷入口

打造一個藍(lán)奏云網(wǎng)盤搜索引擎

外貿(mào)英文網(wǎng)站谷歌SEO排名優(yōu)化問題匯總

區(qū)塊鏈技術(shù)及其商業(yè)應(yīng)用研討會2015成都

B2B還有機(jī)會嗎為什么阿里系放棄B2B

社會化媒體該怎么運(yùn)營？

如何快速的做網(wǎng)站？

外貿(mào)B2C平臺選擇速賣通、ebay、亞馬遜分析？

從企業(yè)營銷視頻制作的角度談網(wǎng)絡(luò)營銷應(yīng)該怎么做

如何通過軟文獲取高質(zhì)量外鏈推廣網(wǎng)站

一下科技：依托優(yōu)質(zhì)內(nèi)容拓展用戶想象邊界

江湖家政O2O系統(tǒng)火爆開啟上門服務(wù)新篇章

国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

快捷入口

打造一個藍(lán)奏云網(wǎng)盤搜索引擎

推薦文章

微信是不是在用公眾號和小程序打造內(nèi)容電商平臺？微信生態(tài)的電商價

如何從零打造一款快消品？

社會化媒體時代如何打造個人品牌？

怎么打造一個牛逼的社會化媒體？比如微博、社區(qū)達(dá)人、知乎達(dá)人、微

圖靈交互設(shè)計(jì)叢書:貼心設(shè)計(jì)·打造高可用性

圖靈交互設(shè)計(jì)叢書:貼心設(shè)計(jì)·打造高可用性圖書

智慧虎超：垂直電商+小程序打造發(fā)展新風(fēng)口？解析小程序運(yùn)營秘訣

垂直類電商求生路：唯品會瘋狂植入，小芒打造興趣社區(qū)

七千貓商城專注打造3C類目垂直電商型平臺服務(wù)

購出色：打造特色會員制垂直電商平臺

外貿(mào)英文網(wǎng)站谷歌SEO排名優(yōu)化問題匯總

區(qū)塊鏈技術(shù)及其商業(yè)應(yīng)用研討會2015成都

B2B還有機(jī)會嗎 為什么阿里系放棄B2B

社會化媒體該怎么運(yùn)營？

如何快速的做網(wǎng)站？

外貿(mào)B2C平臺選擇速賣通、ebay、亞馬遜分析？

從企業(yè)營銷視頻制作的角度談網(wǎng)絡(luò)營銷應(yīng)該怎么做

如何通過軟文獲取高質(zhì)量外鏈推廣網(wǎng)站

一下科技：依托優(yōu)質(zhì)內(nèi)容 拓展用戶想象邊界

江湖家政O2O系統(tǒng)火爆開啟上門服務(wù)新篇章

怎么打造一個牛逼的社會化媒體？比如微博、社區(qū)達(dá)人、知乎達(dá)人、微

垂直類電商求生路：唯品會瘋狂植入，小芒打造興趣社區(qū)

B2B還有機(jī)會嗎為什么阿里系放棄B2B

社會化媒體該怎么運(yùn)營？

如何快速的做網(wǎng)站？

外貿(mào)B2C平臺選擇速賣通、ebay、亞馬遜分析？

一下科技：依托優(yōu)質(zhì)內(nèi)容拓展用戶想象邊界