時(shí)間:2023-03-10 17:58:01 | 來(lái)源:電子商務(wù)
時(shí)間:2023-03-10 17:58:01 來(lái)源:電子商務(wù)
這之前:
1、想寫(xiě)這篇文章很久,但一直糾結(jié)在搜索引擎具體的技術(shù)原理細(xì)節(jié)中,看得愈多,不懂的地方也愈多,遲遲不敢動(dòng)手,這是非程序猿出生的痛苦。
2、所有人都知道搜索是個(gè)復(fù)雜的玩意,本文試著主要從非技術(shù)角度思考并搭建一個(gè)適用于b2c網(wǎng)站的站內(nèi)搜索系統(tǒng),不涉及到太多的技術(shù)細(xì)節(jié)。至于具體的實(shí)現(xiàn)代價(jià)這里未做考慮(是通過(guò)簡(jiǎn)單的sql+緩存搞定、用lucene或Sphinx等全文檢索引擎做二次開(kāi)發(fā)、甚至找google 百度買代碼做二次開(kāi)發(fā),聽(tīng)你們程序猿的吧,你做不了主)。
3、本文多次提到站內(nèi)搜索,而非站內(nèi)搜索引擎,這兩者間有巨大差別(我不是很確定最終設(shè)計(jì)出來(lái)的是否會(huì)是一個(gè)真正意義上的站內(nèi)搜索引擎)。
4、本文參考了較多資料,例舉如下,供參考學(xué)習(xí)
《web信息架構(gòu)-設(shè)計(jì)大型網(wǎng)站》這本經(jīng)典書(shū)籍(不建議新手購(gòu)買)
美女西喬的幾篇文章
yeeach.com 的幾篇文章
以及部分關(guān)于全文檢索的論文
在這之后,我們進(jìn)入正文
1、在開(kāi)始考慮規(guī)劃一個(gè)b2c站內(nèi)搜索前,需要考慮清楚以下2個(gè)問(wèn)題
站內(nèi)搜索要解決的問(wèn)題和意義
下面描述2類常見(jiàn)的搜索場(chǎng)景
某用戶小李,對(duì)網(wǎng)站A已較熟悉,要買電腦,此時(shí)知道網(wǎng)站A有電腦銷售。直接輸入關(guān)鍵詞:Thinkpad X系列進(jìn)行較精準(zhǔn)的查詢。
某用戶小白,聽(tīng)說(shuō)了b2c網(wǎng)站A,第一次登陸,看見(jiàn)琳瑯滿目的商品。剛好之前瀏覽過(guò)相似網(wǎng)站,或?qū)δ壳吧唐返念惸坑休^全面的認(rèn)識(shí)。想迅速定位腦海中已有的某幾種商品。于是輸入較寬泛的關(guān)鍵詞進(jìn)行模糊搜索:如輸入羊毛外套、全棉T恤等較模糊的關(guān)鍵詞。
(1)站內(nèi)搜索剛好滿足這兩類用戶的需求。
(2)通過(guò)分析用戶關(guān)鍵詞搜索頻次,了解用戶的潛在需求。(針對(duì)這點(diǎn),我一直有個(gè)想法,若發(fā)現(xiàn)大量搜索關(guān)鍵詞為A的某類商品,而恰巧網(wǎng)站沒(méi)有。網(wǎng)站為降低風(fēng)險(xiǎn),是否可以采用預(yù)定的方式,先上架與目標(biāo)關(guān)鍵詞A吻合的商品X?)
(3)對(duì)于網(wǎng)站運(yùn)營(yíng)人員,通過(guò)分析用戶的關(guān)鍵詞搜索日志,能修正商品命名方式,編輯出更加符合用戶認(rèn)知的命名方式(這里順便提下一個(gè)免費(fèi)強(qiáng)大統(tǒng)計(jì)用戶站內(nèi)搜索的工具—google analytics)
分析你的網(wǎng)站是否需要站內(nèi)搜索
實(shí)際上現(xiàn)在站內(nèi)搜索在b2c網(wǎng)站基本是標(biāo)配,但這里仍然嘮叨一下網(wǎng)站是否需要站內(nèi)搜索,或僅僅是搜索而不引擎?
(1)考慮網(wǎng)站商品的屬性:以標(biāo)準(zhǔn)品、常見(jiàn)商品為內(nèi)容的站點(diǎn)搜索使用率會(huì)高;而較偏門(mén)的商品,如繡刺、禮品這類B2C網(wǎng)站,用戶對(duì)要搜索的關(guān)鍵詞認(rèn)知不夠,大部分用戶建立不起較清晰的心智模型,搜索使用率會(huì)偏低。
(2)考慮網(wǎng)站可能使用站內(nèi)搜索用戶的絕對(duì)數(shù),10萬(wàn)級(jí)別UV/日的網(wǎng)站,站內(nèi)搜索使用用戶的數(shù)量已經(jīng)比較可觀了,需要考慮他們的需求。
(3)考慮商品類目數(shù)量、品牌數(shù)、sku數(shù)量,根據(jù)一點(diǎn)小小的經(jīng)驗(yàn),單品牌sku小于500的服裝類網(wǎng)站站內(nèi)搜索使用率遠(yuǎn)小于5%。
(4)考慮客戶重購(gòu)率、購(gòu)買周期(其實(shí)本質(zhì)是考慮新客老客的組成),新客為主的用戶,基本是試探性搜索,搜索使用率也偏低。
總結(jié)一下:商品偏門(mén)、流量不高、sku少、新客為主的站點(diǎn),站內(nèi)搜索基本是擺設(shè),即使要上站內(nèi)搜索,亦可簡(jiǎn)單應(yīng)付。
這里要提到一點(diǎn):很多客服經(jīng)常自己需要用商品款號(hào)搜索商品,認(rèn)為非常需要站內(nèi)搜索,這不是用戶需求,只能說(shuō)明后端系統(tǒng)沒(méi)做好。
通過(guò)這么幾個(gè)標(biāo)準(zhǔn)去判斷,你會(huì)發(fā)現(xiàn)某些網(wǎng)站參考淘寶把站內(nèi)搜索醒目的擺放在網(wǎng)站最中央顯眼處是多么愚蠢!
2、考慮清楚這兩個(gè)問(wèn)題后,你決定要上站內(nèi)搜索了,那么先簡(jiǎn)單了解搜索引擎的工作機(jī)制
以下是搜索引擎的工作機(jī)制
爬蟲(chóng)抓取內(nèi)容——建立(包括新增和刪減)索引—儲(chǔ)存索引—查詢(用戶查詢)—–查詢分析—查詢結(jié)果排序—呈現(xiàn)結(jié)果
(1)要提到的是,電子商務(wù)的信息通過(guò)手工錄入或其它方式已經(jīng)導(dǎo)入到了系統(tǒng),不需要用到爬蟲(chóng)程序。
(2)所謂索引,是指搜索系統(tǒng)對(duì)信息進(jìn)行加工,把信息轉(zhuǎn)換成搜索系統(tǒng)能快速理解并方便查詢的過(guò)程。要多哪些內(nèi)容建立索引、對(duì)哪些內(nèi)容的組件進(jìn)行索引,是下文要探討的方向。
(2)查詢分析,這是最有技術(shù)含量的部分、涉及到搜索引擎的核心算法,對(duì)于中文全文檢索,這里又涉及到所謂的分詞技術(shù)。
比較復(fù)雜,下文亦會(huì)做簡(jiǎn)單解說(shuō)。
(3)查詢結(jié)果排序,這也是較復(fù)雜的部分,排序方式多種多樣。最常見(jiàn)并合理是“根據(jù)搜索關(guān)鍵詞的相關(guān)性”進(jìn)行排序,什么是最相關(guān)的搜索結(jié)果?對(duì)同一個(gè)關(guān)鍵詞,每個(gè)人的理解可能不一樣,而要通過(guò)程序去理解并判定,技術(shù)含量可見(jiàn)一斑。最著名的是Google 首創(chuàng)的page rank 排名運(yùn)算法則。下文也將對(duì)b2c的排名算法做簡(jiǎn)單闡述。
(4)搜索結(jié)果呈現(xiàn),對(duì)不懂技術(shù)的人來(lái)說(shuō),這是最容易把握,并指點(diǎn)江山的部分。下文會(huì)做重點(diǎn)闡述。
為了便于區(qū)分什么是站內(nèi)搜索,什么是站內(nèi)搜索引擎,這里貼一張分析表格(出處不詳):
本文先說(shuō)到這里,下一篇文章將闡述以下問(wèn)題
想讓用戶搜什么?
想讓用戶搜索產(chǎn)品的哪些組建?
如何平衡查全率和查準(zhǔn)率
為了讓用戶迅速定位查詢的關(guān)鍵詞,要做哪些工作?
要呈現(xiàn)哪些內(nèi)容組件給用戶?
查詢結(jié)果的排列方式?
其它輔助性功能。
界面設(shè)計(jì)
原文地址:
關(guān)鍵詞:技術(shù)
客戶&案例
營(yíng)銷資訊
關(guān)于我們
客戶&案例
營(yíng)銷資訊
關(guān)于我們
微信公眾號(hào)
版權(quán)所有? 億企邦 1997-2025 保留一切法律許可權(quán)利。