時間:2023-11-28 03:36:01 | 來源:網(wǎng)站運營
時間:2023-11-28 03:36:01 來源:網(wǎng)站運營
論壇類似淘寶網(wǎng)京東商城這樣的網(wǎng)站怎么建設(shè)呢,需要多少錢?:我沒看錯吧?貌似沒看錯……樓主,就這么說吧,本人在從業(yè)這些年的服務(wù)過程中,有時候遇到一些新客戶會咨詢:開個發(fā)淘寶或京東這樣的網(wǎng)站需要多少錢?感覺不太難,二三十萬應(yīng)該就可以開發(fā)了吧。 錯! 就拿淘寶做個例子,呈現(xiàn)給大家哈: 比如我們最常用的幾個功能: 搜索商品: 對于用戶來說,是簡單的搜索功能,對于網(wǎng)站來說可不簡單, 第一步:要有數(shù)據(jù)庫來儲存場頻,看看你的商品數(shù)是多少,1000、1000 0000、1 0000 00000和100 0000 0000這不同的量級,顯然用的數(shù)據(jù)庫是不一樣的,就像你的倉庫,放1千件的物品和1個億物品的空間肯定是不一樣的。 在網(wǎng)上,商品是放到數(shù)據(jù)庫里的,產(chǎn)品多了,數(shù)據(jù)庫就要增加,數(shù)據(jù)庫的費用就要增加。 第二步:要有搜索殷勤來搜索產(chǎn)品,因為搜索也不可能直接從數(shù)據(jù)庫里來取數(shù)據(jù),必然要用到搜索引擎(簡單來說搜索引擎更快)。 第三步:那么多的產(chǎn)品,誰家的商品出現(xiàn)在第一頁?這里需要用到巨復(fù)雜的排序算法。要是再根據(jù)你的購買行為做一些個性化的推薦——這夠一幫牛叉的算法,一般都需要頂級的工程師來完成的。 商品詳情 點擊查看商品的頁面,這個頁面有商品的屬性、詳細(xì)描述、評價、賣家信息等等。這個大家的差距在哪了?就在你的流量上了,如果你做一個網(wǎng)站每天有30個人訪問,你絲毫感覺不到服務(wù)器的壓力,但是30億,要解決的問題就多了去了。就像你做個活動一樣,來的人少,和來的人特別多,那要考慮的問題不在一個層次上的,比如10萬和100人,10萬你至少要考慮安全的方方面,人的流向等。 在網(wǎng)上首先這些請求不能直接壓到數(shù)據(jù)庫上,任何單機或分布式的數(shù)據(jù)庫,承受30億每天的壓力,都將崩潰到完全沒有幸福感,這種情況下要用到的技術(shù)就是大規(guī)模的分布式緩存,所有的賣家信息、評價信息、商品描述都是從緩存里面來取到的,甚至更加極致的一點“商品的瀏覽量”這個信息,每打開頁面一次都要刷新,你猜能夠從緩存里面來取嗎?淘寶做到了,整個商品的詳情都在緩存里面。 商品圖片 每個商品有5個圖片,商品描述里面有更多圖片,你猜淘寶有多少張圖片要存儲?100億以上。這么多圖片要是在你的硬盤里面,你怎么去查找其中的一張?要是你的同學(xué)想拷貝你的圖片,你需要他準(zhǔn)備多少塊硬盤?你需要配置多少大的帶寬?你們的網(wǎng)卡是否能夠承受?你需要多長時間拷貝給他? 據(jù)說雙十一當(dāng)天高峰,淘寶的訪問流量最巔峰達(dá)到871GB/S。這個數(shù)字意味著需要178萬個4mb帶寬的家庭寬帶才能負(fù)擔(dān)的起,也完全有能力拖垮一個中小城市的全部互聯(lián)網(wǎng)帶寬。那么顯然,這些訪問流量不可能集中在一起。并且大家都知道,不同地區(qū)不同網(wǎng)絡(luò)(電信、聯(lián)通等)之間互訪會非常緩慢,但是你卻發(fā)現(xiàn)很少發(fā)現(xiàn)淘寶網(wǎng)訪問緩慢。這便是CDN,Content Delivery Network,即內(nèi)容分發(fā)網(wǎng)絡(luò)的作用。淘寶在全國各地建立了數(shù)十上百個CDN節(jié)點,利用一些手段保證你訪問的(這里主要指js、css、圖片等)地方是離你最近的CDN節(jié)點,這樣便保證了大流量分散已經(jīng)在各地訪問的加速。 假若一個賣家發(fā)布了一個新的寶貝,上傳了幾張新的寶貝圖片,那么淘寶網(wǎng)如何保證全國各地的CDN節(jié)點中都會同步的存在這幾張圖片供用戶使用呢?這里邊就涉及到了大量的內(nèi)容分發(fā)與同步的相關(guān)技術(shù)。淘寶開發(fā)了分布式文件系統(tǒng)TFS(taobao file system)來處理這類問題。 廣告系統(tǒng) 淘寶上有很多廣告,只是它的廣告做的很人性,彷佛都是為你著想,給你做的推薦。賣家怎么出價去買淘寶的廣告位?廣告怎么展示?怎么查看廣告效果?這又是一套算法精奇的系統(tǒng)。 有時候用戶會很好奇,怎么淘寶知道自己喜歡什么,想要買什么了? 這是淘寶還根據(jù)你輸入的搜索詞進行你的購物意圖分析。比如沒有明確的購物對象和意圖,邊看邊買,用戶比較隨意和感性,像搜2017年10大香水排行;比如查詢型:有一定的購物意圖,體現(xiàn)在對屬性的要求上,像搜適合爸爸的襯衫;比如確定型:已經(jīng)做了基本決定,重點考察某個對象,像搜《圣學(xué)根之根》不二字字卡。通過對你的購物意圖的分析,主搜索會呈現(xiàn)出完全不同的結(jié)果來。 你的瀏覽數(shù)據(jù)、交易數(shù)據(jù)以及其它很多很多的數(shù)據(jù)記錄均會被保留下來。使得淘寶存儲的歷史數(shù)據(jù)輕而易舉的便達(dá)到了十?dāng)?shù)甚至更多個PB(1PB=1024TB=1048576GB)。如此巨大的數(shù)據(jù)量經(jīng)過淘寶系統(tǒng)1:120的極限壓縮存儲在淘寶的數(shù)據(jù)倉庫中。并且通過一個叫做云梯的,由2000多臺服務(wù)器組成的超大規(guī)模數(shù)據(jù)系統(tǒng)不斷的進行分析和挖掘。 從這些數(shù)據(jù)中淘寶能夠知道小到你是誰,你喜歡什么,你的孩子幾歲了,你是否在談戀愛,喜歡玩魔獸世界的人喜歡什么樣的飲料等,大到各行各業(yè)的零售情況、各類商品的興衰消亡等等海量的信息。 BOSS系統(tǒng) 淘寶的工作人員怎么去管理這么龐大的一個系統(tǒng),例如某時刻突然宣布某位作家的作品全部從淘寶消失,從數(shù)據(jù)庫到搜索引擎到廣告系統(tǒng),里面的相關(guān)數(shù)據(jù)在幾分鐘內(nèi)全部消失,這又需要一個牛叉的后臺支撐系統(tǒng)。 運維體系 支持這么龐大的一個網(wǎng)站,得需要多少臺服務(wù)器?幾千臺?那是零頭。這么多服務(wù)器,上面部署什么操作系統(tǒng),操作系統(tǒng)的內(nèi)核能否優(yōu)化?Java虛擬機能否優(yōu)化?通信模塊有沒有榨取性能的空間?軟件怎么部署上去?出了問題怎么回滾? 所以,即便是你僅僅訪問一次淘寶的首頁,所涉及到的技術(shù)和系統(tǒng)規(guī)模都是你完全無法想象的,是淘寶2000多名頂級的工程師們的心血結(jié)晶,其中甚至包括長江學(xué)者、國家科學(xué)技術(shù)最高獎得主等眾多大牛。同樣,百度、騰訊等的業(yè)務(wù)系統(tǒng)也絕不比淘寶簡單。要知道的是,你每天使用的互聯(lián)網(wǎng)產(chǎn)品,看似簡單易用,背后卻凝聚著難以想象的智慧與勞動。大家最簡單的知道人家的開發(fā)成本辦法,就是看看這些上市公司的財報了,每個季度在開發(fā)成本上都有幾千萬到幾個億不等。 看完你還覺得建設(shè)一個像淘寶一樣的網(wǎng)站,只需要二三十萬嗎?關(guān)鍵詞:建設(shè),論壇,商城
微信公眾號
版權(quán)所有? 億企邦 1997-2025 保留一切法律許可權(quán)利。