首先,我們用AI去重塑商品系統(tǒng)。大家可以看到,過去京東圖片數(shù)據(jù)" />

国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

18143453325 在線咨詢 在線咨詢
18143453325 在線咨詢
所在位置: 首頁(yè) > 營(yíng)銷資訊 > 行業(yè)動(dòng)態(tài) > 商品數(shù)據(jù)智能化

商品數(shù)據(jù)智能化

時(shí)間:2022-03-26 04:39:01 | 來源:行業(yè)動(dòng)態(tài)

時(shí)間:2022-03-26 04:39:01 來源:行業(yè)動(dòng)態(tài)

在商品數(shù)據(jù)的存儲(chǔ)和計(jì)算基礎(chǔ)設(shè)施構(gòu)建之后,近兩年來,京東主要的工作就是做數(shù)據(jù)的智能化。接下來分兩個(gè)方面給大家做一下介紹,一是圖片的智能,二是文本的智能。

首先,我們用AI去重塑商品系統(tǒng)。大家可以看到,過去京東圖片數(shù)據(jù)的增長(zhǎng)量,如今已經(jīng)達(dá)到千億級(jí)規(guī)模,這樣快速的數(shù)據(jù)擴(kuò)張會(huì)使得整個(gè)IDC的流量成倍增加,進(jìn)而增加IT成本。因此,我們必須要對(duì)圖片做智能壓縮從而降低運(yùn)營(yíng)成本,提升用戶的體驗(yàn)。對(duì)此,京東推出了YOP技術(shù),它可以把所有的圖片大小降低30%。同時(shí),在今年年初,我們還推出了DBT的全新技術(shù),它可以在YOP的基礎(chǔ)上將圖片縮小將近50%,不僅減少帶寬,還可以提升終端用戶加載。特別是對(duì)于商品自身的特性,在這個(gè)過程當(dāng)中,我們還通過優(yōu)化壓縮了三倍。

在圖片方面的第二個(gè)重要應(yīng)用就是圖片的合成。大家知道,對(duì)于任何一家電商來說,在很多活動(dòng)或廣告推廣之前都是由UED先進(jìn)行編輯的。但是,從去年下半年開始我們做了一個(gè)工作,實(shí)現(xiàn)了1%的圖片都由機(jī)器進(jìn)行合成。這個(gè)工作分成三個(gè)部分:一是對(duì)商家的原圖做智能扣圖,二是學(xué)習(xí)UED的智能排版,三是系統(tǒng)功能的優(yōu)化工作,把扣圖以及美學(xué)排版進(jìn)行高質(zhì)量合成。當(dāng)前,我們機(jī)器合成的圖片數(shù)量大概占了商品總數(shù)的1%,預(yù)計(jì)兩年之后這個(gè)比例可能會(huì)達(dá)到15%到20%,也就是說常見的活動(dòng)商品圖都會(huì)由機(jī)器來做。

在這樣一個(gè)流程中,很多設(shè)計(jì)師的排版經(jīng)驗(yàn)是可以學(xué)習(xí)的?,F(xiàn)在由機(jī)器和算法來進(jìn)行一些簡(jiǎn)單商品詳情頁(yè)的排版、自動(dòng)合成,不僅減少了很多人工同時(shí)也可以大大提高效率。當(dāng)然,現(xiàn)在這個(gè)工作還在進(jìn)行當(dāng)中,還需要一些時(shí)間去落地。除此之外,圖片的智能化還包括相似圖片的搜索。結(jié)合智能排版技術(shù)對(duì)圖片的翻譯做自動(dòng)化,借助全球化戰(zhàn)略,京東希望能夠最終實(shí)現(xiàn)快速的全球化商品推送。

第二部分是商品文本數(shù)據(jù)的智能化,其中最重要的是個(gè)性化廣告和搜索。這兩年,我們做的一個(gè)基礎(chǔ)服務(wù)是商品知識(shí)圖譜,即對(duì)包括工業(yè)數(shù)據(jù)和用戶生成數(shù)據(jù)等在內(nèi)的商品基礎(chǔ)數(shù)據(jù)做進(jìn)一步的挖掘和抽象。通過對(duì)商品工業(yè)數(shù)據(jù)做屬性判斷,做類目的進(jìn)一步抽取,對(duì)用戶評(píng)價(jià)做情感和關(guān)鍵詞的挖掘,從而形成一個(gè)中間的知識(shí)服務(wù),或者說圖片數(shù)據(jù)。在此基礎(chǔ)上,向上賦能更多智能應(yīng)用,包括搜索和個(gè)性化索引等等。

舉兩個(gè)例子:一是核心產(chǎn)品詞的識(shí)別,這是一個(gè)經(jīng)典的命名識(shí)別問題,在商品詞里邊有一個(gè)獨(dú)特的挑戰(zhàn),就是因?yàn)檫@個(gè)詞是商家自己錄入的,如何找到核心商品的真實(shí)標(biāo)題,這目前在學(xué)術(shù)界都沒有很好的解決方案。為此,我們通過對(duì)規(guī)則、知識(shí)庫(kù)進(jìn)行建模來解決。

再比如評(píng)論關(guān)鍵詞的抽取,因?yàn)檫@是用戶收錄的,口語(yǔ)話非常嚴(yán)重。因此,如果我們要把這個(gè)口語(yǔ)話設(shè)置為一個(gè)高質(zhì)量標(biāo)簽,需要有很好的方法才能構(gòu)建商品評(píng)價(jià)的語(yǔ)意知識(shí)庫(kù)?;谏唐穲D譜,除了廣告、搜索之外,我們還建立了智能客服機(jī)器人。這個(gè)是成都的一個(gè)研發(fā)團(tuán)隊(duì)來做的,基于商品圖譜去做優(yōu)化和賦能。

另外一個(gè)智能應(yīng)用就是寫作機(jī)器人。剛剛談到了,圖片可以由機(jī)器合成,而一些商品的導(dǎo)購(gòu)語(yǔ)和活動(dòng)短文也可以由機(jī)器去合成。它基于知識(shí)圖譜的一些標(biāo)簽和推理檢索能力,加上機(jī)器深度學(xué)習(xí)的語(yǔ)言生成,從而節(jié)省人工創(chuàng)造的成本。

總結(jié)來說,在商品大數(shù)據(jù)領(lǐng)域,我們主要做的幾個(gè)工作首先就是存儲(chǔ),其次是計(jì)算,以此為基石向上再去構(gòu)建知識(shí)圖譜,以進(jìn)一步優(yōu)化智能化的服務(wù)。當(dāng)然,和其他行業(yè)相比,這個(gè)領(lǐng)域自身存在著很多不一樣的挑戰(zhàn),雖然目前我們?nèi)〉昧艘恍┻M(jìn)展,但還有很多的工作都在開展過程當(dāng)中,希望接下來能夠得到在座的專家和同行們更多的建議和指導(dǎo)。

謝謝!

關(guān)鍵詞:數(shù)據(jù),商品

74
73
25
news

版權(quán)所有? 億企邦 1997-2022 保留一切法律許可權(quán)利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點(diǎn)擊下載Chrome瀏覽器
關(guān)閉