小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

【干貨】由淺入深的解析京東搜索

 軍休強軍路 2016-01-03

【干貨】由淺入深的解析京東搜索

京東

siilu思路網(wǎng) · 2015-12-29 22:36

【干貨】由淺入深的解析京東搜索

點擊上方“思路網(wǎng)”可以訂閱哦!

思路網(wǎng)
趁著夜深人靜的時候整理下思緒,從淺到深的普及一下京東的搜索知識以及最近京東的一些變革。

來源:派代網(wǎng)

作者:李子lz

趁著夜深人靜的時候整理下思緒,從淺到深的普及一下京東的搜索知識以及最近京東的一些變革。對一些基礎的小白問題,請允許我貼一些資料~最近的變革也會穿插其中。

一、最常問的搜索多久更新?很多人搞不明白,下面所說的情況不包含系統(tǒng)故障。

A

搜索上更新分為兩部分:增量更新和全量更新(兩者不沖突)。

增量更新:商品組及時將消息發(fā)送到搜索,搜索將接受到的消息更新。一般10-30分鐘內(nèi)即可被搜索到。

全量更新:搜索每天都會對搜索的數(shù)據(jù)庫重新建索引,保證在數(shù)據(jù)庫中的數(shù)據(jù)都更新(下午6點離線(不影響線上)開始生成數(shù)據(jù),再推送到線上,期間時間較長,第二天PC、列表、其它所有客戶端9點前都會基本完成更新)。

A:

1. 上架成功后,一般是半個小時內(nèi)(沒有勾選“上柜不展示”,去除此勾選是第二天被索引,若在18點后去除則是第三天被索引)即可被索引到,最遲第二天被索引(增量沒接到消息時通過全量更新)。

2. 下架成功后,立刻--10分鐘后不再被搜索到

3. 庫存變更后,立刻—30分鐘可以被搜索識別到新庫存

4. 價格變動后,立刻—10分鐘可以被搜索識別到新價格

5. 銷量、金額,搜索反饋等第二天更新

6. 配送區(qū)域、限購區(qū)域等第二天更新

7. 圖片、屬性區(qū)(品牌等)、標簽第二天更新

8. 店鋪內(nèi)的分類第二天更新。

9. 基礎廣告詞第二天更新(最好白天更新,因廣告詞單獨邏輯,每天都是晚上讀數(shù)據(jù)庫)。

10. 價格模型數(shù)據(jù)每周更新一次(搜索頁周二/列表頁周一更新),品牌模型數(shù)據(jù)(依賴于商品表和訂單表)每天更新。

二、不同顏色、不同尺寸的SKU都可以搜索到嗎?

A:

1、SKU只有顏色時,所有顏色的SKU都可以搜索到

2、SKU有顏色和尺碼時,同顏色可以搜到一個尺碼,是15日銷量最大且有庫存的,其他尺碼也可索引,但前端展示還是銷量最大且有庫存的。

3、SKU顏色為空,只有尺碼時,所有尺碼都可以被搜索到。

備注:

1、此處“庫存”數(shù)據(jù)第二天更新

2、上架當天同顏色不同尺碼全部能搜索到,當全量更新后識別同顏色不同尺碼中有庫存且銷量最大的。

3、同一個商品的相同顏色只能索引一個顏色。

三、商品的哪些信息可以被搜索到?

A:搜索首先需文本匹配,而不是商品所有信息的文本都可被搜索,不同品類被索引的字段不同,如下:

3C和日百品類:商品名稱、品牌、同義詞、三級分類(AB、A/B分類不索引如奶瓶奶嘴、戒指/耳飾)、擴展屬性、基礎廣告詞、店鋪名稱、店鋪ID、顏色、尺碼(3C顏色和尺碼除外)、3C規(guī)格參數(shù)(型號|顏色|操作系統(tǒng)|網(wǎng)卡|核心數(shù)|推薦用途|適用機型|適用型號|打印機類型|聲道系統(tǒng)|定頻/變頻|自動化程度|類別|主板兼容|適用范圍|接口類型|散熱器類型|核心|攝像頭|CPU核數(shù)|CPU型號|CPU類型)、送禮搜索、大家說。

圖書音像品類:

圖書商品系列名稱、圖書商品出版商、圖書商品作者、圖書商品譯者、圖書商品外文名稱、圖書商品編輯、圖書商品美編、同義詞字段、店鋪名稱、擴展屬性、書寫、高級關鍵詞、二級分類名(后續(xù)會替換成三級分類)、ISBN。

音像商品系列名稱、音像商品導演、音像商品演員、音像商品外文名稱、音像商品出版社、音像商品演唱者、音像商品表演者、音像商品錄制者、同義詞字段、二級分類名稱、店鋪名稱、擴展屬性、產(chǎn)品評級、廠牌、發(fā)行公司、介質(zhì)、作詞、作曲、編劇、指揮、知名樂團、演奏、又名、高級關鍵詞。

行動建議:在不影響現(xiàn)有的正確搜索結(jié)果,采銷若需添加新的索引字段,請?zhí)峁┫嚓P的數(shù)據(jù)給搜索評估(依據(jù):對現(xiàn)有搜索結(jié)果帶來正向影響)。

四、為什么我關心的商品沒被搜索到?

A:

1、 新品上架最遲第二天才能被索引到,請先確認是否上架成功,另外是否后臺設置了上架不展示(圖書分類無上柜不展示)。

2、 確認搜索的關鍵詞,在商品已被索引的字段中包含。

3、 用商品的全稱(標題所有文本)去搜索,看是否可以搜出來。因有時短詞搜索你關注的商品可能因銷量等數(shù)據(jù)很少而排在后面,不容易被發(fā)現(xiàn)。

4、 同顏色不同尺碼只索引銷量最大且有庫存的SKU,其他SKU的文本也可被索引,但展示的是銷量最大且有庫存的SKU;

5、 被識別品牌作弊的SKU,在搜索品牌庫中的品牌詞時被過濾;

6、商品需正確綁定品牌;

7、“送XX禮物”、“XX禮物”等搜索詞會觸發(fā)搜索送禮邏輯,反饋中有這些字段(即評價中出現(xiàn)2次以上)的才會被索引(只在標題等含有這些字段是不行的)。

8. 店鋪內(nèi)分類綁定需再第二天才能被索引;

9. 搜索結(jié)果超3W會被截斷(文本+商品質(zhì)量分),但搜索頁數(shù)只展示100頁(解決點擊篩選后頁數(shù)變多的體驗問題)。

五、為什么我關心的商品排名突然下降很大?

A:

1. 先確保用商品全稱是否搜索到(單純修改詳情頁不會影響排名);

2. 當前用戶所在城市無庫存的商品降權,請先查看當前訪問jd.com的用戶所在地,確認該商品在本地區(qū)是否有貨

3. 搜索規(guī)則是根據(jù)各個因子的數(shù)據(jù)來綜合排名,若數(shù)據(jù)發(fā)生變化,排名也會變化:如搜索計算的是3日和15日完成銷量數(shù)據(jù),若計算周期內(nèi)商品銷量數(shù)據(jù)已不再像前一天那么高則排名自然會受到影響;若在前一天計算權重時,與競爭對手銷量差不多,但轉(zhuǎn)換率和好評率競爭對手有量變到質(zhì)變的提高,則商品排名也會受影響。(排除搜索系統(tǒng)異常)

4. 作弊商品會被降權;

5. 價格模型對商品排名也有影響。(價格模型每周二晚更新,周三排名有可能下降)

6. 店鋪穿插會使某些店鋪的展示數(shù)有所下降,但是會提升前幾頁的資源分配。

7. 商品的上下架有時也會影響當天的排名(商品質(zhì)量分,此權重在下午2-4點計算,若在此時間段上下架,會計算不到當天的商品質(zhì)量分,但取不到商品質(zhì)量分時,搜索會默認為是新品賦予一個權重值=3),第二天會恢復正常。

8. 若修改了商品銷售屬性(如A商品無尺碼,商家增加B商品時,給A商品多添加了尺碼)導致SKUID變化會影響排名(不管修改什么屬性,只要SKUID不變,商品排名就不會受太大影響,除非商品更換分類)。

9.最近正在分批上線的品牌模型和人氣模型,以及京東系統(tǒng)AB,不包含系統(tǒng)故障因素。

以上是針對最近提問一些比較多的基礎的問題,下面說下京東搜索優(yōu)化的一些重要知識點。

1、高相關分類:我們大家都知道京東的搜索是有高相關分類一說的,高相關分類顧名思義就是和搜索關鍵詞相關性最高的三級類目,此三級類目會在搜索的時候優(yōu)先展現(xiàn),這個是系統(tǒng)根據(jù)很多緯度的數(shù)據(jù)計算出來的,并不是人為的。

以關鍵詞“紅豆”為例,紅豆是一種食材,同時這個詞也是一個男裝品牌的名稱,那么在京東搜索的時候會優(yōu)先什么類目呢,大家可以自己搜索下試試。系統(tǒng)判斷“米面雜糧”類目更適合展現(xiàn)給消費者,對平臺的GMV更有利,所以會優(yōu)先展示米面雜糧類目的產(chǎn)品,而不展示男裝類目。關于這塊,可以使用第三方工具“老板通”查詢。

2、文本相關性:京東會對平臺產(chǎn)品建立索引,然后當消費者搜索的時候,系統(tǒng)就會根據(jù)索引進行召回,并根據(jù)文本相關性得分進行排序,這是整個搜索系統(tǒng)工作的大概流程。那么系統(tǒng)會索引產(chǎn)品的那些屬性呢?給大家總結(jié)下:

a、標題

b、副標題廣告詞

c、品牌

d、商品屬性

e、銷售屬性

f、詳情文字

g、評價內(nèi)容及標簽

h、店鋪名稱


大家可以根據(jù)以上總結(jié)的點來對自己的產(chǎn)品和店鋪來進行針對性的優(yōu)化,思考怎么讓系統(tǒng)在消費者進行搜索的時候會對你的信息進行召回。

那怎么知道消費者會對哪些詞進行搜索呢,可以參考一些行業(yè)數(shù)據(jù),比如數(shù)據(jù)羅盤的熱搜詞或者老板通的關鍵詞以及類目數(shù)據(jù)查詢,可以直接看到類目或者指定關鍵詞每天的成交單數(shù),這個數(shù)據(jù)是過濾之后的,可以以此推算某個關鍵詞對應位置的所需的刷單單量。

前八的坑位平均所需單量計算公式:單天整詞訂單量*0.9*0.4/8

0.9為第一頁成交單量占比,0.4為前八成交量在第一頁的占比,8為坑位數(shù)

這個系數(shù)是全平臺平均,某些類目可能有偏差,但誤差不大。

建議可以把行業(yè)數(shù)據(jù)全部拉出來,做成表格,包含搜索量、成交量、客單、在競商品數(shù)、前八所需單量等多列對比緯度,來對關鍵詞進行判斷,以達到減少投入增大效果的目的。


3、價格模型:京東于九月份基本全類目上線了價格模型,目前是第一階段的價格模型,二階段的多區(qū)間帶價格模型預計明年才能和大家見面了,先說一階段價格模型,這個是比較簡單的,就是如果你的產(chǎn)品售價在系統(tǒng)給予的高權重價格區(qū)間內(nèi),你的產(chǎn)品就可以獲得加權,只要在區(qū)間內(nèi),不分價格高低,權重都一樣,在區(qū)間內(nèi)再進行分段就是二階段價格模型了。京東明年的方向會主抓品牌這塊,整個平臺會對優(yōu)質(zhì)的產(chǎn)品進行資源傾斜,其中在搜索這塊,能體現(xiàn)產(chǎn)品優(yōu)質(zhì)的一個系統(tǒng)判別緯度就是高價,那么這塊就很容易做了。

可以不斷的給自己的產(chǎn)品加價,然后刷新看排名,自己把握這個度,別一雙襪子都加到一百多,排名上去了也賣不掉,這種情況是真是出現(xiàn)過。價格模型是每周二進行更新,周期7天。

4、標題優(yōu)化:標題優(yōu)化說幾點技巧

a、標題內(nèi)的括號“()”內(nèi)的內(nèi)容是不計入標題長度的,一些不重要的說明信息可以寫在里面

b、副標題可以被索引,可以展示在搜索結(jié)果頁,優(yōu)惠信息等可以寫在這,并且可以展現(xiàn)在搜索頁

c、標題越短越好是沒錯的,權重高是一個,第二是搜索可以看到副標題,空格是不計入長度的,但如果想做完全匹配的詞,建議加空格,比如“風衣 女”,消費者喜歡加空格搜索或者搜索下拉框就是帶空格的,那么建議加空格,因為系統(tǒng)優(yōu)先召回完全匹配

d、同義詞縮減,比如“女士”和“女”在京東系統(tǒng)眼里,他倆是一樣的,沒區(qū)別,可以直接寫成“女”以縮短標題。

e、最好不要堆砌關鍵詞,標題長權重低不說,被抓到要扣分,雖然被抓的比較小,建議把所有想做的詞拉出來之后,進行拼裝縮減,詳情見我以前寫的帖子(半途而廢了,不好意思)。

5、流量入口概況:目前京東的流量入口分兩大塊

PC:搜索+類目列表頁

移動端:APP+M端+微信+手Q

搜索成交訂單量在這兩大端口的成交量都在一半以上。說兩點關于這塊的事情:

a、移動端的微信和手Q的類目列表頁其實不是和APP一樣的,他們的類目頁其實是某些關鍵詞的搜索頁,大家可以自己試試,如果拿到這些詞在PC的排名,相當于微信和手Q的類目也拿到了。(目前是這樣)

b、移動端和PC端的排名正在進行拆分,已經(jīng)有個別類目拆分完成了,還有正在進行測試的,數(shù)據(jù)源用的還是一樣的,但是應用模型不一樣,以后大家做排名可能就要分開做了。


6、人氣模型:人氣模型原本計劃Q3全品類上線,目前還沒有做到,但也差不多覆蓋一半的類目了。人氣模型上線后和之前的商品質(zhì)量得分還是比較大的,主要體現(xiàn)在:

a、周期評論增加數(shù)替代總評論數(shù)計算權重

b、刪除提換貨率、跳失率和訪問時間

c、新增緯度關注數(shù)、加入購物車和訪問深度

7、品牌模型:品牌模型已于618之前上線,這就是為什么有些類目,某些評論很少的產(chǎn)品可以排在最前面,就是品牌模型在起作用。品牌模型主要考核的一些點有:

a、擴展區(qū)點擊量

b、搜索量

c、GMV

d、銷量

e、單價

8、店鋪模型:店鋪模型的主要作用是進行資源平均,避免一個店鋪的產(chǎn)品扎堆顯示,造成消費者的選擇疲勞,同一個店鋪的產(chǎn)品會被系統(tǒng)強制穿插,意思就是原則同一個店鋪有兩個產(chǎn)品可以排在第一和第二的,店鋪模型應用后,只能是第一和第五。

9、個性化搜索:這個還在開發(fā)。。。不知道什么時候上線,不過已經(jīng)應用在一些推薦位了,例如感興趣,最佳組合等。

10、新品模型:顧名思義,新品有加權周期30天,搜索新品加權相同。

11、季節(jié)模型


    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多