久久99久久人婷婷精品综合_超碰aⅴ人人做人人爽欧美_亚洲电影第三页_日韩欧美一中文字暮专区_波多野结衣的一区二区三区_婷婷在线播放_人人视频精品_国产精品日韩精品欧美精品_亚洲免费黄色_欧美性猛交xxxxxxxx

解讀電商O2O的搜索系統

2022-06-29    分類: 網站建設

之前的文章探討過用戶端背后系統的邏輯和結構情況,后續我會考慮逐步解構每個相關系統的情況。今天跟大家聊一聊搜索系統,搜索系統在所有電商系統里面復雜度和難度是可以排的上前列的。關于算法方面介紹的文章很多,這里不做贅述,只解構下搜索系統的基本邏輯和實現。對于產品來說未免溝通時“露怯”,了解搜索系統的基本知識和結構是有必要的。

搜索系統的“基本介紹”

搜索系統,顧名思義提供大數據查找篩選的系統功能。在電商和O2O領域作為一個主要的流量入口起到了至關重要的作用。

“基本介紹”:指標

對于搜索來說,主要的指標為準確率和召回率。我們以下圖為例解釋下什么叫做準確率和召回率。

圖中整體的部分為所有商品數據的全集,其中包括不相關和相關的內容。


準確率:搜索結果中相關內容的比例,即圖中A的部分

召回率:搜索結果占整體內容的比例,即A+B

由此我們可以看出,最好的結果是A足夠大且B足夠小,但實際實現中會發現兩個指標是相反的(召回率越高準確率會越低)。需要通過規則來平衡這塊部分。

“基本介紹”:基礎結構

搜索系統主要的組成部分有幾塊:


  1. 切詞邏輯
  2. 詞庫
  3. 基礎信息
  4. 加權規則
  5. 排序展示邏輯
  6. 整體流程如下


名詞解釋:


  • query:是查詢的意思,這里指用戶在搜索框輸入的內容。
  • 切詞:又叫分詞,是根據詞庫/詞典將一段文本進行切分以便機器識別的過程。
  • 詞庫:指用于切詞的詞庫。
  • 加權:將檢索結果集按照一定的維度、規則進行打分就叫做加權。
  • 索引:商品信息存儲時需要建立索引,索引作為每個商品的標識方便在大數據量的情況下快速查找篩選。

“基本介紹”:應用場景

搜索的應用一般有兩種:全文檢索和suggest。其中suggest的規則比全文檢索要簡單一些。服務上由于suggest一般支持模糊查詢的情況,所以要考慮服務上是否要獨立還是公用一套。

搜索系統的“工作履歷”:流程解構

切詞/詞庫

切詞,又叫分詞。用于將用戶輸入的無結構化字符變成機器可識別的詞組。市面上有很多成熟的切詞組件。切詞邏輯有很多種,根據字符、概率等,電商和O2O一般使用字符串切詞的方式處理。關于切詞的方法最基礎的有大正相匹配、大逆向匹配、雙向匹配等,具體的內容可以百度查詢。切詞工具根據詞庫中的詞典進行切分,一般開源的切詞工具都有默認的詞庫和自定義詞庫兩種情況。用戶可通過添加自定義詞庫來完善補充。

這里面需要強調的是切詞時候的過濾,尤其生鮮類非標品情況下特別需要注意。

單字詞、助詞之類的是否要過濾掉。如米、面、油等

別名情況的處理,尤其是生鮮類。比如在北京叫油菜,在上海叫上海青,在重慶叫漂兒白

檢索結果集

根據切出的詞語進行匹配,匹配到的商品信息集合為檢索結果集。結果集需要做檢索、過濾、標記三個步驟。

檢索

檢索項包括但不限于:


  • 商品名稱
  • 商品標題、副標題
  • 商品描述
  • 商品參數、規格
  • 商品品牌(生鮮副食品類尤為重要,比如五得利面粉、鵬程五花肉)
  • 商品品類(一級類、二級類)
  • 別名關聯商品
  • 促銷類型

成熟的電商系統不僅僅實現用戶的基本商品檢索,還會根據query進行意圖分析來進行query轉換。以生鮮電商舉例,當用戶搜索“豬肉”時,用戶希望獲得的不是含有豬肉詞語的商品,而是豬肉的各個部位、豬肉級別等。這時應該轉化為后臀尖、前臀尖、里脊,一級白條等詞語進行檢索,而不是匹配豬肉。意圖分析主要有兩個方面

行為模式分析

用戶畫像分類

過濾

獲取的結果集需要經過去重、過濾的處理。此部分行為可以在加權打分后進行處理,也可以安排在初選結果后處理。

同一個商品被多個詞語命中需要去重

現實中的電商搜索可能會根據不同的場景構建所謂的“小搜索”,如按照類目、按照品類、按照定制化場景等。所以針對不同的搜索場景可能會有單獨的過濾去重條件,也可以在構建數據的時候使用不同的庫進行處理。

O2O場景需要按照一定區域概念(城市、商圈等)進行過濾

售罄商品需要過濾

下線商品需要過濾

標記

在檢索完成后需要對數據進行標記,以便后續做加權時使用。此步也可以在做加權處理的時候同步進行。

加權

加權的目的是為了根據模型確定結果集各個商品的排序優先級。加權的維度有很多,根據不同的場景考慮也會有所區別。

加權因子主要分為幾個維度:

相關度

商業化因素

個性化因素

人為因素

數據模型統計

相關度

這里指的是分詞的相關度。包括文本匹配、詞間距、是否是中心詞、品牌詞等。中心詞的概念是是否命中了核心的詞語,中心詞和品牌詞也需要有對應的詞庫進行維護更新。詞間距是計算相關性的一個維度,比如一段文本中包含清華、大學,“清華大學xxxxxxx”和“清華xxxxxxx大學”相比肯定是前者相關性更高一些。

這里面有幾點需要注意:

query被完整匹配和部分匹配的權重是不同的

單詞命中和多詞命中同一商品也需要考慮權重情況

商業化因素

考慮業務場景下需要關注的因素稱之為商業化因素。

商品庫存

是否新品(考慮新品的特殊性,也可以將此權重獨立打分)

商品銷量

是否促銷商品

銷售額

商品分類

商品品牌

CTR(廣告類的商品要考量)

所屬平臺(POP、自營)

區域(020屬性)

終端情況(手機、PC)

個性化因素

按照個人使用的情況進行個性化排序,做到所謂的“千人千面”。包括下單數據分析等。這部分同意圖分析的情況類似。

人為因素

在日常運營過程中,有很多需要做強制人為干預的事情(如人工置頂)。所以在加權的時候需要考慮此類行為。

數據模型統計

可以根據用戶的一些行為數據或者埋點數據分析,提供綜合排名靠前的商品或者分類做單獨加權權重。包括:

用戶點擊

用戶收藏

購買數

排序處理

根據加權的情況和一些特殊的處理,需要對最終輸出的結果做排序調整。

這里提供兩種方法供大家參考

可以按照加權打分的分值之和做排序。這樣做比較直接,但在后續調整的過程中驗證規則時容易混淆不清晰。

將不同的權重維度單獨計算,生成一個長位數的標識符,每個權重在標識符上有自己的位置。按照優先級的順序從左到右依次排列。考慮到機器計算的易用性上,可以在加權時使用十進制,然后統計時轉換成二進制即可。類似下圖這樣,位數和排序可以根據具體業務場景制定。


最后要說下,在算法中要考慮相同因子下的打散,比如同一個商家店鋪下的商品排序需要按照一定比例分布在不同地方,避免一次性展示過多同類商品。

如果系統能力富足,也可以增加單獨的反作弊模塊來處理一些惡意刷單刷榜的情況。

搜索與“大家”的關聯

搜索系統主要為用戶端提供搜索結果的輸出,輸入方面來自于相關的下游系統。

當搜索場景進一步細分時,要考慮更多數據的對接和分類。

在設計時有幾個需要注意的地方:

搜索數據比較龐大,直接使用API調用實時數據對于系統壓力過大,一般可采取搜索自建索引庫,定時(比如15分鐘)從相關系統拉取數據的方式。

基于不同的場景可以提供單獨的索引庫來實現,避免邏輯耦合不好分離做個性化。

用戶端在調用suggest時考慮到服務壓力,建議延遲幾秒請求數據。

分詞詞庫的維護也依賴于定期從相關系統中獲取補充。


結語

搜索系統的核心是算法,從產品層面來說更多是關注業務邏輯規則以及上下游的依賴情況。本文對搜索的一些通用情況做了簡單介紹,更深入的內容還需要大家在日常過程中進一步的深挖。

網頁題目:解讀電商O2O的搜索系統
網址分享:http://www.js-pz168.com/news4/173204.html

成都網站建設公司_創新互聯,為您提供Google外貿網站建設、網站設計公司、企業建站定制開發、小程序開發

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

h5響應式網站建設
久久99久久人婷婷精品综合_超碰aⅴ人人做人人爽欧美_亚洲电影第三页_日韩欧美一中文字暮专区_波多野结衣的一区二区三区_婷婷在线播放_人人视频精品_国产精品日韩精品欧美精品_亚洲免费黄色_欧美性猛交xxxxxxxx
在线视频中文字幕一区二区| 国产伦精品一区二区三区视频孕妇| 亚洲尤物视频在线| 欧美国产激情一区二区三区蜜月| 欧美视频在线播放| 影音先锋欧美在线| 欧洲精品国产| 久久爱av电影| 国产二区不卡| 成人高清在线观看| 91在线观看美女| 91在线国产观看| 99国产精品久久久| www.视频一区| av资源站一区| 成人毛片老司机大片| 国产美女娇喘av呻吟久久| 韩日精品视频一区| 激情小说亚洲一区| 国产综合久久久久久鬼色| 国内成人精品2018免费看| 老鸭窝一区二区久久精品| 理论电影国产精品| 久99久精品视频免费观看| 久久99精品国产麻豆婷婷| 国产在线精品不卡| 国产91精品精华液一区二区三区 | 99一区二区三区| 国产精选一区二区| 久久国产精品 国产精品| 欧美精品尤物在线| 亚洲一区二区在线免费观看| 色综合色综合色综合色综合色综合| 色94色欧美sute亚洲线路二| 欧美性色黄大片手机版| 日韩一区国产二区欧美三区| 精品国产区一区| 亚洲天堂免费看| 秋霞av亚洲一区二区三| 成人激情小说乱人伦| 国产精品二区三区四区| 午夜精品一区二区在线观看的 | 亚洲欧美日韩人成在线播放| 婷婷久久综合九色综合绿巨人 | 日本视频一区二区不卡| 椎名由奈jux491在线播放 | 国产精品一区二区男女羞羞无遮挡| 成人免费视频国产在线观看| 国产综合精品一区二区三区| 中文字幕欧美人与畜| 精品国产1区二区| 一区二区三区免费在线观看| 国产综合一区二区| 国产伦精品一区二区三区在线| 亚洲一区二区三区乱码| 精品国免费一区二区三区| 一卡二卡欧美日韩| 成人av在线播放网站| 日韩久久不卡| 2022国产精品视频| 日韩国产高清在线| 国产精品青青草| 欧美午夜一区二区| 亚洲日本在线看| 国产一区999| 亚洲一区二区三区色| www久久久久| 另类综合日韩欧美亚洲| 国内一区二区三区在线视频| 欧美亚一区二区| 尤物av一区二区| 7777精品伊久久久大香线蕉语言 | 久久久婷婷一区二区三区不卡| 51精品国自产在线| 亚洲成av人影院在线观看网| av亚洲精华国产精华精| 欧美日韩精品一区二区三区四区 | 日本欧美肥老太交大片| 久久亚洲精品欧美| 久久久久97国产精华液好用吗| 久久99国内精品| 色综合中文字幕国产 | 在线观看日韩一区| 亚洲国产精品久久久男人的天堂| aaa亚洲精品| 91麻豆精品国产91久久久久 | 欧美自拍偷拍午夜视频| 亚洲网友自拍偷拍| 精品免费视频123区| 久久亚洲捆绑美女| 成人在线一区二区三区| 欧美色中文字幕| 美国av一区二区| 91久久线看在观草草青青| 亚洲丶国产丶欧美一区二区三区| 精品无人乱码一区二区三区的优势 | 欧美国产激情二区三区| 91在线播放网址| 久久久亚洲午夜电影| 不卡一区二区三区四区| 精品国产a毛片| a级精品国产片在线观看| 欧美成人aa大片| 成人免费黄色大片| 精品少妇一区二区三区在线视频| 大尺度一区二区| 精品动漫一区二区三区在线观看| 成人av资源网站| 久久精品视频免费观看| 操一操视频一区| 中文字幕一区二区三区乱码在线| 国产在线播放一区二区| 色综合亚洲欧洲| 极品瑜伽女神91| 欧美成人一区二区| 91小视频免费观看| 国产精品视频yy9299一区| 久久99国产精品| 亚洲国产裸拍裸体视频在线观看乱了 | 日本精品一区| 奇米精品一区二区三区在线观看| 欧美人与禽zozo性伦| 99视频精品全部免费在线| 国产精品久久一级| 亚洲一区二区三区精品视频| 极品少妇xxxx偷拍精品少妇| 精品伦理精品一区| 精品欧美一区二区在线观看视频| 亚洲午夜电影网| 3d成人h动漫网站入口| 国产二区一区| 午夜激情综合网| 欧美一级欧美三级在线观看| 99热在这里有精品免费| 亚洲女同一区二区| 欧美亚洲国产一区在线观看网站| 成人av在线网站| 亚洲综合在线五月| 日韩一区二区三区电影在线观看 | 2014亚洲片线观看视频免费| 久久综合九色99| 国产一区二区三区美女| 欧美国产视频在线| 91精品福利视频| 亚洲视频精选在线| 欧美日韩国产高清一区| 国产精品久久久久久久久久久久冷| 日韩高清一级片| 国产精品久久三| 777午夜精品免费视频| 欧美日韩精品免费看| 国产91露脸合集magnet| 亚洲第一成年网| 国产精品欧美一级免费| 欧美日韩在线电影| 久久久人人爽| 99久久精品免费看国产| 蜜臀国产一区二区三区在线播放| 国产日韩精品一区二区三区| 欧美中文字幕亚洲一区二区va在线| 国产高清在线精品一区二区三区| 美女被吸乳得到大胸91| 国产精品久久久久影院老司| 日韩一区二区三区av| 日本福利一区二区| 欧美一区二区三区四区在线观看地址| 不卡区在线中文字幕| 久久er99精品| 亚洲成av人在线观看| 亚洲私人黄色宅男| 国产日韩精品一区二区浪潮av | 日本中文字幕一区二区有限公司| 亚洲欧洲性图库| 国产偷国产偷亚洲高清人白洁| 欧美日韩国产一级| 在线观看亚洲a| 一道本成人在线| 天堂av一区二区| 久久精品国产理论片免费| 97超碰人人看人人| 91在线精品一区二区| 风流少妇一区二区| 国产精品18久久久久| 国产一区在线视频| 韩国成人在线视频| 激情六月婷婷综合| 国产一区二区三区国产| 国产在线观看免费一区| 久久国产精品99精品国产| 日韩不卡免费视频| 免费亚洲电影在线| 日本在线不卡视频| 久久国内精品自在自线400部| 免费成人av在线播放| 久久99精品久久久| 国产福利精品一区二区| 不卡的av在线播放| 国产精品jizz视频| 欧美日韩视频在线一区二区观看视频| 久久综合九色综合网站|