精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

無需等待:電商領域重排模型在線學習可以先于用戶反饋

人工智能
本文將介紹一種新型的用于重排的在線學習方法,該方法不強依賴用戶反饋,能夠確保模型的實時性。該方法由阿里巴巴與中國人民大學共同提出。

在當前典型工業應用推薦系統 pipeline 中,重排作為最后一個環節,決定最終的推薦結果,因此需要綜合考慮多樣的業務需求以及復雜物料的融合。經典的在線學習依賴用戶反饋,在電商場景,用戶完成一次購買決策通常需要幾小時甚至幾天,這無法避免地限制著在線學習的實時性。本文將介紹一種新型的用于重排的在線學習方法,該方法不強依賴用戶反饋,能夠確保模型的實時性。該方法由阿里巴巴與中國人民大學共同提出。

一、Background:實時在線學習&重排模型基本概念

首先介紹一些實時在線學習和重排模型相關的基本概念。

1. 實時在線學習

圖片

一般的推薦系統或者機器學習的應用系統,會有天級或者周級的離線訓練,訓練結束后將模型推上線做線上 serving。實時在線學習指的是,在模型上線后,基于新產生的有效的 sample,實時更新模型的學習過程。主要目的是讓模型能夠更加快速地捕獲數據分布之間的變化,進而做出更優質的推薦。

在電商推薦場景,實時在線學習的意義在于,電商推薦場景的數據分布存在顯著周期性變化,或受突發事件影響而發生突變,同時直播電商的興起也讓數據分布更加動態。實時在線學習的解決方案就是不停使用最新的樣本訓練模型,以便模型快速適應數據分布的變化。

實時在線學習會面臨三大挑戰:

  • 實時在線學習依賴于用戶反饋數據的實時性。比如在電商領域,用戶可能需要幾個小時至幾天才能完成一個購買決策,我們的模型也就不可避免地需要等待幾個小時甚至幾天。
  • 實時在線學習還需要額外的工程支持。舉例來說,一個線上系統至少需要有實時的數據流支持,才有可能做到實時在線學習。
  • 實時在線學習模型的穩定性也受到了更大挑戰。

2. 重排模型

圖片

重排的概念是由莊濤在 2018 年提出的,圖示是一個非常經典的工業級的推薦系統的 pipeline。大致會分為召回、粗排、精排以及重排 4 個步驟。從左到右是一個時間序,每個環節的打分量從大到小。召回處理億級的數據,粗排萬級,精排千級,重排一般是百級甚至不滿百級。同時,從左到右打分精準度不斷提升。

圖片

重排相對前序的模型來說,會顯式建模寶貝之間的相互影響,即 context information。例如一瓶飲料以上圖中的方式呈現給用戶,那么中間那瓶飲料的點擊率就會有所提升,因為其尺寸和顏色都明顯區別于旁邊的兩瓶飲料,這就說明 context 會影響用戶行為。

重排的建模主要分為兩個流派。一是單點打分,即利用 context 信息給候選物品打更加精準的排序分,再按照從高到低的順序排列,形成最后的推薦序列。二是序列生成,是模型直接輸出 candidates 序列,不存在 rank score 的概念。

圖片

重排的復雜性主要體現在 context 中包含著的巨大可能性。比如,手淘猜你喜歡和關注信息流,一方面是混合著各種物料(比如說直播、視頻、圖文、寶貝)的復雜信息流。另一方面,在這樣的場景中,除了需要提高點擊,提高停留時長這些指標之外,還有很多的實際的業務目標要去完成,比如說打散、流控等等。在我們以前的工作中,已經介紹了如何將兩者有機融合進重排模型中。這部分可以參看 paper(https://arxiv.org/abs/2306.05118) 和去年在 DataFun 的公開課(全名“融合復雜目標且支持實時調控的重排模型在淘寶流式推薦場景的應用”)。

二、Formal Introduction:重排的定義&解決方案

1. 重排學習問題定義

圖片

重排位于整個推薦系統 pipeline 的最末端。上圖中以一個三排二的 case 解釋了重排問題的定義:當前有三個寶貝候選來到了重排階段,要求輸出的序列長度為 2,三排二共可能有 6 種序列,這 6 種序列分別對應了用戶/平臺/商家的反饋(用笑臉表示)。

圖片

為了后文理解方便,我們在三排二的 case 上聚焦于用戶反饋單一指標。

在這樣的情況下,重排的問題就可以由一個 arg max reward 公式定義(如上圖中所示),尋找最優序列。這個序列給到用戶后可以拿到更好的 feedback。Reward function 會同時考慮商家和平臺的訴求,在這里簡化為 feedback 越多 reward 越大。在這一例子中,重排的目標就是尋找 L3

注-數學 notation: ①序列=L;②用戶反饋=y

2. 解決方案

在完成問題定義后,我們逐一破解 3 個落地時遇到的實際問題。

圖片

問題 1:線上預估時,需要考慮到 response time 的限制。

解決方案 1:我們使用 one shot solution,調用序列生成模型 generator。這意味著在給定一個 u 和 c 的情況下,通過調用 generator,就直接輸出 arg max reward 的結果,從而節省 response time。

圖片

問題 2:實際拿到的用戶反饋只有一個序列的反饋結果(紅色笑臉標),雖然這條序列大概率來說是一條不錯的序列,但也大概率不是最優的那條序列。

解決方案 2:解法來自新角色的引入,也就是 evaluator 評估器。評估器會給其他可能的序列預測用戶 feedback(藍色笑臉標)。Evaluator 的有效性已經得到驗證,具體的建模思路和評估參見去年的 paper 和 DataFun 大會分享。(同上)

在有了 evaluator 后,我們的訓練過程就轉化為了通過調整 θ(Generator 的參數)來實現在給定 u 和 c 的情況下,拿到 evaluator 最大化分數。

圖片

問題 3:真實線上環境無法用剛剛展示的窮舉法,原因在于真實環境比三排二可能性多得多,候選序列組合基本是百萬~億級別的。

解決方案 3:流程是用 Actor/Generator 生成序列,用 Evaluator/Simulator 評估序列。如果評估出來 reward 大,那么 Actor/Generator 就調大生成當前序列的概率;如果 reward 小,那么 Actor/Generator 就降低生成當前訓練的概率。

基本邏輯是預先訓練 Evaluator/Simulator 模型。值得一提的是,在給定了 evaluation 之后,actor 的訓練是無需直接的用戶反饋的。所以在線上不需要等待用戶的 feedback,就可以訓練更新 actor。

三、New Proposal:Learning at Serving Time (簡稱 LAST)

1. 基礎架構

圖片

經典的在線學習的過程(左邊)是在初始模型 deployed model θ 的基礎上等待第一批帶著用戶反饋的樣本 Sample 1 with feedback 準備好后,學習并更新模型至 deployed model θ1,但在等待樣本的過程中已經等了用戶的購買決策的幾個小時。以此類推模型逐步更新至 θ

而 LAST 學習的特點在于,在線上模型還是 θ的情況下,當收到線上新請求 request 1 w/o feedback 的這一瞬間,我們會嘗試從 θ的基礎上去尋找一個偏移量 Δθ1,從而嘗試優化對 request 1 的推薦結果。而這個對于當次請求優化的偏移量 Δθ僅僅只是針對當次請求,在模型吐出結果后就被丟棄,不會回流到 deployed model 中。以上推理需要模型更新在 serving 的一瞬間完成,也就是 learning at serving time。

圖片

2. LAST 核心邏輯

接下來講解 LAST 中的核心,新請求來時需要更新的 Δθ 是如何來的?

Δθ 同一來源于最優化問題(第三行)。在拿到 U和 C之后,我們會嘗試尋找一個 Δθ 使得 evaluate 分數增大。跟 θ 優化的核心區別是在于優化針對的范圍的不同,θ 是對任意可行的 U 和 C 都希望拿到最優的結果,為全局最優化;而 Δθ 只為當前請求的 U和 C去計算最優結果,只為這一次請求最優化。

圖片

3. LAST 方案對比傳統學習的亮點

  • LAST 更新無需等待用戶反饋,在請求到達的一瞬間就可以更新模型。
  • LAST 的優化針對的是當前請求的預估效果,源自于模型針對每一次請求時,模型都可以有針對當前請求局部的優化。
  • LAST 定制程度高,有望實現千人千模,源自于 LAST 的優化在全局最優基礎上再加于局部最優。
  • LAST 不會影響已上線的模型,可以作為可插拔的插件使用,源自于 LAST 的 Δθ 是及拋的優化。
  • LAST 不依賴線上工程支持。

圖片

4. LAST 算法

LAST 設計了兩個版本,第一個是串行的版本,在給定一個 u 和 C 的情況下,首先調用 generator 打出一條序列,然后 evaluator 評估序列,再基于評估結果調高/低當前序列生成的概率,重新嘗試打一個新的序列,然后再訪問 evaluator 評估結果,循環往復。但串行版本的問題還是反饋時間。在此基礎上,我們提出了并行的版本。并行版本從 gradient exploration 模塊出發,它會輸出各種的 Δθ 的可能性,來自于調大/小當前序列生成的概率,配合各種步長生成。然后 generator 在嘗試各種的可能性之后,產生各種的序列,每個序列去訪問 evaluator,最終我們從當中選 evaluator 分數最高的那一個 item 序列透出。

圖片

5. LAST 實驗結果

考慮到經典模型非 Evaluator-based 的對比公平性,第一個離線評估中用 NDCG,明顯看到最下方的兩個 generator-evaluator 的多序列方法效果最好,其中 LAST 最優。

圖片

考慮到 NDCG 受頭部效應的影響不夠接近于真實的預估水平評估,第二個離線評估中用 evaluator 去對比各個模型,還是能明顯看到 LAST 最優,對比最強的 baseline 有 1 個多點的提升。

圖片

實際線上實驗在淘寶關注信息流場景。實驗結果發現是能在點擊數不變的情況下,帶來兩個點級別的成交筆數的提升。

責任編輯:姜華 來源: DataFunTalk
相關推薦

2013-01-09 13:58:00

銀行移動電商移動互聯網

2012-02-16 16:05:22

戴爾國美

2023-03-28 08:16:05

A/B實驗數據分析

2015-01-13 13:49:00

文思海輝電商解決方案

2023-06-01 09:00:00

圖像分割模自動化

2023-06-01 08:00:00

圖像分割機器學習

2021-07-20 18:45:02

人工智能AI

2015-03-11 15:35:35

高升科技電商用戶體驗

2012-10-24 15:35:39

博弈的階段

2016-08-18 23:37:24

2023-11-13 07:51:58

ChatGPT研究

2025-10-21 08:00:00

2015-07-22 10:54:23

電商平臺源碼

2017-08-24 09:58:58

零售電商社交

2021-10-22 19:21:33

華為云

2018-05-30 10:22:47

電商平臺

2013-09-18 16:12:35

2019-01-28 05:10:36

拼多多電商促銷模型
點贊
收藏

51CTO技術棧公眾號

国产一级精品毛片| 鲁一鲁一鲁一鲁一av| 日本韩国免费观看| 国产精品亚洲综合久久| 国产性猛交xxxx免费看久久| 激情视频综合网| 91看片在线观看| 国精产品一区一区三区mba视频 | ww久久中文字幕| 日韩av大片免费看| 国产精品18在线| 日韩av综合| 精品久久久久久久久国产字幕| 欧美激情第一页在线观看| 91丨九色丨海角社区| 91久久久精品国产| 精品欧美一区二区久久| 免费观看日韩毛片| 欧美一级二级三级区| 懂色av一区二区三区免费看| 9.1国产丝袜在线观看| 日本一道本视频| 无码国模国产在线观看| 色综合网色综合| 在线码字幕一区| 视频一区 中文字幕| 日本系列欧美系列| 欧美人与性动交a欧美精品| 精品人妻少妇嫩草av无码| 九七影院97影院理论片久久| 午夜视黄欧洲亚洲| 亚洲成人在线视频网站| 精品国产18久久久久久| 老妇喷水一区二区三区| 欧美激情亚洲激情| 懂色av蜜臀av粉嫩av永久| 成人av综合网| 4438x成人网最大色成网站| 日本a级片免费观看| 午夜小视频在线观看| 国产欧美一区二区精品婷婷| 国产精品久久久久久久久久久久午夜片 | 中文字幕亚洲字幕| 亚洲天堂av网站| 日韩成人在线一区| 色婷婷一区二区三区四区| 黄色成人在线免费观看| 麻豆视频网站在线观看| 国产三级精品在线| 精品视频在线观看| 精品人妻一区二区三区三区四区| 免费人成黄页网站在线一区二区| 欧美成人久久久| av资源在线免费观看| 国产91久久精品一区二区| 欧美成人性战久久| 99久久99精品| 亚洲最大的免费视频网站| 色综合久久久久久久| 内射国产内射夫妻免费频道| 91制片在线观看| 亚洲一区视频在线| 粉嫩av一区二区三区天美传媒| 欧美性天天影视| 国产精品美女视频| 神马影院午夜我不卡| 青青草在线免费观看| 99在线精品观看| 成人毛片网站| 亚洲av无码乱码国产精品久久| 国产一区中文字幕| 91久久在线视频| 国产特级黄色片| 国产精品亚洲专一区二区三区| 91免费精品视频| 一级黄在线观看| 精品一区二区三区在线播放视频| 国产日本欧美一区二区三区在线| 中文字幕人妻色偷偷久久| 日韩精品电影一区亚洲| 国产精品pans私拍| 亚洲免费视频二区| 久久精品二区亚洲w码| 国产专区欧美专区| 99热这里只有精品66| 国产精品一区二区在线观看不卡| 91综合免费在线| 亚洲AV无码国产精品午夜字幕| 国产成人免费xxxxxxxx| 高清不卡日本v二区在线| 黑人乱码一区二区三区av| 成人午夜伦理影院| 蜜桃视频成人| 欧美日本高清| 亚洲国产综合色| 日本精品一区在线观看| 国产一区二区精品调教| 欧美精品免费视频| 国产免费无码一区二区| 五月激激激综合网色播| 中日韩美女免费视频网址在线观看 | 日韩影片在线播放| 欧美日韩在线看片| 亚洲一区影音先锋| 日本老熟妇毛茸茸| 精品国产不卡一区二区| 亚洲精品国产精品乱码不99按摩 | 亚洲伦理一区二区| 日韩欧美国产三级| 女女互磨互喷水高潮les呻吟| 日本不卡电影| 久久综合伊人77777尤物| 在线观看天堂av| 欧美1区视频| 高清一区二区三区四区五区| 天天干天天干天天| 国产在线精品不卡| 国产视色精品亚洲一区二区| 国产对白叫床清晰在线播放| 一区二区三区丝袜| av无码精品一区二区三区| 精品国产18久久久久久二百| 亚洲精选在线观看| 久久99久久久| 蜜臀国产一区二区三区在线播放| 国产经典一区二区三区| jzzjzzjzz亚洲成熟少妇| 亚洲成人动漫精品| www.久久久久久久久久久| 99久久香蕉| 亚洲天堂第二页| 蜜桃av.com| 亚洲一区二区毛片| 91亚洲va在线va天堂va国| 无码国产精品一区二区色情男同 | 日本一区二区三区www| 91小视频xxxx网站在线| 欧美亚洲禁片免费| aaaaaav| 黄色成人在线网址| 成人国产精品久久久| 国产专区在线| 天天操天天色综合| 岛国大片在线免费观看| 97在线精品| 国产精品久久久久久超碰 | 农村妇女一区二区| 亚洲欧美国产制服动漫| 国产成年人免费视频| 国产一区二区伦理| 致1999电视剧免费观看策驰影院| 日韩欧美看国产| 日韩精品极品在线观看| 国产一级淫片免费| 国产99久久久精品| 青青视频免费在线| 国产日韩在线观看视频| 色噜噜狠狠狠综合曰曰曰| 久久精品99北条麻妃| 久久久精品欧美丰满| 免费在线a视频| 理论片一区二区在线| 欧美激情网友自拍| 懂色av蜜臀av粉嫩av分享吧| 亚洲精品乱码久久久久久久久 | 久久精品人人| 欧美精品一区在线发布| 一区二区电影免费观看| 日韩高清欧美高清| 伊人手机在线视频| 久久精品网站免费观看| 国产免费成人在线| 国产精品中文字幕亚洲欧美| 国产精品夫妻激情| 99se视频在线观看| 欧美精品一级二级| 天天干中文字幕| 国产**成人网毛片九色| 日本中文字幕在线视频观看| 免费福利视频一区| 欧美一区第一页| h网站视频在线观看| 欧美男人的天堂一二区| 美女福利视频在线观看| 岛国一区二区三区| 鲁一鲁一鲁一鲁一色| 欧美男男gaytwinkfreevideos| 国产精品白丝jk喷水视频一区| 日韩美女网站| 欧美浪妇xxxx高跟鞋交| 精品少妇爆乳无码av无码专区| 不卡一区二区三区四区| 欧美 日韩 国产一区| 精品一区二区三区的国产在线观看| 国产精品激情av在线播放| 超碰在线观看免费版| 亚洲精品mp4| 国产三级精品三级在线观看| 国产精品久久久久9999吃药| 欧美熟妇另类久久久久久多毛| 亚洲激情久久| 国产福利久久精品| 肉色欧美久久久久久久免费看| 宅男66日本亚洲欧美视频| jizz中国女人| 日韩欧美在线视频免费观看| av男人的天堂av| 免费不卡在线视频| 日韩成人三级视频| 日本三级久久| 国产不卡av在线| 免费av不卡| 国产偷亚洲偷欧美偷精品| 国产精品久久久久精| 欧美日韩美女视频| 中国毛片直接看| 久久这里都是精品| 图片区乱熟图片区亚洲| 三级欧美韩日大片在线看| 中文字幕色一区二区| 亚洲小说图片视频| 亚洲www永久成人夜色| 亚洲第一影院| 九色成人免费视频| 韩国福利在线| 精品国产精品网麻豆系列| 在线观看免费视频一区| 亚洲高清视频中文字幕| 国产激情av在线| 99久久免费精品高清特色大片| 午夜剧场在线免费观看| 销魂美女一区二区三区视频在线| 在线观看17c| 国产不卡av一区二区| 高清视频一区二区三区| 四虎影视成人精品国库在线观看| 欧美中文在线观看国产| 丁香花在线观看完整版电影| 久久精品精品电影网| 黑人与亚洲人色ⅹvideos| 日韩成人中文字幕在线观看| www.黄色小说.com| 51精品秘密在线观看| 又色又爽又黄无遮挡的免费视频| 日韩欧美在线视频日韩欧美在线视频 | 韩国美女久久| 美乳少妇欧美精品| 亚洲成a人v欧美综合天堂麻豆| 日韩精品视频中文在线观看| 亚洲欧美黄色片| 精品免费视频.| 精品国产亚洲一区二区麻豆| 欧美夫妻性生活| 91国产免费视频| 欧美精品丝袜久久久中文字幕| 中文字幕人妻一区二区三区视频| 在线精品视频一区二区三四| 免费又黄又爽又猛大片午夜| 色婷婷亚洲精品| 日韩精品成人免费观看视频| 欧美午夜精品久久久久久人妖| 日韩成人在线免费视频| 亚洲国产乱码最新视频 | 久热99视频在线观看| 大地资源网3页在线观看| www.亚洲人.com| 黄色一级大片在线免费看产| 欧美成人三级视频网站| 成人高清免费在线| 欧美成人在线免费视频| 性欧美1819sex性高清大胸| 日韩中文在线不卡| 国产一二三区在线观看| 久久99国产综合精品女同| 黑人另类精品××××性爽| 97视频在线观看播放| 女海盗2成人h版中文字幕| 欧美一区第一页| 成人国产精选| 成人在线激情视频| 综合欧美亚洲| 久久久久久久久一区| 久久最新网址| 伊人久久青草| 欧美日韩视频| 国产日产欧美视频| 奇米色一区二区三区四区| 久久国产激情视频| 国产馆精品极品| 一女三黑人理论片在线| 欧美国产视频在线| 青青草国产在线观看| 亚洲18女电影在线观看| 无码人妻丰满熟妇奶水区码| 欧美男男青年gay1069videost| 精品人妻一区二区三区换脸明星| 日韩不卡中文字幕| av亚洲在线| 欧美激情亚洲精品| 日本综合久久| 91中文精品字幕在线视频| 日韩深夜影院| 亚洲开发第一视频在线播放| 欧美日韩国产免费观看| 各处沟厕大尺度偷拍女厕嘘嘘| 久久成人羞羞网站| 国产午夜在线一区二区三区| 久久久99久久精品欧美| 杨钰莹一级淫片aaaaaa播放| 岛国av在线不卡| 国产又黄又粗又硬| 日韩高清av一区二区三区| 国产激情视频在线观看| 国产91精品久久久久久久| 9.1麻豆精品| 欧美动漫一区二区| 亚洲色图网站| 黄色av免费在线播放| 国产福利精品一区| 久久久精品成人| 欧美日韩国产综合新一区| 国产探花精品一区二区| 伊人亚洲福利一区二区三区| xxx.xxx欧美| 成人亚洲激情网| 色先锋久久影院av| 久久久久亚洲av无码专区喷水| 久久xxxx精品视频| 天天操夜夜操很很操| 亚洲国产精品精华液ab| 久久久精品国产sm调教网站| 欧美日韩午夜激情| 一区二区三区精彩视频| 国产亚洲精品久久久久久牛牛| 第一av在线| 亚洲一区国产精品| 999久久久亚洲| 男女视频一区二区三区| 99re8在线精品视频免费播放| 加勒比av在线播放| 欧美日本在线看| 国产视频精品久久| 欧美专区福利在线| 欧美一区自拍| 99亚洲精品视频| 日本一不卡视频| 日韩乱码人妻无码中文字幕久久| 亚洲风情在线资源站| 国产高清视频免费观看| 久久视频在线观看免费| 欧美激情三区| 亚洲日本理论电影| 日本最新不卡在线| 一级片久久久久| 欧美在线免费视屏| 国产经典自拍视频在线观看| 青青青国产精品一区二区| 加勒比色综合久久久久久久久| 成人精品视频在线播放| 成人免费高清在线| 国产第一页在线播放| 亚洲大胆人体av| 国产黄大片在线观看| 久久99精品久久久久久青青日本 | 精品中文字幕一区二区小辣椒| 欧美18—19性高清hd4k| 欧美性69xxxx肥| 国内av一区二区三区| 国产精品亚洲网站| 99精品电影| 中文字幕一二三区| 亚洲国产欧美日韩另类综合| 无码国产精品高潮久久99| 欧美最猛性xxxxx免费| 欧美日一区二区| 九色porny自拍| 夜夜精品浪潮av一区二区三区| 国模人体一区二区| 欧亚精品中文字幕| 欧美日韩水蜜桃| 日本不卡一区在线| 亚洲自拍另类综合| 手机福利小视频在线播放| 国产不卡av在线免费观看| 99热在线成人| 91人妻一区二区| 日韩欧美有码在线| 精品国产白色丝袜高跟鞋| www.久久艹| 久久午夜av| 97精品在线播放| 精品欧美乱码久久久久久1区2区| 悠悠资源网亚洲青| 亚洲日本无吗高清不卡| 国产风韵犹存在线视精品| 久久久国产精品成人免费| 一本久久综合亚洲鲁鲁| 日韩免费成人| 国产无套粉嫩白浆内谢的出处| 亚洲嫩草精品久久|