精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AB實驗的采樣分流技術演進以及Sutva假設與現實挑戰

大數據
通過 AB實驗,我們可以發現退燒是因,出汗是果, 所以發燒捂汗的做法是不對的。在互聯網產品中,類似的問題很常見, AB實驗可以給決策者更清晰的因果鏈路, 從而讓產品經理或者業務決策者更全局的視角,更準的決策。

實驗文化在互聯網公司越來越普及,AB實驗作為業務決策的輔助工具,可以精準區分策略效果的隨機波動與顯著增長。此外AB實驗還可以評估策略的因果關系,舉一個生活中的例子,退燒的時候往往會出汗,那么退燒和出汗的因果關系是什么, 是不是發燒之后我們應該穿更多衣服捂汗?通過 AB實驗,我們可以發現退燒是因,出汗是果, 所以發燒捂汗的做法是不對的。在互聯網產品中,類似的問題很常見, AB實驗可以給決策者更清晰的因果鏈路, 從而讓產品經理或者業務決策者更全局的視角,更準的決策。

一、采樣分流技術的發展

傳統AB實驗,在實驗開始前分好AB組用戶,同時生效策略。例如醫學實驗, 實驗開始前招募志愿者,然后分為AB兩組。互聯網實驗的區別:A組實時采樣1%的用戶, B組同樣實時采樣1%的用戶, 然后啟動實驗,AB組的命中實驗的用戶會陸續進入實驗,第一天實驗組可能來了 0.2% 的用戶,隨著實驗時間增加,實驗用戶量逐漸接近 1%,這里和傳統的醫學實驗不一樣。

我們把互聯網產品的用戶看做一個有限個數的總體,從這個總體中,隨機無放回的采樣得到AB組用戶,一種簡單的工程實現:將大盤用戶隨機Shuffle一次,然后按照比例取出 AB組用戶。但這樣的采樣在工程化的時候比較復雜,因為每次啟動實驗,我們都需要對大盤用戶做一次Shuffle。進一步優化,我們可以選擇一個密碼學Hash函數實時采樣, 因為密碼學Hash函數可以保證任意兩個用戶ID的Hash Value是獨立的, 這個性質等價于隨機采樣。當實驗比較多的時候,我們發現這種hash模擬隨機采樣的分流方式還是有一個問題:用戶是有記憶性的, 上一個實驗的效果會延續到新的實驗,我們通過二次Hash來解決這個問題。除 Hash 采樣之外,再介紹一種更復雜的完美隨機分流策略,基于有限域(galois field)理論,我們給出一種完美隨機方案《Orthogonal Traffic Assignment in Online Overlapping A/B Tests》。

二、指標計算評估的發展

在互聯網業務大量使用 AB實驗之前, 數據分析師使用業務 BI 報表給老板匯報數據, BI報表數據往往是某一天,大盤用戶的行為數據,例如某天所有用戶的訪問時長除以當天的總人數,得到人均訪問時長。

AB 實驗初期,產品經理或者數據分析同學有之前的固定思維,一個實驗運行 7 天,他們會把每一天的用戶訪問時間加起來作為分子,再除把每一天進入實驗的用戶加起來(不去重)作為分母,計算“人均訪問時長”,這個指標和 BI 報表的指標是口徑一致的。用這個指標口徑做實驗,通過 jackknife/bootstrap 估計方差做統計推斷。但是這樣的口徑是不科學的,舉一個例子:在BI業務報表中,產品經理一般使用的是非聚合指標,例如看連續兩天報告,人均瀏點擊次數=(第一天點擊次數+第二天點擊次數)/ (第一天用戶數+第二天用戶數),這里用戶數在兩天內沒有做去重聚合。在AB實驗中,這樣定義指標有明顯缺陷。例如,A組和B組假設在第一天都進入了10個用戶,A組的策略非參糟糕,留存是0, 第二天沒有用戶訪問,B組策略比較好,留存是100%, 第二天這10個人都又分別點擊了一次,我們如果使用BI報表中的非聚合口徑計算指標,A組的人均點擊=(10+0)/(10+0) = 1 , B組的人均點擊=(10+10)/(10+10)=1 , A組指標=B組指標,我們得出AB組策略沒有差異,顯然是一個錯誤的結論。在AB實驗中,正確的指標定義是:人均瀏點擊次數=(第一天點擊次數+第二天點擊次數)/ (去重(第一天用戶數+第二天用戶數)), 新口徑下,A組指標=10/10=1 , B組指標=20/10=2 , 可以看出B組策略顯著好于A組。

指標的長期效果預測,AB 實驗的指標結果代表實驗期間對策略效果的評估,但是產品負責人或者老板更需要得到一個長期效果,策略對全年 OKR的貢獻。我們在這篇文章中有詳細的分析如何評估長期效果《Estimating Causal Effects of Long-Term Treatments》(EC'23)   

三、AB實驗統計推斷的發展

Sutva (Stable Unit Treatment Value Assumption)假設直觀的理解:在 AB實驗中,給 B組用戶一個策略,B組用戶的不會把策略效應溢出到 A組;

1.Sutva 假設成立時:

固定樣本假設推斷, 我們在實驗開始前,確定 Power 和業務檢驗精度,計算出實驗所需要的樣本量,然后啟動實驗。這是一個理想實驗設計,在采樣分流技術中有提到,互聯網實驗中,用戶是陸續進入實驗,所以這種固定樣本實驗有一些問題:

  • 實驗做 3 天與 7 天的檢驗統計量分布可能不同,例如3天的人均訪問時長和 7 天人均訪問時長,顯然是兩個不同的分布(計算口徑是人均去重指標,在 AB實驗指標計算中有提到)。
  • 實驗采樣是實時的,實驗第一天進入實驗的用戶成分,活躍用戶占比較高, 實驗運行累計兩天時,非活躍用戶占比上升,隨著實驗累計時間增加 ,實驗人群中非活躍占比逐漸增大,最終逐漸接近大盤中的用戶成分。當實驗策略在活躍與非活躍用戶的類型上產生不一樣的效應,那么實驗評估的準確性會受到影響。我們需要一些找到一個合適時間停止實驗,來降低這里的風險,我們最近完成的工作:《Enhancing External Validity of Experiments with Ongoing Sampling Process》(EC'24)。
  • 用戶連續觀測 Peeking 問題(重復看實驗導致一類錯誤升高),隨著基礎實時數倉的發展,業務需要對實時的指標做統計推斷,例如,有一個實時 CTR指標,業務希望在可以在任意時刻做統計推斷,這里帶來新的挑戰,序列化檢驗模型的落地與應用。

更復雜的場景,產品經理想對某一組 UI做實驗,例如一個按鈕的顏色也形狀和文案三個維度,每個維度有 4 個選擇,那么總共有 4*4*4=64 個策略,同時做這 64 個策略對比,這幾乎是一件不可能完成的任務。再例如,我們做一個模型超參實驗,超參數的取值在實數域,我們不可能通過 AB實驗枚舉實數域進行實驗。這里引入新的Multi-armed Bandit/Bayesian optimization 實驗方案。

2.Sutva 假設不成立時:

固定關系的干擾:

舉一個例子,在社交場景做實驗,實驗策略可以通過已知好友關系傳播,我們做一個 50%vs50% 的實驗,實驗組中的用戶通過好友關系,把實驗策略分享到對照組的用戶,結果實驗組和對照組都受到策略影響, 我們實驗的統計量(實驗組用戶均值-對照組用戶均值)檢測不到差異。這個例子中, AB 組之間的干擾都來源于已知的關系傳導,我們可以在隨機采樣的時候,考慮關系圖,進行圖采樣,得到兩個隔離的 AB 組進行實驗。另外一種處理思路是,因為傳導關系已知,我們可以通過定義一個可以表達傳導效應的新統計量進行實驗;最后一種思路是建模,我們通過模型預測數傳導效應進行實驗。我們最近完成的一些文章:

《Optimized Covariance Design for AB Test on Social Network under Interference》(NeurIPS'24)

《Unbiased Estimation for Total Treatment Effect Under Interference Using Aggregated Dyadic Data》(MitCoDE'23)

《Ego Group Partition: A Novel Framework for Improving Ego Experiments in Social Networks》(MitCoDE'23)

非固定關系的干擾:

舉一個例子,在主播實驗中,我們對 B組主播給一些激勵策略,那么 B 組主播的直播間會有更好的指標。因為 B組主播搶奪了原本進入 A 組主播的用戶。如果我們把這個策略全量上線之后,不存在 A 組策略的主播,也就不存在“搶奪”效應。所以在實驗過程中我們看到的 B 組效果好,可能是被高估的。這類場景比較復雜,因為非固定關系有很多不同的情況,大多來自推薦系統的策略和產品自身的傳導效應,還有外部因素的干預等。我們對于這種情況的實驗 case by case 分析,通過因果推斷、結構化模型、強化學習等一系列方法評估實驗效果,可以進一步閱讀我們最近完成的文章:《Estimating Treatment Effects under Recommender Interference: A Structured Neural Networks》(EC'24)  

四、AB實驗當前遇到的難點與挑戰

隨著業務越來越廣的應用AB實驗, 我們面臨一些新的挑戰:大數據量的挑戰,實驗數量快速增加,如何更快、更準、更穩的提供計算支持。相關工作我們整理發表在 VLDB'24 : 《Large-Scale Metric Computation in Online Controlled Experiment Platform 》

算法方向,復雜業務系統中 Sutva 不成立時,如何更準的支持實驗,例如搜索系統、推薦系統、廣告系統中。實驗結果如何更準確的反應業務大盤,以及更準的評估實驗長期收益。最后是很多不能做實驗的場景,我們如何把因果推斷技術標準化和效果評估做好,助力業務提供增長。我們開源了一套基于 Olap 引擎分的布式計算因果推斷庫,解決非標準化AB實驗評估問題。《Fast-Causal-Inference: a Causal Inference Tool at Scale》(MitCoDE'23)

責任編輯:姜華 來源: DataFunTalk
相關推薦

2023-09-06 18:37:21

可視化數倉平臺

2020-05-06 10:59:18

區塊鏈分布式比特幣

2010-03-25 10:43:24

2022-05-11 11:26:39

安全產品安全風險數據安全

2020-01-11 17:49:03

區塊鏈數字貨幣比特幣

2021-05-13 10:02:45

生物識別技術加密身份認證

2025-08-05 02:25:00

多模態大語言模型

2016-04-27 10:32:04

裸眼3DVR虛擬現實

2025-07-11 09:16:00

2023-12-07 14:20:05

2018-09-06 15:15:44

2025-01-06 13:51:37

2022-11-07 14:03:46

2009-03-17 09:37:00

ADSL分流寬帶接入

2022-09-14 11:15:33

多云混合云云數據庫

2025-06-16 04:00:00

Spring彈幕技術

2023-01-16 14:56:00

Graph圖數據庫

2017-06-08 12:26:23

2015-04-15 15:09:42

LET FDD

2023-04-04 10:54:12

點贊
收藏

51CTO技術棧公眾號

大桥未久在线播放| 亚洲精品一区中文字幕乱码| 国产在线拍揄自揄视频不卡99| 欧美巨胸大乳hitomi| 全球中文成人在线| 樱桃视频在线观看一区| 久久av一区二区三区漫画| 好吊色在线视频| 围产精品久久久久久久| 亚洲第一黄色网| 嫩草av久久伊人妇女超级a| 国产在线观看91| 91小视频免费看| 国产在线精品成人一区二区三区| 日韩高清精品免费观看| 日韩精品久久| 日韩av最新在线| 动漫av免费观看| 成人三级小说| 国产精品久久久久久久浪潮网站| 国产私拍一区| 99在线精品视频免费观看软件| 久久久久久穴| 欧美猛交ⅹxxx乱大交视频| 国产jk精品白丝av在线观看| 99这里只有精品视频| 欧美视频三区在线播放| www.日本在线播放| 成年视频在线观看| 国产日产欧产精品推荐色| 国产精品青青草| 国产一区二区在线视频观看| 日韩—二三区免费观看av| 97视频在线观看成人| 男人与禽猛交狂配| 日韩欧美视频在线播放| 亚洲欧美国产一本综合首页| 特级特黄刘亦菲aaa级| 亚洲在线资源| 欧美日韩在线免费视频| 欧美性猛交久久久乱大交小说| av中文字幕在线观看第一页| 亚洲精品一卡二卡| 一区二区三区av| av在线免费观看网| 国产婷婷色一区二区三区在线| 久久精品国产99精品国产亚洲性色| aaa一区二区三区| 国产主播一区二区| 国产精品一区二区久久国产| www.com国产| 国产欧美一区二区色老头| 欧美激情videos| 久久久久久久九九九九| 欧美另类视频| 欧美高清视频免费观看| 久久99久久久| 999亚洲国产精| 91av在线网站| 中文字幕在线欧美| 视频一区二区三区入口| 国产成人在线精品| 中文字幕日韩第一页| 日韩不卡一区二区三区| 国产狼人综合免费视频| 国产精品自产拍| 国产精品91一区二区| 成人黄色片视频网站| 成人免费视频国产免费麻豆| 成人av综合一区| 欧美日本国产精品| av电影在线网| 亚洲欧洲综合另类在线| 精品人妻人人做人人爽| 国产福利在线免费观看| 午夜日韩在线电影| 国产a级片免费观看| 成人全视频在线观看在线播放高清 | 午夜精品福利视频网站| 夫妻免费无码v看片| 亚洲天堂免费电影| 欧美色爱综合网| 北条麻妃亚洲一区| 伦理一区二区三区| 中文字幕久精品免费视频| 色老板免费视频| 日韩午夜在线| 国产主播精品在线| 亚洲a视频在线| 久久综合色鬼综合色| 性欧美videosex高清少妇| www在线视频| 色天使色偷偷av一区二区| 手机看片一级片| 51vv免费精品视频一区二区| 亚洲欧美精品在线| 手机在线免费看毛片| 99精品免费视频| 成人高清视频观看www| 天堂中文字幕av| 中文字幕精品一区二区精品绿巨人| 亚洲天堂第一区| 美女福利一区二区| 欧美mv和日韩mv的网站| 久久国产柳州莫菁门| 伊人久久综合| 成人精品在线视频| 你懂的在线播放| 一区二区三区精密机械公司| 国产精品乱码久久久久| 精品视频自拍| 久久成人这里只有精品| 欧美超碰在线观看| av一二三不卡影片| 永久免费网站视频在线观看| 日韩精品第一| 亚洲精品国产综合久久| 看片网站在线观看| 蜜桃久久久久久久| 日本在线观看一区| 免费毛片b在线观看| 欧美一区二区美女| 国内毛片毛片毛片毛片毛片| 久久婷婷久久| 国产高清一区视频| 草莓福利社区在线| 欧美男女性生活在线直播观看| 男人操女人动态图| 国产视频亚洲| 国产中文一区二区| 中国av在线播放| 91精品久久久久久久99蜜桃| 久久亚洲AV无码专区成人国产| 国产精品毛片一区二区三区| av成人午夜| 手机在线免费观看av| 91麻豆精品国产91久久久 | 色爱综合网欧美| 国产97免费视| 欧美女同网站| 欧美午夜性色大片在线观看| 91丨porny丨对白| 亚洲视频狠狠| 国产精品露出视频| 色爱综合区网| 精品久久久三级丝袜| 久久久.www| 国产**成人网毛片九色| 成人在线观看www| 精品国产亚洲一区二区在线观看| 日韩天堂在线视频| 99riav国产| 亚洲男同性视频| 亚洲av毛片在线观看| 一区二区国产在线| 成人高清在线观看| 国产99在线观看| 日韩精品久久久久久久玫瑰园| 国产成人无码精品| 久久先锋资源网| 日韩手机在线观看视频| 精品日韩免费| 91精品久久久久久久久青青| av网址在线免费观看| 日韩三级高清在线| 久久艹免费视频| 国产欧美日韩中文久久| 国产美女视频免费看| 欧美全黄视频| 久久久久久亚洲精品不卡4k岛国 | 欧美日韩裸体免费视频| 久久精品老司机| 蜜臀久久99精品久久久画质超高清 | www.污污视频| 国产精品分类| 欧美一区二区三区在线播放| 开心久久婷婷综合中文字幕| 久久成人精品一区二区三区| 色香蕉在线视频| 在线视频一区二区免费| 久久高清内射无套| 91丨九色丨国产丨porny| 中文久久久久久| 亚洲国产精品成人| 欧美日韩另类丝袜其他| 亚洲欧美综合久久久久久v动漫| 欧美精品激情在线观看| 成人在线观看黄色| 日韩欧美亚洲国产精品字幕久久久 | 亚洲va国产天堂va久久en| 欧美老熟妇乱大交xxxxx | 国产主播欧美精品| 美女在线视频免费| 日韩在线一区二区三区免费视频| 亚洲爱爱综合网| 欧美又粗又大又爽| 国产一级在线视频| 国产精品午夜免费| 中文乱码人妻一区二区三区视频| 蜜臀久久久99精品久久久久久| 日韩欧美不卡在线| 国产精品成人av| 欧美日韩最好看的视频| 欧洲一区在线| 国产精品美乳一区二区免费| 999福利在线视频| yellow中文字幕久久| 日本中文字幕电影在线观看 | 亚洲色图欧美日韩| 激情都市一区二区| 无码人妻丰满熟妇区毛片18| 欧美日本亚洲韩国国产| 亚洲激情电影在线| 丝袜久久网站| 国产精成人品localhost| 岛国一区二区| 欧洲一区二区视频| 青草在线视频| 久久久久www| 自拍视频在线免费观看| 亚洲美女在线看| 免费国产黄色片| 日韩欧美国产一区二区三区 | 国产在线精品免费| 又色又爽又高潮免费视频国产| 99国产精品久久久久久久成人热| 日韩不卡一二区| 欧美a级片视频| 日本精品一区二区三区视频 | 精品亚洲永久免费| 自拍偷拍欧美精品| 免费成人深夜夜行网站| 国产精品丝袜一区| 2019男人天堂| 日本一区二区视频在线观看| 国产真实乱人偷精品人妻| 99精品1区2区| 日本aaa视频| 久久久国际精品| 国产全是老熟女太爽了| 91蜜桃婷婷狠狠久久综合9色| 97精品人人妻人人| 成人黄色av电影| 中国极品少妇videossexhd| 成人免费电影视频| 又黄又爽的网站| bt7086福利一区国产| 亚洲午夜久久久久久久久| 成人免费三级在线| 在线视频 日韩| 99久久精品国产一区| 亚洲精品在线视频免费观看| 99精品视频一区| 99久久久无码国产精品性| 2020国产精品自拍| 国产色视频一区二区三区qq号| 94色蜜桃网一区二区三区| 精品人妻一区二区三区香蕉| 91丨九色丨蝌蚪丨老版| 国产一二三四五区| 国产精品免费av| 免费成年人视频在线观看| 亚洲精品免费在线| 国产午夜久久久| 日韩欧美中文字幕在线播放| 欧美日韩a v| 欧美精品一卡二卡| 精品国产av 无码一区二区三区| 欧美成人精品二区三区99精品| 人人妻人人澡人人爽久久av| 亚洲欧美日韩中文视频| 视频三区在线| 九九热精品视频在线播放| а√在线天堂官网| 日本免费久久高清视频| 亚洲精品三区| 国产精品久久亚洲7777| 国产亚洲一区二区三区不卡| 在线看视频不卡| 9色国产精品| 高潮一区二区三区| 成人自拍视频在线| 国产美女永久免费无遮挡| 亚洲激情网站免费观看| 黄色大片网站在线观看| 欧美日韩日日骚| 刘亦菲久久免费一区二区| 亚洲性日韩精品一区二区| 成人福利片网站| 国产成人精品免高潮费视频| 精品一区91| 欧洲亚洲一区二区| 国产精品mv在线观看| 日韩免费高清在线| 成人高清视频在线| 四虎影视一区二区| 天天av天天翘天天综合网色鬼国产| 中文在线免费观看| 亚洲国产97在线精品一区| 欧美猛烈性xbxbxbxb| 91国产一区在线| 玖玖玖视频精品| 日本成人黄色| 亚洲黄色视屏| 性鲍视频在线观看| 国产精品三级在线观看| 久草视频在线观| 欧美xxxx在线观看| 日韩免费网站| 国产91亚洲精品| 国内精品国产成人国产三级粉色| 艳色歌舞团一区二区三区| 99国产成+人+综合+亚洲欧美| 欧美激情第四页| 国产精品蜜臀av| 天天操夜夜操视频| 亚洲国产精彩中文乱码av| 91最新在线视频| 国产欧美精品在线| blacked蜜桃精品一区| 青青草成人免费在线视频| 国产精品系列在线播放| 国产白丝一区二区三区| 欧洲一区在线观看| 青青免费在线视频| 97国产精品视频| 成人直播在线观看| 欧美做暖暖视频| 国产在线播放一区三区四| 9.1片黄在线观看| 在线亚洲免费视频| 精品亚洲综合| 国产97在线观看| 女厕嘘嘘一区二区在线播放 | 精品一区二区在线播放| 91资源在线播放| 91电影在线观看| 国产美女性感在线观看懂色av| 日韩av片永久免费网站| 任你躁在线精品免费| 欧美色图色综合| 久久久综合激的五月天| 中文字幕第15页| 亚洲精品自产拍| 美女福利一区二区三区| 美脚丝袜一区二区三区在线观看| 亚洲一区二区三区高清不卡| 国产精品探花一区二区在线观看| 性欧美大战久久久久久久久| 天堂在线视频免费观看| 97超级碰碰碰久久久| 亚洲理论电影片| 免费裸体美女网站| 国产欧美日韩不卡免费| 在线观看中文字幕av| xx视频.9999.com| 136福利精品导航| 久久久久免费看黄a片app| 91网站最新网址| 成人免费毛片男人用品| 中文字幕亚洲二区| 国产精品igao视频网网址不卡日韩| 中文字幕精品在线播放| 国产·精品毛片| youjizz在线视频| 在线播放国产一区二区三区| 亚洲tv在线| www.日本少妇| 国产日韩欧美精品一区| 97人妻精品一区二区三区软件| 欧美精品在线观看| 欧洲亚洲一区二区三区| 免费看污污网站| 亚洲激情校园春色| 毛片免费在线观看| 成人免费直播live| 99精品国产在热久久| 波多野结衣家庭教师在线观看| 日韩一区二区三区观看| 亚洲三级欧美| 一道精品一区二区三区| 成人性生交大合| 国产一级精品毛片| 久久99国产精品自在自在app| 婷婷亚洲精品| 成人在线短视频| 91国产免费观看| 日韩激情av| 亚洲福利av| www.激情成人| 91精品视频免费在线观看 | 成人午夜亚洲| 青青草视频在线免费播放| 欧美国产一区二区| 黄色av网址在线| 成人看片人aa| 亚欧美中日韩视频| jizz亚洲少妇| 中文字幕亚洲国产| 天天做夜夜做人人爱精品 |