精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

算法AB實驗平臺進化歷程和挑戰(zhàn)

大數(shù)據(jù) 數(shù)據(jù)分析
未來我們會希望借助數(shù)倉部門的AB平臺的指標計算和可視化通用能力,希望可以逐步增強AB平臺的數(shù)據(jù)可視化能力,在實驗分流情況的可視化分析,實驗的用戶特征的分布可視化分析,實驗的指標變化原因排查等方面與分析同學一起合作,提升AB實驗的指標報表問題分析效率。

一、AB平臺簡介

AB實驗平臺這幾年在互聯(lián)網(wǎng)公司得到了越來越廣泛的應用,采用AB實驗來評估產(chǎn)品和技術迭代效果也成為主流的業(yè)務新功能效果評估方式,數(shù)據(jù)驅動的文化在這幾年得到了不少公司的廣泛的認同,通過數(shù)據(jù)和指標來說明產(chǎn)品效果也得到了越來越多的公司的認可和應用。

AB實驗在其中就是一種很常見的產(chǎn)品效果數(shù)據(jù)評估工具,在各大公司的產(chǎn)品迭代過程中也得到了越來越廣泛的應用。

二1.0 時代 從無到有

在AB實驗剛開始的時候,需要解決的問題很簡單:

通過某種用戶流量分組方式,將不同的用戶劃分到不同的流量組,在不同的流量組通過控制變量的方式應用不同的產(chǎn)品策略,隨后觀察兩個組的產(chǎn)品效果差別。

這種非常樸素的實驗思路就是最基本的AB實驗的分流,需要注意的是在過程中需要保證控制變量和穩(wěn)定的流量比例。

一個基本AB實驗實例

圖片圖片

一個基本的AB實驗需要有以下要素:

  1. 實驗目標和實驗假設

實驗目標決定到達到什么樣的效果實驗才算成功,舉個例子,我希望付款率提升5%,這就是目標,其中的實驗指標是付款率,做實驗之前一定要有實驗目標,沒有實驗目標沒辦法確定實驗是否成功,實驗目標包含指標和變化幅度兩個要素。

實驗假設是猜想通過控制哪些因素來達到實驗目標,比如我們假設付款按鈕的顏色會影響用戶的付款意愿進而影響付款率,那這里的實驗假設就是付款按鈕顏色會影響用戶付款意愿。

  1. 實驗對象(實驗對象是可以用來應用策略的用戶或者請求或者其他對象)
  2. 實驗對象并不是僅僅指用戶,用戶的每一次請求也可以單獨做實驗,甚至每一次用戶請求的每一個曝光位置都可以看做一個實驗流量,這個對象取決于具體的業(yè)務。

  3. 對照組和實驗組(AB實驗的核心要求是控制變量做效果對照,所以至少有一個或多個對照組策略和實驗組策略)

  4. 對照組:一般是沒有任何策略的組,代表了現(xiàn)在的實驗效果。

  5. 實驗組:一般是應用了新策略的組,代表了新策略的實驗效果。

  6. 統(tǒng)計功效:在進行實驗組和對照組的流量分配的時候要注意,因為我們的AB實驗是從整體用戶中取一部分進行實驗,然后采用統(tǒng)計學方式進行效果評估,所以無論是實驗組還是對照組樣本量要滿足最基本的統(tǒng)計功效,后續(xù)的實驗才有意義,而統(tǒng)計功效無法在實驗之后計算,需要我們在實驗進行之前就做充足的調(diào)研。

算法的AB 1.0主要功能

  1. 通過控制變量的方式進行AB分流實驗,并通過離線的模擬分流規(guī)則提供用戶實驗分組信息,使得數(shù)據(jù)分析可以計算實驗的指標報表。
  2. 打通基本的工程實驗鏈路,可以讓算法通過實驗配置自主的控制實驗流量和實驗策略。

1.0 AB實驗的策略生效流程

在早期的實驗過程有以下鏈路:

圖片

  • 通過配置中心配置約定好的AB實驗配置信息,線上的服務通過配置中心的變更信息,實時變更實驗配置,從下次分流開始應用新的分流策略,同時記錄實驗日志。
  • 報表計算方式,將實驗配置信息同步到ODPS,第二天用前一天的實驗配置對昨天的用戶進行重新分流計算,獲得昨天的用戶實驗分流信息(之所以這樣是因為實驗變更是以天為單位,離線計算可以比較方面的支撐后續(xù)的實驗分析)。

算法和普通業(yè)務的AB分流由于業(yè)務特性原因有較多的需求不同的地方,針對兩者區(qū)別我們也進行了一些特殊的算法實驗優(yōu)化設計。具體如下:

圖片圖片

早期的AB實驗設計解決了基本的實驗分流問題也提供了一套配套的實驗指標和實驗置信度計算方案,支撐了早期的簡單業(yè)務可以通過AB實驗的方式比較科學的觀測算法模型效果。

三、2.0 時代 從有到全,支持復雜業(yè)務功能

新的業(yè)務需求

隨著公司業(yè)務發(fā)展和各個系統(tǒng)迭代優(yōu)化,用戶對于基礎的AB實驗系統(tǒng)開始衍生出了一些新的,更細化更復雜的業(yè)務需求,用戶也希望AB系統(tǒng)可以幫助支撐更高效的實驗迭代。

  • 流量饑渴,更豐富的流量需求:在1.0版本的AB實驗中已經(jīng)解決了基本的實驗分流和配置的問題,但是由于一個場景中總用戶流量有限,可能會有多種業(yè)務實驗同時進行,實際實驗運行時需要在同時運行的實驗數(shù)量和每個實驗的流量大小之間做一個取舍,業(yè)務高速發(fā)展時期經(jīng)常會有用戶希望提高同時運行的實驗數(shù)量,同時保證每個實驗有充足的流量,于是我們擴展了原來的實驗流量分流模型設計,采用分層分域的正交的業(yè)務實驗劃分方式來支撐上述的流量需求。
  • 更實時更準確的實驗報表:在早期的實驗中通過第二天的配置重算的方式得到前一天的用戶實驗分組數(shù)據(jù),這種方法可以支撐非常巨大的用戶和實驗數(shù)量,但是時效性上比較難以保證。隨著業(yè)務快速迭代,算法的實時實驗效果監(jiān)控的需求也逐漸增加,離線的實驗報表計算反饋需要等到至少1天后才能觀測,實驗反饋周期太長。于是我們調(diào)整了實驗分流和報表的計算鏈路,采用實時實驗日志埋點通過flink等實時計算平臺實時計算實驗效果,這種做法可以實時捕捉實驗流量的變化情況,對于驗證實驗分流效果有較大的效率提升。
  • 復雜實驗形式:聯(lián)合實,多集群實驗, 指定用戶實驗需求:隨著算法工程鏈路的規(guī)范化,業(yè)務鏈路中的一些業(yè)務層之間開始進行聯(lián)合調(diào)優(yōu)實驗,催生出了多參數(shù)跨層聯(lián)合實驗的需求,需要在分層實驗的基礎上支持聯(lián)合參數(shù)的生效機制,這在一般的分層實驗設計中是很難支撐的。隨著工程鏈路穩(wěn)定性項目的進展,大部分業(yè)務同時都具有多個不同集群,此時又需要AB系統(tǒng)也可以針對不同集群提供同場景不同實驗配置的功能支撐。還有隨著精細化運營的展開,越來越多的實驗只針對更精準的特定用戶群才能生效,這給原來的實驗分流和實驗分析都帶來了不小的需求和挑戰(zhàn)。

更強大更通用的分流模型

為了滿足更豐富的流量分配需求,我們設計了一套比較靈活通用的實驗分流模型, 這套模型經(jīng)過多個公司的業(yè)務驗證,可以確保在未來較長的一段時間內(nèi),充分支撐我們所有業(yè)務的個各種AB實驗分流需求。同時根據(jù)我們自己的業(yè)務發(fā)展需求,也支持了條件層,自定義分流機制等為更復雜業(yè)務設計的一些分流機制。

多層正交的實驗流量模型

圖片

上述的分流模型將一個場景流量分為層和域兩種嵌套結構,通過層來隔離不同業(yè)務配置,通過域來隔離不同用戶群。用戶在該模型進行分流的過程采用從外到內(nèi),從上到下的逐步命中,每一次進入一個業(yè)務層都會觸發(fā)一次選桶邏輯,命中桶以后,讀取桶上的配置,如果桶內(nèi)還有層配置繼續(xù)依次命中層,觸發(fā)內(nèi)部的選桶邏輯。

該模型可以支持如下主要特點:

  1. 分層分域,互相嵌套的流量設計,支持業(yè)務域分層的正交流量,每一層都是一個單獨的業(yè)務,解決流量饑渴問題,同時支持自由的流量域劃分,流量域和流量層可以互相嵌套,實現(xiàn)極其靈活的流量劃分方式。
  2. 每一個流量層采用hash模板+流量槽,層內(nèi)實驗通過圈槽的形式?jīng)Q定實驗在該層的流量比例,允許算法用戶自定義實驗分流的規(guī)則,支持根據(jù)用戶的用戶特征信息進行分流,同時支持靈活的跨層流量對齊機制。這種方式可以實現(xiàn)極為靈活的分流方式,支持各種對象和分流方式(比如用戶分流,請求分流,設備分流,作者分流,按地區(qū)分流等)。
  3. 支持白名單,允許用戶繞開分流機制,指定用戶的固定實驗鏈路,用于在線上進行特殊用戶的實驗驗證。
  4. 支持條件層,允許符合某種條件的用戶單獨進行特定實驗,比如只針對新用戶進行的實驗。

從該模型上線以來,2年多的時間內(nèi)已經(jīng)完美支撐了算法300多個場景的AB流量分配需求,經(jīng)過了充分的業(yè)務驗證,從分流層面解決了許多有特殊需求的分流業(yè)務遇到的問題。

具體層中的分流規(guī)則如下:

圖片圖片

每一個流量層根據(jù)層中的分流配置信息和用戶信息計算命中的流量槽,然后根據(jù)流量槽命中圈選了流量槽的實驗,實驗通過擁有的流量槽數(shù)量決定實驗流量比例。

標準的實驗工程鏈路

圖片

通過AB實驗的后臺改造,我們重新思考并調(diào)整了整個實驗鏈路的工程設計,在新的工程設計中,相對于上一個版本主要有以下幾個方面需要改進:

  1. 采用實驗分流日志而不是離線的實驗配置來計算用戶的實驗分組信息。

實驗日志可以捕獲每一個時刻的用戶的實驗分流情況,可以較為敏感的捕捉到實驗變更的情況。

實驗日志可觀測性強,用戶配置完實驗以后可以立刻通過日志觀測實驗的命中情況。

可以在日志中附加更多的實驗環(huán)境相關信息,做更豐富的實驗分析,可以簡化離線的實驗分組計算邏輯。

  1. 線上應用增加實驗信息的具體埋點信息, 埋點分為兩部分:
  2. 一部分透傳給客戶端,其中包含用戶命中的實驗信息,稱之為ACM埋點,客戶端在用戶進行點擊曝光等操作時上報信息中回傳服務端下發(fā)的ACM字段,這樣我們可以通過神策上報的行為日志,清楚的知道每個實驗曝光幾次,被點擊幾次,可以及時得到實驗的線上表現(xiàn),這部分行為日志還可以幫助我們實時的計算實驗策略效果報表。

  3. 另一部分作為應用的后臺日志記錄,記錄了每一次請求中用戶命中的實驗相關信息,用于計算實驗分組信息。

  4. 設計了AB實驗的后臺操作管理界面,不用再通過手動修改配置中心的配置來進行實驗配置。并將實驗發(fā)布,實驗修改,實驗配置回滾等功能做成具體的按鈕功能,極大地提高了用戶的實驗操作使用體驗。

  5. 拆分了實驗參數(shù)和代碼執(zhí)行鏈路,抽象出了AB參數(shù)和代碼鏈路運行方案兩種概念,將AB變成一個弱依賴,降低實驗參數(shù)配置錯誤對線上業(yè)務的影響。

Ps: 為什么要同時采用兩種實驗信息反饋鏈路,原因是第一種ACM上報的用戶實驗信息依賴于用戶上報,如果用戶遇到應用crash或者延遲上報,或者網(wǎng)絡情況突然不好,我們沒辦法獲得未上報的這部分信息,第二種很明顯,沒辦法知道發(fā)放下來的帶有實驗信息的內(nèi)容的后續(xù)反饋情況。兩種鏈路都沒辦法完全的覆蓋全部用戶,只有互相配合才能完整的覆蓋全量用戶,至于為什么采用離線日志來做實驗報表,ACM來做實時報表純粹是工程效率方面的考慮。

ACM通用埋點標準

為了解決實驗的實時效果觀測問題, 我們需要想辦法將后臺的實驗命中標識信息傳遞給客戶端。考慮到其他業(yè)務場景也會有類似的埋點需求,為了埋點通用性考慮,我們規(guī)劃了一個算法的埋點標準,主要想簡化算法埋點流程和對算法的埋點信息進行統(tǒng)一的治理。

ACM埋點主要是通過算法與客戶端約定一個固定的埋點內(nèi)容字段ACM,后端算法在開發(fā)時候,通過提供的SDK工具,將需要埋點的信息和內(nèi)容通過SDK采用特定的規(guī)范形成一串可識別的字符串內(nèi)容,客戶端同學對ACM這個約定好的字段進行事件(曝光,點擊等)上報,后端就可以根據(jù)上報的用戶行為日志通過實時計算工具快速的獲得某個實驗的后續(xù)用戶反饋信息。

ACM埋點規(guī)范例子:

版本.業(yè)務域.內(nèi)容資源類型.資源位.實驗.自定義值
  • 版本:標記本條ACM的遵循的規(guī)范版本,不同版本具有不同的解析規(guī)則,方便udf解析。
  • 業(yè)務域:業(yè)務系統(tǒng)代稱,盡量簡短,比如 搜索srh。
  • 內(nèi)容資源類型:內(nèi)容類型或資源,比如 user_10098, cspu_1020,spu_771等。
  • 資源位:廣告位,榜單位。
  • 實驗:資源本次采用的AB實驗策略,多個實驗用-隔開。
  • 自定義值:

允許應用方進行擴展的字段,比如 chan_latest-pos_3 代表channel為latest,pos為3。

特殊要求:自定義字段中不能出現(xiàn) ".","-","_"等字段,其他部分無此要求。

埋點示例:

acm: 1.srh.spu_1009.sh.kka3b.10089-1929-100.channel_hot-position_2
acm: 2.srh.spu:1009.sh.kka3b.10089;1929;100.channel:hot;position:2

埋點場景:

    request維度,覆蓋所有搜索和推薦場景

埋點動作:

    request維度

下面是一個帶有acm信息的后端返回示例:

{
    "code": 200,
    "data": {
        "total": 3730,
        "start": 0,
        "hits": 10,
        "searchId": "161113175619737242413163",
        "searchTime": 0.024447,
        "items":[
            {
                "spuId":"xxx",
                "acm": "1.ms.prd-10092.v1ss.exp-1.kka.12",
            }
        ],
        "facet":[],
        "cache": false
    },
    "requestId": "f2ca7c08693acd54",
    "cost": 0,
    "time": 1611131759
}

實時的實驗指標監(jiān)控

實時實驗指標的計算流程

  1. 后臺服務日志實驗分流信息需要透傳給客戶端;
  2. 客戶端用戶行為及時上報;
  3. 行為日志被flink等實時計算平臺及時處理;
  4. 制定明確且可計算的實時指標規(guī)范。

有了上面四個基礎流程,就可以計算實時的實驗反饋指標,但是要注意實時的指標計算往往只能反映一段時間的實驗趨勢變化,在部分復雜指標上很難實現(xiàn)精確的實驗指標計算,所以一般用來觀察實驗指標變化趨勢,不作為最終決策依據(jù)。

實時數(shù)據(jù)處理鏈路

打通了數(shù)據(jù)鏈路并且在用戶的行為日志中包含了ACM埋點以后,算法就可以基于行為日志,通過flink等工具實時算計算用戶的各種指標信息。

具體的監(jiān)控鏈路流程如下圖綠色鏈路所示:

圖片

具體實時實驗監(jiān)控效果

最終可以達到秒級的實驗效果反饋,極大的加快了算法對實驗策略的反饋效率,具體效果如下圖,用戶可以自己選擇關注的實驗信息對比不同實驗在同一時間區(qū)間內(nèi)的指標變化情況。可以非常迅速的得到線上的新實驗的效果反饋信息,極大地縮短了算法對實驗指標的策略調(diào)整反饋周期。

圖片

四、3.0 時代 從全到優(yōu),提升用戶體驗和實驗效率

2.0 時代主要是從各種機制和功能方面盡量滿足業(yè)務需要,業(yè)務功能滿足以后,我們進行了業(yè)務與擴展,將算法的推薦業(yè)務場景也囊括進來,推薦業(yè)務接入以后,雖然在基本功能上也可以滿足需求,但是推薦和搜索的業(yè)務特點還是有點不同,于是我們針對實驗平臺的實驗操作用戶體驗和穩(wěn)定性方面進行了較多的優(yōu)化。

實驗操作易用性的建設

業(yè)務場景鋪開以后,使用的業(yè)務團隊和人員也變得更為復雜,于是我們在針對特定場景的使用和業(yè)務人員使用習慣方面做了不少的功能改進和優(yōu)化。根據(jù)我們收集的算法人員的參數(shù)配置,白名單配置,流量調(diào)整等功能使用痛點,我們進行了針對性的優(yōu)化。

實驗參數(shù)的易用性工具

實驗參數(shù)配置是AB實驗的最主要的功能,為了優(yōu)化用戶體驗在實驗參數(shù)使用方面的體驗,我們收集了一些常見的用戶在使用參數(shù)配置時候經(jīng)常遇到的問題,并針對性做了功能和體驗的優(yōu)化。

場景1:隨著業(yè)務發(fā)展,算法配置的業(yè)務層越來越多,由于約定的參數(shù)規(guī)范是同一層的可配置實驗參數(shù)應該一致,同一個實驗參數(shù)配置也應該出現(xiàn)在同一層,但是隨著層數(shù)增多和部分參數(shù)使用不規(guī)范,估算某個實驗參數(shù)的實際生效流量就變得很困難(參數(shù)有后覆蓋前面的規(guī)則)。有可能出現(xiàn)你給a實驗配置了 10%流量的 recallSize = 20 但是后續(xù)該參數(shù)被別人的同名參數(shù)覆蓋導致實際參數(shù)生效流量不符合預期的情況。

圖片圖片

參數(shù)流量著色分析:使用參數(shù)流量的著色分析可以清楚的知道某個實驗參數(shù)都在哪些實驗中有配置,這些實驗如果同屬于一個業(yè)務層則無流量覆蓋,如果有些實驗不屬于同一個業(yè)務層,有可能出現(xiàn)參數(shù)覆蓋的情況。流量著色就是通過程序,一鍵計算某個參數(shù)最終的流量結果分布情況,可以方便的看到某個參數(shù)最終的線上真實流量比例。

包含某參數(shù)配置的所有實驗查詢:

圖片圖片

某參數(shù)的實際生效流量分布:

圖片圖片

場景2:實驗參數(shù)越來越復雜,同一個參數(shù)往往有多個不同的版本需要同時觀測實驗的效果,這種時候可能由于時間久遠或者實驗變更頻繁,或者參數(shù)過多,很多時候在進行實驗觀測和調(diào)整的時候需要確認實驗中的參數(shù)配置信息,特地為這些需要對比參數(shù)的場景制作了便捷的實驗參數(shù)對比的功能。

實驗參數(shù)對比:可以比較清晰的對比同一個實驗參數(shù)在同一層其他實驗中分別是什么值,可以大幅度提高實驗流量調(diào)整期間需要進行的實驗信息核對工作效率。

圖片圖片

實驗布局的操作和展示優(yōu)化

為了滿足靈活的實驗流量劃分,我們設計了一套通用的實驗流量模型,但是該流量模型的可視化方面一直是一個不小的難題,最基本的我們希望能直觀的展示層與層,層與桶(用戶域)之間的布局結構和用戶流量的命中順序關系。

我們進行了一些更能直觀體現(xiàn)實驗布局的探索,目前我們采用一個標準的樹狀結構來表示個實驗分流模型。實驗模型中的業(yè)務層和用戶桶我們都會用圖標進行區(qū)分,由于層桶結構可以嵌套多次,我們通過將結構關系進行拆分,將桶頁面主視圖和層頁面主視圖進行了分別設計。

  • 層頁面主視圖:可以便捷的觀察到當前層內(nèi)的不同流量桶和子桶內(nèi)的其他子業(yè)務層,主要是用于尋找自己的業(yè)務層位于某一個用戶桶內(nèi),觀察某些桶的流量比例和參數(shù)等。子業(yè)務層內(nèi)的流量桶信息不予顯示。

圖片圖片

  • 桶頁面主視圖:桶頁面的主視圖可以同時觀察到該桶內(nèi)的各個子業(yè)務層和業(yè)務層內(nèi)部的子實驗桶信息,可以用來直觀的對照具體的實驗命中鏈路從上往下核對實驗命中路徑。界面顯示如下(測試數(shù)據(jù)):

圖片圖片

通過將層桶結構進行主要的功能拆分,可以在復雜場景的視圖布局清晰度和易用性上達到一個比較好的平衡。

實驗信息的完善

算法的實驗在進行實驗分析報表的時候往往需要對比多個指標綜合觀察實驗效果,之前都是算法人員跟分析人工對齊某個實驗什么時候開始什么時候結束,需要觀察哪些指標等信息。為了方便后續(xù)自動化的進行實驗效果分析,我們完善了實驗的實驗時長,核心指標,輔助指標等功能,方便用戶進行實驗的分析信息管理,后續(xù)通過自動化功能依賴這種信息可以實現(xiàn)實驗報表指標流程的自動化計算。

圖片圖片

服務穩(wěn)定性的改進

動態(tài)白名單功能優(yōu)化

白名單操作是一個使用頻次較高的AB實驗操作功能, 實驗參數(shù)配置好以后往往需要通過白名單來小范圍的驗證策略效果。但是早期的白名單設計時候考慮到白名單會影響用戶的分流,所以白名單信息和實驗布局配置信息一起被用戶感知,這也導致每一次的白名單變更都需要重新發(fā)布實驗配置,給線上的配置穩(wěn)定性造成了威脅。

解決方案:

基于白名單的設計和生效流程,我們嘗試通過流程和配置格式改進優(yōu)化,使得白名單的配置可以實時生效同時又不影響原來的實驗配置,如下圖所示:

圖片

動態(tài)白名單功能改動相當于將白名單的配置信息獨立出來,在白名單有修改的時候獨立加載,同時不觸發(fā)配置信息本身的更新。但是考慮到兼容性問題,我們每次配置信息改動也會額外觸發(fā)白名單的重新更新,描述配置更新相當于一次全量更新,配置和白名單都會更新。白名單更新相當于實時只更新新增的白名單信息。

并發(fā)操作Ark發(fā)布實驗的優(yōu)化

由于AB實驗的配置下發(fā)方式是通過Ark配置中心提供的配置通知功能實現(xiàn)的,目前后臺操作Ark進行配置發(fā)布的時候是通過http接口進行了,使用接口同時操作同一個Ark配置集的時候,大量操作容易產(chǎn)生并發(fā),并發(fā)問題會導致Ark操作直接失敗,這種情況極大地阻礙了實驗配置發(fā)布過程的流暢性。

解決的辦法有如下方案:

圖片圖片

經(jīng)過仔細評估和方案選擇,我們決定方案2,3,4同步進行,最終完全解決了實驗操作時候的并發(fā)問題。

實驗效果分析的探索和優(yōu)化

在過去2年的AB實驗的實踐和改進過程中,我們也十分注重實驗效果方面的分析和問題歸因,根據(jù)遇到的實際實驗分析問題和情況,總結了一部分常見的實驗分析相關經(jīng)驗文檔,其中涉及實驗流程標準化,實驗指標選取,實驗指標的統(tǒng)計功效分析,實驗指標的p值和置信度分析,以及常見的實驗中遇到的問題等。

常見的實驗分析問題

我們總結了一些實驗效果分析中常見的問題和可能的原因,可以幫助排查AB實驗中遇到的常見問題。具體如下表:

圖片

實驗中的辛普森悖論

辛普森悖論(英語:Simpson's paradox),是概率和統(tǒng)計中的一種現(xiàn)象,其中趨勢出現(xiàn)在幾組數(shù)據(jù)中,但當這些組被合并后趨勢消失或反轉。這個結果在社會科學和醫(yī)學科學統(tǒng)計中經(jīng)常遇到,當頻率數(shù)據(jù)被不恰當?shù)亟o出因果解釋時尤其成問題。當干擾變量和因果關系在統(tǒng)計建模中得到適當處理時,這個悖論就可以得到解決。辛普森悖論已被用來說明統(tǒng)計誤用可能產(chǎn)生的誤導性結果。

落實到我們的AB實驗中就是 如果一個實驗A在一個較長的實驗周期內(nèi)每天指標都高于實驗B,實驗A的整體周期指標未必高于實驗B。

圖片圖片

本圖想說明一個問題,如果一個實驗周期跨很多天,每天觀測實驗效果的情況下,如果某個實驗組用戶數(shù)量(或者某個指標)長期每天穩(wěn)定高于另一個實驗組,不能說明分流不均勻。

第一天  因為剛剛重新分流,所以所有用戶對實驗來說都是新用戶,a組 505萬,b組 495萬 ,1%的正常誤差。

第二天 因為老用戶要保持分流一致,組內(nèi)用戶=新用戶+次留老用戶, 新用戶會重新分組,老用戶沿用之前的分組,此時有兩種情況:

情況1  (合理) 老用戶按原來的分流, 新用戶分流誤差 1%。

情況2 (不合理) 老用戶按原來的分流,新用戶必須要保證誤差 2%,才能逆轉第二天的分組誤差情況,但是此種情況下第二天的新老用戶比例會嚴重不均勻,同時沒辦法保持分流策略的一致性,理論上不可能實現(xiàn)。

五、未來的改進方向

未來我們會希望借助數(shù)倉部門的AB平臺的指標計算和可視化通用能力,希望可以逐步增強AB平臺的數(shù)據(jù)可視化能力,在實驗分流情況的可視化分析,實驗的用戶特征的分布可視化分析,實驗的指標變化原因排查等方面與分析同學一起合作,提升AB實驗的指標報表問題分析效率。

在AB實驗平臺本身的實驗信息操作和性能,穩(wěn)定性方面我們也有一些新的想法,希望將來可以打通開發(fā)環(huán)境,測試環(huán)境,生產(chǎn)環(huán)境,實現(xiàn)一個界面可以跨環(huán)境操作,降低算法同學使用不同環(huán)境AB需要在不同系統(tǒng)切換的問題,同時在將來還希望借助sidecard的形式增強AB實驗的分流能力和分流穩(wěn)定性,兼顧分流性能和分流平臺功能迭代效率。

責任編輯:武曉燕 來源: 得物技術
相關推薦

2022-12-10 15:25:51

進化歷程Vue

2024-07-23 10:02:49

2022-11-07 14:03:46

2018-05-14 12:30:37

數(shù)據(jù)驅動算法優(yōu)化

2024-02-02 08:12:40

AB實驗雙盲測試搜索實驗

2016-10-17 09:55:54

云IAMIT云計算

2011-10-03 20:23:34

2011-11-10 14:42:11

2012-07-12 09:25:03

蘋果Mac OS X

2022-07-31 20:29:28

日志系統(tǒng)

2013-01-28 14:46:48

移動廣告移動互聯(lián)網(wǎng)

2024-03-25 11:37:40

機器學習人工智能進化算法

2022-12-28 08:31:38

平臺設計應用

2020-07-20 10:40:31

云計算云平臺IT

2025-07-11 09:16:00

2022-01-10 17:20:51

物聯(lián)網(wǎng)設備管理IOT

2010-07-27 14:04:52

2010-06-13 17:21:41

Linux下dhcp測

2025-01-10 14:35:23

2024-08-13 11:59:07

點贊
收藏

51CTO技術棧公眾號

51精品秘密在线观看| 精品国产一区二区三区久久久樱花 | 国产精品男女| 一本色道亚洲精品aⅴ| 亚洲国产日韩综合一区| 午夜精品久久久久久久96蜜桃| 一本色道久久综合亚洲精品不| 亚洲人成免费电影| 国产又粗又猛又爽又黄| 欧美成人影院| 亚洲自拍偷拍麻豆| 五月婷婷综合色| 天天操天天干天天爱| 久久99国产精品久久99| 98视频在线噜噜噜国产| 强制高潮抽搐sm调教高h| 日本一道高清一区二区三区| 日韩一级视频免费观看在线| 亚洲性生活网站| a√中文在线观看| 中文字幕制服丝袜一区二区三区| 精品视频第一区| 99视频在线观看免费| 日韩不卡一二三区| 97久久超碰福利国产精品…| 国产1区2区3区4区| 日韩大片在线播放| 亚洲人成网7777777国产| 91亚洲一线产区二线产区| 国产极品一区| 91传媒视频在线播放| 国产一区二区视频播放| av片在线观看网站| 中文字幕制服丝袜成人av| 日韩av电影免费在线观看| 色资源在线观看| 99久久国产综合精品女不卡| 亚洲中国色老太| 国产免费视频一区二区三区| 亚洲中文字幕在线观看| 不卡av一区二区| 亚洲少妇激情视频| 大又大又粗又硬又爽少妇毛片| 成人h动漫精品一区二区器材| 91精品国产综合久久香蕉的特点| 男女无套免费视频网站动漫| 国产免费不卡| 日韩欧美高清视频| 亚洲中文字幕无码专区| 国内激情视频在线观看| 亚洲成av人片在线观看| 搞av.com| 毛片在线网站| 欧美日韩中文字幕综合视频| 又粗又黑又大的吊av| 嗯啊主人调教在线播放视频| 亚州成人在线电影| 国产原创popny丨九色| 999av小视频在线| 欧美日韩午夜激情| 日韩免费毛片视频| 香蕉视频亚洲一级| 欧美艳星brazzers| 午夜啪啪小视频| 欧美一级片网址| 欧美一区二区不卡视频| 国产一区二区三区无遮挡| 国产日韩欧美一区二区东京热| 精品一区二区综合| 91在线免费视频| 亚洲精品福利网站| 97久久久精品综合88久久| 欧美日韩电影一区二区三区| 大片免费播放在线视频| 综合分类小说区另类春色亚洲小说欧美| 亚洲欧洲日本国产| 日本中文字幕中出在线| 精品久久久一区二区| 男女爽爽爽视频| а天堂中文最新一区二区三区| 日韩三级高清在线| 熟妇熟女乱妇乱女网站| 一级黄色片大全| 97久久综合区小说区图片区| 日韩精品www| 国产一区在线观看免费| 国精品一区二区三区| 日产精品久久久一区二区福利| 中文字幕一区二区在线视频 | 国产精品视频公开费视频| 一区二区www| 成人国产精品免费观看| 青娱乐国产91| 18在线观看的| 色综合天天性综合| 天天av天天操| 在线亚洲a色| 久久躁日日躁aaaaxxxx| 中日韩黄色大片| 韩国三级中文字幕hd久久精品| 国产高清自拍99| av在线首页| 香蕉加勒比综合久久| 69久久久久久| 日韩av黄色在线| 久久影院模特热| 伊人中文字幕在线观看| 国产成人综合在线| 视频在线99| 国产理论在线| 欧美一区二区在线免费播放| 国精产品一区二区三区| 欧美午夜不卡影院在线观看完整版免费| 欧美性视频网站| 精品国产伦一区二区三| 亚洲国产精品传媒在线观看| 国产精品333| 秋霞一区二区| 日韩中文字幕在线视频| 丁香六月婷婷综合| 成人午夜在线视频| 久久视频免费在线| 日韩成人一区| 伊人伊成久久人综合网小说| 中文字幕一区二区三区精品 | 久久亚洲AV无码专区成人国产| 黄色成人精品网站| 91在线免费看网站| 日本在线免费| 欧美亚洲精品一区| 扒开jk护士狂揉免费| 99精品久久久| 国产亚洲情侣一区二区无| 污污在线观看| 日韩丝袜美女视频| 久久99久久99精品免费看小说| 日本亚洲欧美天堂免费| 欧美日韩在线观看一区二区三区| 精品丝袜在线| 亚洲国产精品va在线| 精品无码人妻一区二区三区品| 寂寞少妇一区二区三区| 欧美久久电影| xx欧美xxx| 精品一区精品二区| 特级做a爱片免费69| 91网站在线播放| www.com毛片| 亚州综合一区| 日韩免费在线视频| 国产裸舞福利在线视频合集| 欧美中文字幕一区| 美女av免费看| 极品美女销魂一区二区三区| www亚洲国产| 嫩呦国产一区二区三区av| 久久99精品久久久久久琪琪| www.蜜臀av.com| 亚洲午夜三级在线| 无套内谢大学处破女www小说| 母乳一区在线观看| 日韩欧美三级一区二区| 欧美三级电影网址| 久热在线中文字幕色999舞| 国产日产亚洲系列最新| 亚洲国产欧美一区二区三区丁香婷| 韩国av中国字幕| 一区二区日本视频| 日产精品久久久一区二区| 青青国产精品| 午夜精品一区二区三区视频免费看| 色香蕉在线视频| 色94色欧美sute亚洲线路一ni| 91l九色lporny| 黄色精品一二区| 亚洲国产精品无码av| 四虎影视精品| 国产区精品在线观看| 26uuu亚洲电影在线观看| 亚洲精品理论电影| 亚洲最新av网站| 亚洲一区二区视频在线| 男人天堂av电影| 精品在线一区二区三区| 国产精品第157页| 美女亚洲一区| 95av在线视频| 欧美日韩国产v| 久久亚洲国产成人| 天天插天天干天天操| 欧美午夜在线观看| 精品少妇久久久| 国产免费观看久久| 久久久久中文字幕亚洲精品 | 国产精彩精品视频| www在线视频| 亚洲欧洲在线视频| www.污视频| 欧美最猛黑人xxxxx猛交| 精品97人妻无码中文永久在线| www国产成人免费观看视频 深夜成人网| 深夜黄色小视频| 日韩一区二区久久| 国产日产欧美一区二区| 国产成人1区| 日本伊人色综合网| 91啪亚洲精品| 日韩欧美在线一区二区| 一区二区三区在线免费看| 国产盗摄xxxx视频xxx69| 国产黄色小视频在线| 亚洲欧美www| 成人爽a毛片一区二区| 欧美吻胸吃奶大尺度电影| 九九九国产视频| 一区二区中文字幕在线| 亚洲天堂视频一区| av电影在线观看完整版一区二区| 亚洲欧美aaa| 日韩精品午夜视频| 精品久久久久久久久久中文字幕| 国产精品国产一区| 欧美日韩喷水| 欧美高清视频看片在线观看| 成人毛片网站| 国产剧情一区二区在线观看| 国产精品高潮呻吟视频 | 午夜精品视频在线| 主播国产精品| 日韩三级成人av网| a天堂在线资源| 亚洲视频在线观看网站| 日av在线播放| 日韩av综合网站| 五月婷婷狠狠干| 精品免费视频.| 国产小视频免费观看| 日韩一区二区三| 国产精品一区二区三区在线免费观看| 欧美午夜一区二区三区| 中文人妻熟女乱又乱精品| 在线免费观看日本欧美| 久久久久久久久黄色| 一本久道中文字幕精品亚洲嫩| 国产精品第5页| 色综合久久综合中文综合网| 日韩色图在线观看| 一本色道久久综合狠狠躁的推荐| 中文字幕激情小说| 欧美性xxxx极品高清hd直播 | 丝袜美腿亚洲色图| 日本精品一区在线观看| 久久久蜜桃一区二区人| 一本久道综合色婷婷五月| 国产日韩欧美三区| 成人观看免费完整观看| 久久五月激情| 黄色片视频在线| 精品一区二区三区免费| 色婷婷一区二区三区在线观看| 国产在线视视频有精品| 91人妻一区二区三区| 粉嫩av一区二区三区在线播放 | 天堂99x99es久久精品免费| 国产日韩二区| 久久av免费| 一区二区三区四区视频在线| 亚洲国产成人精品女人| av免费看网址| 久久久久国内| 五月天婷婷影视| 成人免费观看av| 亚洲图片另类小说| 亚洲欧美日韩国产手机在线| 国产一级一片免费播放| 91国在线观看| 99在线观看精品视频| 亚洲精品按摩视频| 成av人电影在线观看| 免费av在线一区| 午夜影视一区二区三区| 成人av资源在线播放| 成人黄色av网址| 日韩欧美亚洲精品| 午夜国产精品视频免费体验区| 免费av观看网址| 看片的网站亚洲| 中文在线观看免费视频| 欧美国产激情二区三区| 久久午夜无码鲁丝片| 色天使久久综合网天天| 国产丝袜视频在线观看| 亚洲精品小视频| 91福利国产在线观看菠萝蜜| 日韩男女性生活视频| 香蕉成人app| 少妇特黄a一区二区三区| 激情婷婷久久| 九九精品久久久| 26uuu精品一区二区三区四区在线 26uuu精品一区二区在线观看 | 波多野结衣国产| 91.成人天堂一区| 可以免费看污视频的网站在线| 久久99精品久久久久久噜噜| 成人国产激情| 精品久久精品久久| 欧美在线首页| 在线观看免费视频高清游戏推荐| jiyouzz国产精品久久| 在线观看黄网址| 一本大道av一区二区在线播放 | 99精品视频中文字幕| 色老板免费视频| 欧美在线观看一二区| 污视频网站免费观看| 久久97精品久久久久久久不卡| 国产精品蜜月aⅴ在线| 欧美精品成人一区二区在线观看 | 97视频免费在线看| 国产精品中文| 椎名由奈jux491在线播放| 久久午夜精品| 亚洲第一成人网站| 午夜伦欧美伦电影理论片| 国产熟女精品视频| 日韩一区二区三区在线播放| 电影天堂国产精品| 蜜桃导航-精品导航| 亚洲少妇一区| 中文字幕在线永久| 亚洲国产日韩在线一区模特| 国产女无套免费视频| 久久久999国产| 伊人久久大香伊蕉在人线观看热v| 日韩偷拍一区二区| 日韩综合在线视频| 久久精品无码一区| 欧美视频在线观看免费网址| 少妇av在线播放| 97久久精品国产| 色先锋久久影院av| 黄色一级视频片| 91啪亚洲精品| 天码人妻一区二区三区在线看| 日韩精品极品毛片系列视频| 日韩激情电影| 欧美精品一区二区三区在线看午夜| 亚洲一区二区动漫| www.久久国产| 欧洲色大大久久| av电影在线观看| 成人xxxx视频| 亚洲综合色网| 最新中文字幕日本| 天天综合网天天综合色| 蜜桃视频在线播放| 国产精品精品国产| 国产精品伦理久久久久久| www.国产福利| 一区二区三区欧美亚洲| 欧美性猛交 xxxx| 欧美一区二区三区……| 波多野结衣的一区二区三区| 亚洲一级免费在线观看| 亚洲激情综合网| 全部免费毛片在线播放一个| 欧美影院在线播放| 欧美一级精品片在线看| 在线视频一二区| 亚洲国产精品嫩草影院| 久久米奇亚洲| 91免费视频国产| 中文一区二区| 国产成人免费在线观看视频| 精品区一区二区| 波多野结衣亚洲| 在线综合视频网站| 成人av电影在线| 青娱乐在线免费视频| 欧美老女人性生活| 久久99视频| 韩国三级在线看| 欧美性生活大片视频| 美女精品视频| 日韩一区国产在线观看| 韩国av一区二区三区在线观看| 日本少妇xxxx动漫| 在线视频免费一区二区| 一区二区三区四区高清视频| 国产精品久久久久9999小说| 怡红院av一区二区三区| 精品福利视频导航大全| 超碰97网站| 久久精品噜噜噜成人av农村| 国产精品500部| 另类图片亚洲另类| 奇米狠狠一区二区三区| 亚洲av午夜精品一区二区三区| 欧美亚洲高清一区| av手机在线观看|