久久99久久人婷婷精品综合_超碰aⅴ人人做人人爽欧美_亚洲电影第三页_日韩欧美一中文字暮专区_波多野结衣的一区二区三区_婷婷在线播放_人人视频精品_国产精品日韩精品欧美精品_亚洲免费黄色_欧美性猛交xxxxxxxx

數據分析師必看,老司機帶你認識 AB 常見的10個錯誤

2021-02-01    分類: 網站建設

「沒有數據,你只是一個有想法的人。」

這是 W. Edwards 的依據名言,它表明,A/B 測試對于做出良好的商業決策來說至關重要。在 Manomano,我們向數百萬用戶展示數百萬 DIY 和園藝產品,并每天進行數十個 A/B 測試,以改善我們網站的用戶體驗

然而,運行 A/B 測試和解釋結果可能非常困難,如果做得不對,可能會得到錯誤的結論。這篇博文的目的不是要說明在運行 A/B 測試時應該做什么,而是要告訴你不應該做什么。下面是我們在進行 A/B 測試時經常會犯的 10 個常見錯誤。

1.在僅當一部分人受到影響時,觀察所有人

示例:你想測試你的搜索引擎相關性,但在分析 A/B 測試結果時,你查看整個總體,而不僅僅是使用搜索引擎的用戶。雖然這在科學的角度來說不是錯誤的,但是達到統計顯著性需要更長的時間,因為在分析的數據中添加了一些噪聲:
經驗 1:為了更快地達到統計顯著性,應該只觀察與測試功能交互用戶(這里是搜索引擎)的結果。

2.在沒有任何業務直覺的情況下進行測試

不能使用太多變量(A/B/C/../N)進行測試。例如,如果使用 α=5% 顯著性閾值并決定測試 20 個不同的場景,則其中每個場景是正樣本的機會是偶然的。這是多重比較問題的一個例子。因此,業務直覺對于決定啟動哪個 A/B 測試至關重要。為了說明這一點,我們可以修改 W.Edwards Deming 的名言:

「沒有想法,你只是一個有數據的人 」

經驗 2:用你的直覺(或者更好的方法——做用戶調查)來決定啟動哪一個 A/B 測試。

3.對人口進行分段以達到統計顯著性

這是多重比較問題的另一個例子:「我的 A/B 測試不顯著,因此我將在設備上對數據進行分段以獲得顯著結果」。在進行數據分割時必須非常小心。事實上,你比較的片段越多,結果中出現錯誤的幾率就越大。

以 country * device 為例,我們在 Manomano 有 n=15 個細分市場(5 個國家*3 個設備:法國/手機、法國/桌子、西班牙/平板電腦等)。讓我們計算在其中一個分段上偶然出現至少一個重要結果的概率:

我們有超過 50% 的機會出現這種偶然性,因此,從分割數據的測試中得出結論并采取行動是非常危險的。但也有一些技術可以緩解這一問題,比如 Bonferroni 校正。

經驗 3:不要為了達到統計顯著性而分割你的數據。

4.查看幾個指標以達到統計顯著性

多重比較問題的另一個例子是:「我的 A/B 測試在轉換率、平均購物籃和跳出率上都沒有顯著結果。但這對每類購物籃的數量來說是很重要的!如果你觀察足夠多的指標,你最終會發現其中一個指標碰巧顯示了一個重要的結果:

經驗 4:堅持測試設計的標準。

5.達到統計顯著性時停止測試

統計顯著性不能告訴你什么時候應該停止測試。在停止測試之前,你需要等待以達到計算出的樣本大小。使用 A/B 測試計算器計算測試所需的樣本大小。有關這種偏差的更多細節,請閱讀這里的問題說明。你還可以在此處模擬 A/A 測試,以查看在測試早期達到統計顯著性的頻率,即使在測試結束時結果不顯著:

使用 james lutrek 工具,根據樣本數量觀察 A/A 測試實驗的顯著性

經驗 5:即使你的測試有統計學意義(統計顯著性),也要繼續測試,直到測試結束。

6.在達到統計顯著性之前不要停止測試

同樣,統計顯著性不能告訴你什么時候可以停止測試,或者繼續測試。你不應該等待一個測試變得有意義,因為它可能永遠不會發生。如果你已經達到了在測試前計算出的樣本量,這就意味著你的測試有足夠的統計能力得出結論。

經驗 6 :一旦達到所需的樣本量,停止測試。

7.將(1-p 值)當做 B 優于 A 的概率

這是一個很常見的錯誤。p 值為 2% 并不意味著 B 有 98% 的機會比 A 好。這個假設在數學上是錯誤的,因為它還取決于基準率,即你所做的測試中,有積極影響的百分比(只有上帝知道這個數字!)。這個數字反映了你的商業直覺水平。

假設我們是上帝,我們知道 ManoMano 的基準率是 20%。這意味著我們 20% 的測試都是陽性的:

80% 的陽性測試(灰色)拒絕零假設(統計能力):

5% 的陰性測試(白色)拒絕零假設(顯著性閾值):

結論:在 80% 的統計能力、5% 的顯著性閾值和 20% 的基準率,當檢驗被認為是陽性(p 值<0.05)時,我們只有 16/(16+4)=80% 的機會是真陽性,而不是 95%。

在這種情況下(統計能力=80%,顯著性閾值=5%),知道你的 A/B 測試結果是有意義的,下面是一些概率,你的測試實際上是陽性的,這取決于基準率:

經驗 7:(1-p 值)不是檢驗為陽性的概率。如果你還想計算這個概率,使用貝葉斯 A/B 測試方法。

8.認為觀察到的增量是特征帶來的增量

測試所觀察到的增量允讓你可以計算統計顯著性,但將觀察到的增量視為特征帶來的實際增量是錯誤的,這通常需要更多的用戶或會話。

如果不能證明 B 優于 A ,則選擇傳遞置信區間而不是原始增量。為了說明這一點,我們以 A/B 測試為例:

p 值為 0.014,可接受的顯著性水平為 95%,此 A/B 檢驗為陽性,這意味著測試組顯著好于對照組。可以很容易地計算出觀察到的跳出率相對增量:

但將觀測到的增量視為特征帶來的實際增量是不正確的。你應該使用標準誤差計算每組的置信區間:

其中 p 是觀察到的組跳出率,n 是池樣本大小,zα 是對應于置信水平 α 的 z 值(在本例中為 95%)。你可以在這里找到通常置信水平的 z 值。

使用此公式,你最終可以計算兩個組的 95% 置信區間(CI)跳出率:

也可以反計算相對增量(pctdiff)的置信區間,但它更復雜。如果需要更多詳細信息,請參閱這個調查的第 3.3.2 節。

經驗 8:當你的測試為顯著陽性時,應該傳遞置信區間而不是原始增量。

9.當 A/B 測試結果違背你的直覺時,忽略它們

如果你(和你的組織)還沒有準備好用新的版本更新你的產品,除了確認你的偏見,啟動 A/B 測試是沒有意義的。直覺在選擇測試內容時至關重要,但它不應與 A/B 測試的結果相抵觸。

經驗 9:與利益相關者確定測試前的閾值和相關行動。

10.忘記檢查 A/B 測試系統是否可靠

為了保證你的 A/B 測試結果的可靠性,你的 A/B 測試系統必須經過校準并正常工作。確保這種可靠性的一種方法是持續進行 A/A 測試,并檢查這兩種人群之間沒有顯著差異:

Manomano 的連續 A/A 測試允許我們快速檢測 8 月份遇到的緩存錯誤,由于該錯誤,8 月 20 日到 8 月 22 日之間進行的所有測試無效。

經驗 10:持續進行 A/A 測試,以檢測可靠性。

結論

如你所見,在分析 A/B 測試結果時出錯的風險非常高,而在測試之后所做的決策對你的公司來說至關重要。因此,你應該對給到你的 A/B 測試結果持懷疑態度,特別是當這個結果來自于一個對取得積極結果有強烈興趣的人(例如,一個想賣給你東西的人)時尤其如此。在 ManoMano,我們有一個值得信賴的委員會,幫助分析所有內部和外部 A/B 測試的結果,并對結論有著公正的看法。

網站欄目:數據分析師必看,老司機帶你認識 AB 常見的10個錯誤
當前網址:http://www.js-pz168.com/news43/98493.html

成都網站建設公司_創新互聯,為您提供服務器托管品牌網站設計網頁設計公司建站公司域名注冊網站營銷

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

成都做網站
久久99久久人婷婷精品综合_超碰aⅴ人人做人人爽欧美_亚洲电影第三页_日韩欧美一中文字暮专区_波多野结衣的一区二区三区_婷婷在线播放_人人视频精品_国产精品日韩精品欧美精品_亚洲免费黄色_欧美性猛交xxxxxxxx
91精品国产91综合久久蜜臀| 337p亚洲精品色噜噜狠狠| 日韩精品在在线一区二区中文| 国产精品成人观看视频免费| 91成人在线看| 亚洲开发第一视频在线播放| 亚洲 国产 日韩 综合一区| 欧美日韩高清在线一区| 99精品欧美一区二区三区小说| 不卡一卡二卡三乱码免费网站| 成人动漫精品一区二区| 97se亚洲国产综合自在线观| 91丝袜脚交足在线播放| 成人18视频| 91成人在线观看喷潮| 欧美日韩亚洲另类| 国产精品全国免费观看高清| 亚洲欧美影音先锋| 韩国精品免费视频| 精品一区二区日本| 欧美精品丝袜久久久中文字幕| 欧美一级片在线看| 亚洲美腿欧美偷拍| 国产69精品久久777的优势| 播五月开心婷婷综合| 91黄在线观看| 色狠狠一区二区三区香蕉| 欧美在线三级电影| 国产精品久久久久影院色老大| 国产日产精品一区| 日本美女视频一区二区| 国产一区二区三区美女| 99在线精品免费| 正在播放一区| 欧美国产丝袜视频| 国产一区二区三区美女| 91在线丨porny丨国产| 国产日韩一区欧美| 在线综合亚洲欧美在线视频| 欧美精品一区二区三区蜜桃视频| 国产欧美日韩亚州综合 | 91精品免费观看| 樱花草国产18久久久久| 蜜臀久久99精品久久久久宅男 | 一色桃子久久精品亚洲| 亚洲一区在线视频观看| 日韩电影免费一区| 国产精品久久久久久久久久久久午夜片| 欧美日韩综合久久| 国产亚洲精品7777| 国产一区中文字幕| 亚洲国产一区二区在线 | 99久久精品免费看| 欧美影院一区二区三区| 久久久综合网站| 精品一区二区三区在线观看| 91国产在线免费观看| 日韩亚洲一区在线播放| 欧美另类变人与禽xxxxx| 久久久精品免费网站| 一区二区三区四区亚洲| 欧美bbbbb| 粉嫩高清一区二区三区精品视频| 日韩亚洲一区在线播放| 这里只有精品电影| 青青草伊人久久| 日本一区二区三区精品视频| 欧美裸体一区二区三区| 国产精品嫩草久久久久| 秋霞电影网一区二区| 99re8在线精品视频免费播放| 蜜桃av噜噜一区二区三区| 欧美日韩综合色| 天堂在线亚洲视频| 日韩av不卡播放| 亚洲欧美一区二区在线观看| 麻豆成人久久精品二区三区小说| 91麻豆福利精品推荐| 在线视频不卡一区二区| 2020日本不卡一区二区视频| 亚洲第一成年网| 久久大片网站| 国产精品国产三级国产有无不卡| 美女精品自拍一二三四| 国产精品高清一区二区三区| 日本韩国视频一区二区| 日韩欧美一级片| 国产精品综合视频| 欧美午夜精品免费| 美美哒免费高清在线观看视频一区二区 | 日韩福利视频| 亚洲欧美日韩一区| 精品国产一二| 中文字幕中文字幕一区| 国产精品羞羞答答xxdd| 欧洲一区二区在线观看| 日韩欧美黄色影院| 国产乱国产乱300精品| 日本午夜精品电影| 亚洲综合精品自拍| 日本高清不卡一区二区三| 欧美男女性生活在线直播观看| 国产精品电影一区二区| 国产精品888| 91精品国产综合久久福利 | 中文字幕亚洲视频| 国产九色91| 中文字幕一区二区三区四区| 国产成人精品免费视频网站| 少妇特黄a一区二区三区| 久久久久久久久免费| 狠狠色狠狠色合久久伊人| 麻豆av一区二区| 国产喂奶挤奶一区二区三区| 久久99九九99精品| 欧美特级限制片免费在线观看| 亚洲欧美日韩在线不卡| 99麻豆久久久国产精品免费| 欧美午夜宅男影院| 国产自产视频一区二区三区| 视频在线一区二区三区| 国产精品无遮挡| 国产精品区一区二区三在线播放 | 四虎影视永久免费在线观看一区二区三区| 亚洲欧美日本韩国| 天堂一区二区三区 | 日韩欧美视频一区二区| 国产精品污网站| 久久免费看av| 亚洲国产精品久久人人爱| 国产视频精品网| 亚洲精品成a人| 在线观看日本一区| 激情综合网最新| 日韩视频一区二区三区| 久久99久久久久| 日韩你懂的在线观看| 国内不卡的二区三区中文字幕| 亚洲精品影院| 另类人妖一区二区av| 亚洲一区精品视频| 久久精品999| 精品日韩一区二区三区免费视频| 国产一区二区精品在线观看| 色综合天天综合狠狠| 一区二区三区高清| 色综合久久综合中文综合网| 亚洲一区二区视频在线| 久久综合伊人77777麻豆| 国产精品美女久久久久高潮| 91麻豆.com| 亚洲色图欧洲色图婷婷| 官网99热精品| 国产精品久久毛片av大全日韩| 国产成人在线免费| 国产调教视频一区| 日韩精品资源| 成人国产亚洲欧美成人综合网| 欧美日韩国产成人在线免费| 人人狠狠综合久久亚洲| 亚洲欧美日产图| 欧美日韩专区在线| 91精品福利在线| 欧美亚洲爱爱另类综合| 一区二区三区色| 国产精品午夜在线| 1区2区3区欧美| 欧美一区二区三区四区高清| 精品一区二区三区视频| 欧美综合一区二区三区| 视频一区欧美日韩| 国产精品久久免费看| 看电视剧不卡顿的网站| 久久www免费人成精品| 国产精品久久网站| 一道本成人在线| 99精品视频一区二区三区| 久久日韩精品一区二区五区| 99久久久久免费精品国产 | 高清国产午夜精品久久久久久| 欧美一级一区二区| 久热这里只精品99re8久| 亚洲精品乱码久久久久久黑人| 欧美污视频久久久| 国产精品综合网| 樱花影视一区二区| 日韩视频免费直播| 日韩欧美国产二区| 波波电影院一区二区三区| 久久久久久久久久久久久女国产乱| 91蜜桃视频在线| 视频一区二区不卡| 国产香蕉久久精品综合网| 狠狠色综合色区| 韩国一区二区三区| 亚洲激情图片qvod| 欧美大片在线观看一区二区| 成人91视频| 激情欧美一区二区三区在线观看| 欧美一级黄色片|