精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

一文助你解決數據傾斜問題

開發 前端
雖然本文討論了概率問題,但最終的性能指標才是對業務最重要的指標。如果離線測試表明某個模型能增加價值,那么就在生產中進行測試。

在處理文本分類任務時,基準測試流行的自然語言處理架構的性能是建立對可用選項的理解的重要步驟。在這里,本文將深入探討與分類相關的最常見的挑戰之一——數據傾斜。如果你曾經將機器學習(ML)應用于真實世界的分類數據集,那么你可能已經很熟悉這個問題了。

了解數據分類中的不平衡問題

在數據分類中,我們經常關注數據點在不同類別中的分布情況。平衡的數據集在所有類別中的數據點數大致相同,因此更易于處理。然而,現實世界中的數據集往往是不平衡的。

不平衡數據可能會導致問題,因為模型可能會學習用最常見的類來標注所有內容,而忽略實際輸入。如果主要類別非常普遍,以至于模型不會因為將少數類別錯誤分類而受到太多懲罰這種情況。此外,代表性不足的類別可能沒有足夠的數據供模型學習有意義的模式。

不平衡是否需要糾正?不平衡是數據的一個特征,一個很好的問題是,我們是否要對其采取任何措施。有一些技巧可以讓模型的訓練過程變得更容易。我們可以選擇對訓練過程或數據本身進行操作,讓模型知道哪些類對我們來說特別重要,但這應該以業務需求或領域知識為依據。接下來,我們將詳細討論這些技巧和操作。

為了說明解決數據不平衡的不同技術的效果,我們將使用包含747條垃圾短信和4827條正常短信的sms-spam數據集。雖然只有兩類,但為了更好地泛化,我們將把該任務視為多類分類問題。我們將使用roberta-base模型。

【sms-spam數據集】:https://huggingface.co/datasets/sms_spam

請記住,這些技術在其他數據中可能會產生不同的結果。在特定數據集上測試它們至關重要。

在不做任何調整的情況下訓練分類模型時,我們會得到以下分類報告:

圖片圖片

“Safe” 技巧偏置初始化

本文的第一項技術是從一開始就讓模型了解數據分布。我們可以通過相應地初始化最終分類層的偏置來傳播這一知識。Andrej Karpathy在他的《訓練神經網絡的秘訣》(A Recipe for Training Neural Networks)中分享了這一技巧,它有助于模型從知情的角度出發。在我們的多分類案例中,我們使用softmax作為最終激活函數,我們希望模型在初始化時的輸出能夠反映數據分布。為了實現這一目標,我們需要解決以下問題:

【A Recipe for Training Neural Networks】:http://karpathy.github.io/2019/04/25/recipe/#2-set-up-the-end-to-end-trainingevaluation-skeleton--get-dumb-baselines:~:text=Huber%20losses%2C%20etc.-,init%20well.,-Initialize%20the%20final

圖片圖片

作為提醒,

圖片圖片

然后,

圖片圖片

其中,b0和b1分別為負類和正類的偏置,neg和pos分別為負類和正類中元素的數量。

通過這種初始化,所有指標都得到了簡單的改善!

圖片圖片

在貝葉斯術語中,這意味著手動設置先驗,并允許模型在訓練過程中學習調整它們。

下采樣和上加權/上采樣和下加權

這些技術也能有效解決類不平衡問題。二者的概念相似,但執行方式不同。下采樣和上加權涉及減少主要類的規模以平衡分布,同時在訓練過程中為該類的示例分配更大的權重。上加權可確保輸出概率仍然代表觀察到的數據分布。相反,上采樣和下加權則需要增加代表性不足的類別的規模,并按比例降低其權重。

下采樣和上加權的結果:

圖片圖片

上采樣和下加權的結果:

圖片圖片

在這兩種情況下,“垃圾郵件”的召回率都有所下降,這可能是因為“正常郵件”的權重是“垃圾郵件”權重的兩倍。

Focal loss

【Focal loss】:https://arxiv.org/abs/1708.02002

Focal loss是一種“動態縮放交叉熵損失”,是為了解決不平衡數據的訓練問題而引入的。它只適用于二元情況,幸運的是,我們的問題只涉及兩個類別。請看下面的公式:

圖片圖片

在該公式中,p是真實類別的概率,ɑ是加權系數,??控制著根據置信度(概率)對損失的懲罰程度。

這種設計可以確保概率較低的示例獲得指數級更大的權重,從而推動模型學習更具挑戰性的示例。α參數允許不同類別的示例獲得不同的權重。

通過調整α和??的組合,可以找到最佳配置。要消除明確的類別偏好,可將α設為0.5;但是,使用這一平衡因子會有微小的改進。

以下是使用Focal loss方法獲得的最佳結果:

圖片圖片

所有指標都優于基線,但需要調整一些參數。請記住,不一定總是這么順利。

“Not-so-safe”的技巧

眾所周知,存在著方法可以故意改變輸出概率分布,從而給代表性不足的類別帶來優勢。通過使用這些技術,我們明確地向模型發出信號,表明某些類別至關重要,不應被忽視。這通常是由業務需求驅動的,比如檢測金融欺詐或攻擊性評論,這比意外地錯誤標記好的示例更重要。當目標是提高特定類別的召回率時,即使犧牲其他指標也要應用這些技術。

加權

加權法是為不同類別的樣本損失值分配不同的權重。這是一種有效且適應性強的方法,因為它可以讓你指出每個類別對模型的重要性。以下是單個訓練樣本的多類別加權交叉熵損失公式:

圖片圖片

其中,pytrue表示真實類別的概率,wytrue是該類別的權重。

確定權重的一個很好的默認方法是使用類別頻率倒數:

圖片圖片

其中,N是數據集的總條目數,c是類別計數,ni是第i個類別的元素計數

權重計算如下:{'ham': 0.576, 'spam': 3.784}

以下是使用這些權重得出的指標:

圖片圖片

指標超過基線方案。雖然這種情況可能會發生,但并非總是如此。

不過,如果避免特定類的漏檢至關重要,可以考慮增加類別的權重,這樣可能會提高類別的召回率。讓我們嘗試使用權重{"ham": 0.576, "spam": 10.0}來查看結果。

結果如下:

圖片圖片

正如預期的那樣,“垃圾郵件”的召回率提高了,但精確度卻下降了。與使用類別頻率倒數權重相比,F1分數有所下降。這證明了基本損失加權的潛力。即使對于平衡數據,加權也可能有利于召回關鍵類別。

上采樣和下采樣。

雖然與前面討論的方法類似,但它們不包括加權步驟。下采樣可能會導致數據丟失,而上采樣可能會導致過度擬合上采樣類別。雖然這兩種方法都有幫助,但加權通常是更有效、更透明的選擇。

概率比較

本文將用一個很明顯的垃圾郵件示例來評估各種模型版本的可信度:“Call to claim your prize!”,結果見下表。

圖片圖片

正如預期的那樣,與基線相比,加權模型顯示出過度自信,而“下采樣+上加權”模型則信心不足(由于上加權的“正常郵件”)。值得注意的是,偏置初始化會增加模型對“垃圾郵件”類別的可信度,而焦點丟失則會降低模型對“垃圾郵件”類別的可信度。

總結

總之,必要時可以解決數據不平衡問題。請記住,有些技術會有意改變數據分布,只有在必要時才可使用。不平衡是一種特征,而不是錯誤!

雖然本文討論了概率問題,但最終的性能指標才是對業務最重要的指標。如果離線測試表明某個模型能增加價值,那么就在生產中進行測試。

在實驗中,本文使用了Toloka ML平臺。它提供了一系列隨時可用的模型,可以為ML項目提供一個良好的開端。

總的來說,考慮到訓練ML模型的數據分布至關重要。訓練數據必須代表真實世界的分布,模型才能有效工作。如果數據本身不平衡,模型應考慮到這一點,以便在實際場景中表現良好。

責任編輯:武曉燕 來源: Python學研大本營
相關推薦

2024-04-26 14:18:43

機器學習人工智能

2022-08-18 09:00:00

自動駕駛合成控制邁阿密

2020-05-12 15:40:06

MySQ數據庫索引

2017-10-22 06:05:28

語音識別深度學習ASR

2021-08-04 07:21:31

Hive 數據排查

2022-10-20 08:01:23

2022-12-12 08:13:27

Redis數據傾斜

2022-08-27 10:37:48

電子取證信息安全

2022-04-11 10:56:43

線程安全

2023-10-24 11:44:21

2017-06-02 15:32:09

大數據數據可視化

2023-06-19 13:57:00

數據系統

2023-01-14 15:32:00

云原生大數據架構

2020-05-15 16:37:13

PowerBI數據分析

2020-10-08 14:32:57

大數據工具技術

2018-04-03 13:08:31

2022-05-04 17:43:28

元數據大數據

2025-09-19 09:52:19

2025-08-25 09:12:48

2018-07-18 11:23:02

點贊
收藏

51CTO技術棧公眾號

成人午夜在线播放| 四季av在线一区二区三区| 红桃av永久久久| 美国av一区二区三区| 中国黄色一级视频| 91青青国产在线观看精品| 精品99999| 亚洲天堂av线| 青草av在线| 久久综合久久综合久久| 国产美女搞久久| 久久久久97国产| 久久99国产成人小视频| 日韩一区二区精品葵司在线| 妞干网在线视频观看| 中文字幕中文字幕在线中一区高清 | www国产亚洲精品| 国内精品福利视频| 你懂的国产精品| 亚洲视频在线播放| 日本少妇一级片| av成人免费看| 欧美性xxxxxxx| 91网站在线观看免费| 国产青青草在线| 成人免费视频网站在线观看| 国产精品青草久久久久福利99| 久久久久黄色片| 色综合蜜月久久综合网| 亚洲欧美国产另类| 特级特黄刘亦菲aaa级| 天天综合91| 欧美亚日韩国产aⅴ精品中极品| 精品久久一二三| 手机电影在线观看| 亚洲欧洲精品一区二区精品久久久 | 久久久久久久爱| 大地资源高清在线视频观看| 亚洲自拍电影| 亚洲精品国产精品国产自| 日韩av福利在线观看| 国产一区高清| 欧美伊人精品成人久久综合97 | 久久国产福利国产秒拍| 国产成人av在线播放| 欧美日韩乱国产| 一区二区国产在线观看| 性欧美xxxx视频在线观看| 激情四射综合网| 欧美日本一区| 欧美国产第一页| 成年人av电影| 欧美久久久久| 九九综合九九综合| 欧美人妻一区二区| 亚洲欧美一区在线| 丝袜美腿精品国产二区| 蜜桃av免费在线观看| 日韩欧美在线中字| 中文字幕亚洲国产| 91精品国产闺蜜国产在线闺蜜| 天堂在线免费av| 国产成人免费精品| 色美美综合视频| 色婷婷综合久久久久中文字幕 | 日本精品视频一区二区三区| 亚洲美免无码中文字幕在线| 麻豆网站免费在线观看| 欧美日韩国产区| www.四虎成人| 国产人妖一区| 日韩手机在线导航| 中文字幕一区二区三区人妻在线视频 | 婷婷久久综合九色综合伊人色| 久草热视频在线观看| 国模套图日韩精品一区二区| 欧美亚洲日本国产| 色婷婷激情视频| 中文字幕在线播出| 蜜桃精品视频在线观看| 国产裸体写真av一区二区| 国产精品一级二级| 成人午夜免费视频| 欧美日韩精品免费观看视一区二区| 青青草免费在线| 国产精品亲子伦对白| 国产免费xxx| 麻豆蜜桃在线观看| 欧美日韩在线综合| 国产精品日日摸夜夜爽| 精品国产a一区二区三区v免费| 精品国内亚洲在观看18黄| 国产又色又爽又高潮免费| 午夜激情一区| 日韩美女视频在线观看| 6—12呦国产精品| 不卡区在线中文字幕| 国产精品观看在线亚洲人成网| www.五月婷婷.com| 国产精品一品二品| 欧美亚洲精品日韩| 午夜成年人在线免费视频| 欧美日韩美女在线观看| 日本免费色视频| 欧美大奶一区二区| 久久人人爽人人爽爽久久| 天天操天天干视频| 国产一区在线观看麻豆| 欧美二级三级| 欧美激情成人动漫| 欧美三片在线视频观看 | 国产精品久久久久久一区二区三区 | 色视频成人在线观看免| 日韩精品视频网址| 国产精品一区二区av交换| 久久91亚洲精品中文字幕| 免费黄色网址在线| 国产成人精品一区二区三区四区 | 蜜桃av久久久亚洲精品| av软件在线观看| 91久久奴性调教| xxxx黄色片| 欧美伊人影院| 国产女精品视频网站免费| 天堂网www中文在线| 一区二区三区色| 午夜剧场在线免费观看| 精品久久久亚洲| 18性欧美xxxⅹ性满足| 艳妇乳肉豪妇荡乳av| 久久久不卡网国产精品二区 | 蜜臂av日日欢夜夜爽一区| 精品综合久久| www.8ⅹ8ⅹ羞羞漫画在线看| 在线综合亚洲欧美在线视频| 日本精品久久久久中文| 久久午夜影视| 欧美xxxx黑人又粗又长密月| av影院在线免费观看| 欧美大片免费久久精品三p| 亚洲欧美另类日本| 日韩电影在线一区| 欧美日韩一区二区视频在线观看| av今日在线| 亚洲福利视频专区| 午夜国产福利在线观看| 少妇精品久久久| 日本高清久久天堂| 日本私人网站在线观看| 欧美日韩在线影院| 国产白嫩美女无套久久| 亚洲经典在线| 国产一区二区三区色淫影院| av丝袜在线| 精品国产一区二区亚洲人成毛片| 欧美黑人一级片| 国产福利精品导航| 国产xxxx振车| 久久视频在线观看| 97av在线视频| 经典三级在线| 欧美午夜视频网站| 天美传媒免费在线观看| 久草热8精品视频在线观看| 亚洲一区二区三区四区中文| 亚洲欧洲日韩精品在线| 久久久国产成人精品| 国产露脸91国语对白| 樱花影视一区二区| 日韩无码精品一区二区| 亚洲欧美日韩视频二区| 国产精品美女视频网站| wwwxxx在线观看| 欧美精品色一区二区三区| 三级av在线免费观看| 国产成人无遮挡在线视频| 青青草成人免费在线视频| 伊甸园亚洲一区| 成人午夜小视频| 不卡视频观看| 亚洲最新av在线| 国产精品一区二区av白丝下载 | 国产激情精品一区二区三区| 欧美精品18videos性欧美| 日韩欧美亚洲系列| 欧美日韩亚洲综合一区二区三区| 特级片在线观看| 久久网这里都是精品| 久久久精品高清| 亚洲美女一区| 一区二区三区的久久的视频| 亚洲福利合集| 国产精品av在线播放| av在线播放观看| 日韩精品在线观看一区| 国产乱淫片视频| 高跟丝袜一区二区三区| 视频国产一区二区| 91亚洲国产成人精品一区二区三| 美女少妇一区二区| 亚洲电影在线| 在线观看日韩片| 亚洲人和日本人hd| 97自拍视频| 欧美大片1688网站| 欧美精品999| 免费黄色电影在线观看| 精品一区二区电影| 精品国产区一区二| 欧美中文字幕一区二区三区 | 成人做爰66片免费看网站| 欧美一级大片| 性色av一区二区咪爱| 国产美女在线观看| 在线观看国产精品91| 图片区 小说区 区 亚洲五月| 精品视频123区在线观看| 啦啦啦免费高清视频在线观看| 亚洲人一二三区| 东京热无码av男人的天堂| 99久久er热在这里只有精品66| 激情图片中文字幕| 日本怡春院一区二区| 欧洲黄色一级视频| 在线播放日韩| 日本美女爱爱视频| 91日韩欧美| 亚洲成人第一| 国产亚洲欧美日韩在线观看一区二区| 国产精品免费一区二区三区四区| 高清不卡一区| 成人黄色av免费在线观看| 91精品影视| 日本欧美在线视频| 自拍偷拍亚洲视频| 97视频在线观看成人| 污的网站在线观看| 伦理中文字幕亚洲| 久久久久久国产精品免费无遮挡| 色小说视频一区| www.在线视频.com| 中文字幕亚洲图片| av福利在线播放| 中文字幕国产精品| 在线播放日本| 色偷偷av一区二区三区| 欧美激情二区| 久久久99免费视频| 中文字幕有码在线观看| 久久国产精品久久久久久久久久| 黄色小网站在线观看| 久久五月天综合| 黄网页免费在线观看| 久久影院在线观看| a黄色片在线观看| 久久99久久99精品免观看粉嫩| 91精品久久久久久粉嫩| 久久91精品国产91久久久| 丁香花视频在线观看| 午夜精品久久久久久久久久久久| 19禁羞羞电影院在线观看| 57pao成人国产永久免费| 欧美成人ⅴideosxxxxx| 国产精品成人av在线| 欧美视频免费看| 亚洲综合社区网| 国产精品传媒| 久久久久欧美| 成人午夜国产| 日韩视频一二三| 亚洲经典在线| 午夜精品在线免费观看| 狠狠色丁香婷婷综合久久片| 日本女人黄色片| av不卡一区二区三区| 成年人免费观看视频网站| 国产精品三级视频| 免费中文字幕在线| 疯狂蹂躏欧美一区二区精品| 波多野结衣二区三区| 91麻豆精品国产综合久久久久久| 性生活三级视频| 亚洲欧美日韩第一区| 免费**毛片在线| 性欧美视频videos6一9| 78精品国产综合久久香蕉| 91嫩草视频在线观看| 一本久久青青| 中文字幕一区二区三区四区五区六区 | 99久久国产综合精品麻豆| 亚洲精品国产精品国自产网站| 亚洲婷婷在线视频| 欧美激情黑白配| 91精品国产日韩91久久久久久| 天天摸天天碰天天爽天天弄| 中文字幕亚洲一区在线观看| 搞黄网站在线看| 国产美女高潮久久白浆| 牛牛影视久久网| 黄色录像特级片| 秋霞午夜鲁丝一区二区老狼| 熟女人妻一区二区三区免费看| 中文字幕第一区二区| 国产无遮无挡120秒| 欧美日韩视频不卡| 香蕉av在线播放| 久久亚洲精品国产亚洲老地址| 这里有精品可以观看| 97超碰人人看人人| 欧美熟乱15p| 欧美视频在线观看网站| 国内成人免费视频| 欧美丰满老妇熟乱xxxxyyy| 亚洲国产精品麻豆| 国产丝袜视频在线观看| 伊人久久免费视频| 在线天堂资源www在线污| 懂色一区二区三区av片| 五月综合激情| 91精品无人成人www| 91毛片在线观看| 国产在线一二区| 91精品国产综合久久久久久| 国产精品99999| 日本道色综合久久影院| 国产成人一二片| 9191国产视频| 久久av资源站| 超碰97av在线| 色噜噜狠狠色综合中国| 亚洲人妻一区二区| 97热在线精品视频在线观看| 中文在线综合| 国产a级黄色大片| 国产在线精品一区在线观看麻豆| 黑人と日本人の交わりビデオ| 色综合久久精品| 欧美91精品久久久久国产性生爱| 2019中文在线观看| 欧美大胆视频| 91九色在线观看视频| 99精品欧美一区二区三区综合在线| 国产在线拍揄自揄拍| 精品日韩成人av| 国产高清在线a视频大全| 国产福利一区二区三区在线观看| 欧美freesex交免费视频| 91人妻一区二区三区| 亚洲精品中文在线| 精品久久国产视频| 欧美成人在线影院| 视频精品二区| 777av视频| 91视频91自| 波多野结衣一区二区在线| 一区二区成人精品| 福利一区二区免费视频| 亚洲欧洲久久| 国产精品资源站在线| 午夜少妇久久久久久久久| 欧美大肚乱孕交hd孕妇| 爱情岛论坛亚洲品质自拍视频网站| 久久99精品久久久久久青青日本| 亚洲一区二区成人| 欧美熟妇激情一区二区三区| 欧美视频一区二区三区| 大片免费在线观看| 高清国产在线一区| 国产麻豆综合| 欧美aaa级片| 日韩无一区二区| 国产精品一区二区日韩| 日韩一区国产在线观看| 精品在线免费视频| 欧美人与禽zozzo禽性配| 亚洲精品电影网| 国产第一精品| 国产成人一区二区三区别| 91亚洲精品久久久蜜桃| 最近中文字幕免费在线观看| 免费成人高清视频| 欧美综合自拍| 一道本在线免费视频| 亚洲曰韩产成在线| 黄色av网址在线免费观看| 成人免费网视频| 亚洲一区中文| 国产黄色的视频| 日韩精品免费视频| 欧美少妇激情| 日本不卡在线观看视频| 亚洲欧洲精品成人久久奇米网| 免费av网站在线播放| 国产精品久久视频| 极品中文字幕一区| 精品一区二区6| 亚洲精品999| vam成人资源在线观看| 色综合av综合无码综合网站| 亚洲摸摸操操av|