精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

詳解知乎反作弊垃圾文本識別的深度學習實踐

原創
人工智能 深度學習
截止今年 8 月,知乎注冊用戶量已突破 2 億。對于垃圾信息的治理,我們面臨著更大的挑戰和考驗。過去我們通過不斷升級「悟空」的策略引擎,通過在行為、環境、資源、文本等多維度組合應用,已經取得了非常不錯的效果。近期我們嘗試引入深度學習識別垃圾文本,「悟空」對 Spam 的治理能力又邁上了一個新的臺階。

背景

截止今年 8 月,知乎注冊用戶量已突破 2 億。對于垃圾信息的治理,我們面臨著更大的挑戰和考驗。過去我們通過不斷升級「悟空」的策略引擎,通過在行為、環境、資源、文本等多維度組合應用,已經取得了非常不錯的效果。近期我們嘗試引入深度學習識別垃圾文本,「悟空」對 Spam 的治理能力又邁上了一個新的臺階。

問題分析

我們對當前站內垃圾文本進行了梳理,發現目前主要包括四種形式:

  • 導流內容:這類內容大概能占到社區中垃圾文本的 70%-80%,比較典型的包括培訓機構,美容,保險,代購相關的。導流內容會涉及到 QQ,手機號,微信,URL甚至座機,在一些特殊時間節點還會出現各類的專項垃圾文本,比如說世界杯,雙十一,雙十二,都是黑產大賺一筆的好時機。
  • 品牌內容:這類內容會具有比較典型的 SEO 特色,一般內容中不會有明顯的導流標識,作弊形式以一問一答的方式出現,比如提問什么牌子怎么樣?哪里的培訓學校怎么樣?然后在對應的回答里面進行推薦。
  • 詐騙內容:這類內容一般以冒充名人,機構的方式出現,比如單車退款類,在內容中提供虛假的客服電話進行詐騙。
  • 騷擾內容:比如一些誘導類,調查類的批量內容,非常嚴重影響知友體驗。

知乎反作弊垃圾文本識別的深度學習實踐

這些垃圾文本的核心獲益點一方面是面向站內的傳播,另一方面,面向搜索引擎,達到 SEO 的目的。

算法介紹

從算法角度可以把這個問題看做一個文本分類問題,把站內的內容分為垃圾文本和正常文本兩個類別。常用文本分類算法有很多,我們不打算詳細介紹每一個分類算法,只是分享我們在處理實際問題中遇到的一些問題和權衡。

我們遇到的第一個問題是使用CNN 還是 RNN。一般來說,CNN 是分層架構,RNN 是連續結構。CNN 適合由一些關鍵詞來決定的任務;RNN適合順序建模任務 ,例如語言建模任務,要求在了解上下文的基礎上靈活建模。這一結論非常明顯,但是目前的 NLP 文獻中并沒有支持性的文章。

另外一般來說,CNN 訓練速度和預測速度都快于RNN。考慮到上述站內垃圾文本的主要形式,導流和品牌內容中都會出現關鍵詞,同時對于垃圾文本檢測的速度要求比較高,我們最終使用 CNN。一個典型的 CNN 文本分類模型如下圖所示。

知乎反作弊垃圾文本識別的深度學習實踐

接下來,我們遇到的一個問題是,使用字還是詞語作為輸入。詞語具有比字更高的抽象等級,更豐富的含義。但是導流內容中的 QQ、手機號、微信、URL、座機等,通常不會出現在已有詞庫中,品牌詞也具有類似的特點,一般是未登錄詞。而且,導流內容通常會出現變體詞,使用詞語作為輸入,不能很好地捕捉類似特征。所以,我們最終使用的是字作為輸入。

在決定使用字作為輸入之后,需要考慮使用在知乎站內語料上預訓練的字向量初始化模型的Embedding層,還是直接在分類模型中隨機生成初始字向量。這里考慮的是垃圾文本的數據分布和知乎站內文本的數據分布具有比較大的區別,垃圾文本相對于站內正常文本是一個比較特定的領域。因此我們使用隨機初始化字向量。

在決定使用字向量之后,我們觀察到“有意者加我咨詢:2839825539”、“找北京·合·合·天·下”等關鍵信息,按字來計算通常都很長。因此,CNN需要更大的感受域來提取相關文本特征,如果簡單增加卷積核大小,會增加參數數量。我們考慮使用空洞卷積(Dilated Convolution),來增加卷積的感受域,同時不增加網絡參數數量。一個典型的空洞卷積如下圖所示。

另外我們觀察到需要識別的垃圾文本并不都是短文本,還有一部分是長文本。由于文本長度的關系,如果簡單將卷積層的輸出取平均,輸出到全連接層,那么文本能決定是否是垃圾文本的關鍵特征很可能被其他特征所淹沒,導致模型精度難以提升。因此,我們加入了一個 Attention 層,通過它給予關鍵特征更大的權重。Attention 計算方法如下圖所示。

 

通過上述分析,我們最終采用的模型結構如下圖所示。

垃圾文本分類算法結構

模型效果

目前,垃圾文本模型會對知乎站內的所有內容進行評分,輸出 0-1 之間的分數,系統會對高分內容進行處理。

模型分數在知乎部分業務線上的表現:  

文本分數

>=0.9準確率

>=0.8準確率

>=0.7準確率

回答

100.0%

99.8%

95.6%

提問

100.0%

99.1%

97.7%

評論

100.0%

99.6%

98.0%

當前情況下,模型結合其他反作弊維度,可實現對垃圾評分 0.5 分以上的內容進行刪除,同時準確率達到 97% 以上。上線以來,每天刪除垃圾內容數千條。

模型實時處理

另外值得一提的是端午期間,知乎站內涌現了一波違法違規的 spam,垃圾文本模型覆蓋了 98% 以上內容,使得這波攻擊大概持續了 1000 條左右就停了。

端午 spam 攻擊

后續計劃

垃圾文本識別是一個長期攻防的過程,站內垃圾文本會隨著時間不斷演變,現有模型的效果也會隨之變化。為了應對站內垃圾文本的挑戰,我們將一直收集 badcase,進一步優化模型的效果。

最后

由于本人的水平有限,如有錯誤和疏漏,歡迎各位同學指正。

作者:孫俊,知乎內容質量團隊的算法工程師。主要負責導流信息識別,垃圾文本識別和文本情感分析模型的開發和維護。 

責任編輯:龐桂玉 來源: 51CTO
相關推薦

2025-02-11 09:12:55

2023-06-15 07:49:33

2016-10-13 16:20:11

2017-06-16 21:00:02

Python爬蟲

2014-12-25 16:02:55

TalkingData

2023-07-18 18:14:51

云原生軟件架構

2016-12-12 09:01:47

Amazon Go核心技術

2022-02-25 11:07:19

計算機圖像識別深度學習

2023-02-15 21:49:55

2022-07-07 10:19:05

數據畫像

2018-09-03 08:36:04

知乎容器大數據

2016-01-27 13:34:07

開源語音識別CNTK

2020-12-17 10:58:43

2019-11-25 11:03:19

互聯網數據技術

2020-12-10 15:28:29

知乎CTO平臺

2023-08-21 07:55:32

2018-12-13 11:32:55

知乎裁員調整

2021-06-23 15:10:18

Epic反作弊網絡安全

2017-07-26 09:39:58

點贊
收藏

51CTO技術棧公眾號

亚洲欧美日韩国产| 国产精彩视频一区二区| 人人爽人人av| 欧日韩在线视频| 欧美国产偷国产精品三区| 亚洲成av人片一区二区梦乃| 日韩在线视频一区| 欧美少妇性生活视频| 亚洲av永久无码国产精品久久| 欧美日中文字幕| 狠狠爱在线视频一区| 成人在线资源网址| 久久久精品视频免费观看| 亚洲ww精品| 亚洲素人一区二区| 国产精品色婷婷视频| 精品人妻无码一区二区三区换脸| 爱福利在线视频| 欧美有码视频| 69p69国产精品| 亚洲一区三区电影在线观看| 欧美男人天堂网| 欧美精品色图| 亚洲国产欧美精品| 日日碰狠狠添天天爽超碰97| 粉嫩小泬无遮挡久久久久久| 激情久久久久久| 欧美本精品男人aⅴ天堂| 日本一二三区视频在线| 国产精品日韩无码| 欧美黄污视频| 色天天综合狠狠色| 国内精品久久99人妻无码| 色多多在线观看| 久久综合九色综合欧美就去吻| 欧美一区视频在线| 国产一区二区黑人欧美xxxx| 奇米888一区二区三区| 久久久久久久久久久影院| 亚洲精品国模| 欧美四级电影在线观看| 亚洲mv在线看| 国产成人三级在线播放| 在线高清一区| 欧美美最猛性xxxxxx| 无码任你躁久久久久久老妇| 成人爱爱网址| 亚洲欧美国产高清| 精品久久精品久久| 中文在线最新版天堂| 99国内精品久久久久久久| 日韩一本二本av| 99视频在线免费播放| 日韩大胆视频| 国产曰批免费观看久久久| 欧美激情视频网址| 日韩精品无码一区二区三区久久久| eeuss鲁片一区二区三区| 日韩欧美一区二区三区久久| 日韩一区不卡| 亚洲第一黄色片| 九色综合狠狠综合久久| 国内精品久久久久| 亚洲一级理论片| 看亚洲a级一级毛片| 精品福利在线观看| 国产又大又长又粗又黄| 五月天婷婷在线观看| 麻豆精品精品国产自在97香蕉| 国内精品免费午夜毛片| 亚欧洲精品在线视频| 欧美码中文字幕在线| 夜夜嗨av色综合久久久综合网| 91网址在线观看精品| 97成人资源| 色婷婷综合久久久久中文一区二区| 中文字幕欧美人与畜| 日韩福利一区二区| 久久久噜噜噜久噜久久综合| 99国产高清| 伊人网中文字幕| 精品一区二区三区香蕉蜜桃 | 国产自产自拍视频在线观看| 国产欧美精品一区二区色综合| 国产美女精品在线观看| 日韩av免费网址| 亚洲一区日本| 国产精品直播网红| 三级视频在线观看| 免费久久精品视频| 26uuu亚洲国产精品| 无码人妻熟妇av又粗又大| 国内自拍视频一区二区三区| 中日韩午夜理伦电影免费| 少妇精品一区二区| 亚洲超碰在线观看| 欧美日韩五月天| 精品久久久久久久无码| 欧美videos粗暴| 欧美自拍偷拍午夜视频| 日韩免费一级视频| 99蜜月精品久久91| 欧美艳星brazzers| 91香蕉视频免费看| 免费一级欧美片在线观看网站| 亚洲第一精品夜夜躁人人爽| 丰满少妇中文字幕| 国产亚洲精aa在线看| 欧美美女bb生活片| av在线免费看片| 91麻豆精品一二三区在线| 在线观看视频一区二区| 免费观看黄网站| 精品久久久久久久久久久下田| 欧美激情精品久久久| 亚洲无码精品一区二区三区| 久久国产免费| 国产精品99久久99久久久二8| 6080午夜伦理| 久久久久久亚洲精品杨幂换脸| 91免费的视频在线播放| 国产免费的av| 国产v日产∨综合v精品视频| 国产乱码精品一区二区三区不卡| 国产系列电影在线播放网址| 国产欧美一区二区精品婷婷| 欧美精品自拍视频| 性国裸体高清亚洲| 色吊一区二区三区| 少妇网站在线观看| 久久久精品区| 一区二区在线免费视频| 久久精品性爱视频| 性欧美xxxx大乳国产app| 亚洲一区二区中文| 成人小说亚洲一区二区三区 | 欧美mv和日韩mv的网站| 东京热无码av男人的天堂| 亚洲女同同性videoxma| 国产精品乱码一区二区三区| av毛片在线播放| 亚洲国产欧美在线| 日批视频在线免费看| 精品3atv在线视频| 91官网在线免费观看| 男女一区二区三区| jiujiure精品视频播放| 欧美伊久线香蕉线新在线| 丰满人妻一区二区| 亚洲午夜视频在线| 日本成人在线免费视频| 中国av一区| 4438全国亚洲精品在线观看视频| 国产91免费看| 亚洲成人av中文| 国产美女视频免费观看下载软件| 欧美裸体在线版观看完整版| 国产精品久久二区| 人妻少妇精品无码专区久久| 亚洲精品乱码久久久久久| 激情综合网婷婷| 国产伦一区二区三区| 麻豆国产va免费精品高清在线| 久久高清免费视频| 国产99久久久精品| 91成人在线观看喷潮教学| 欧美黄色网视频| 久久久国产精彩视频美女艺术照福利| 色播视频在线播放| 久久精品国产99国产精品| 一本一道久久a久久综合精品| 欧美a视频在线| 欧美高清性猛交| 深夜福利在线观看直播| 椎名由奈av一区二区三区| 国产91在线视频观看| 欧美片网站免费| 高清欧美性猛交xxxx| 色猫av在线| 欧美久久一二区| 国产在线精品观看| 国产午夜精品在线观看| 妞干网在线视频观看| 宅男在线一区| 91久久中文字幕| 俺来俺也去www色在线观看| 国产偷亚洲偷欧美偷精品| 青青草成人免费| 99re成人精品视频| 高清无码一区二区在线观看吞精| 素人啪啪色综合| 日韩精品视频在线免费观看 | 91精品国产成人观看| 国产精品极品尤物在线观看| 欧美13一16娇小xxxx| 91久久国产综合久久| 99久久婷婷国产综合| 久久国产精品区| 97超碰在线人人| 波多野结衣在线观看一区二区| 欧美又大又粗又长| 日本中文字幕在线视频| 欧美视频一区二| 精品一区二区三区人妻| 懂色av一区二区三区免费观看| 成人性做爰片免费视频| 国产精品美女久久久久| 97久久精品视频| 香蕉久久国产av一区二区| 欧美日韩在线播放三区四区| 久久午夜鲁丝片午夜精品| 国产三级精品三级在线专区| av天堂一区二区| 伊人久久亚洲热| 一区二区三区视频在线播放| 色婷婷狠狠五月综合天色拍| 欧美有码在线观看| 麻豆网站在线免费观看| 亚洲欧美中文在线视频| www.亚洲激情| 精品久久久国产精品999| 国产老头老太做爰视频| 国产盗摄视频一区二区三区| 国产av熟女一区二区三区| 成人在线精品| 国产精品99免视看9| 国产无遮挡裸体视频在线观看| 久久亚洲精品国产亚洲老地址| 欧美日本网站| 欧美性色黄大片| 久久不卡免费视频| 久久精品水蜜桃av综合天堂| 在线观看成人动漫| 国产一区二区三区av电影 | 欧美电影免费看| 久久久久久亚洲精品不卡| 深夜福利在线看| 亚洲精品一区二区三区蜜桃下载| 黄色在线免费观看| 亚洲.国产.中文慕字在线| 2021亚洲天堂| 亚洲九九爱视频| 天堂网avav| 亚洲视频网在线直播| 国产三级精品三级观看| 成人午夜又粗又硬又大| 国产精品19p| 国产电影一区二区三区| 精品人妻一区二区免费| 成人免费视频国产在线观看| 国产精品果冻传媒| 成人一级片在线观看| 日本三级日本三级日本三级极| 成人国产亚洲欧美成人综合网| 国产一级不卡毛片| 久久国产直播| the porn av| 久久国产精品露脸对白| 污污视频在线免费| 国产一区二区不卡| 国产一线在线观看| 91网页版在线| 三级黄色片免费观看| 国产一区久久久| 国产av一区二区三区传媒| k8久久久一区二区三区| 日本美女视频一区| 一区二区三区国产盗摄| xxxxxx在线观看| 国产精品啊v在线| 9久久9毛片又大又硬又粗| 午夜在线a亚洲v天堂网2018| 欧在线一二三四区| 麻豆国产欧美一区二区三区| 北条麻妃亚洲一区| 成人av网址在线| 波多野结衣一二三四区| 91视频91自| 日本不卡一区视频| 亚洲黄色免费网站| www.伊人久久| 欧美色图一区二区三区| www.久久色| 8x8x8国产精品| 日本xxxxwww| 一个人看的www久久| 亚洲性图自拍| 久久久精品一区| av中文在线资源| 欧美日韩高清在线观看| 亚洲美女炮图| 91天堂在线视频| 日韩欧美四区| 亚洲欧美日韩不卡| 99香蕉国产精品偷在线观看| 国产一级做a爰片久久| 岛国一区二区在线观看| 国产欧美一区二区三区在线观看视频| 亚洲美女精品一区| 日日夜夜操视频| 欧美成人精品高清在线播放| 国产黄色在线| 久久久噜噜噜久噜久久| 久久免费资源| 你懂的视频在线一区二区| 欧美丝袜足交| 国产高清免费在线| 国产农村妇女精品一二区| 欧美爱爱视频免费看| 久久精品久久综合| 大又大又粗又硬又爽少妇毛片 | 精品欧美一区二区精品久久| 久久亚洲成人| 免费黄色特级片| 99久久免费视频.com| 成人免费黄色小视频| 欧美在线小视频| 国产又爽又黄网站亚洲视频123| 久久亚洲成人精品| 欧美一区二区三区婷婷| 蜜桃导航-精品导航| 精品69视频一区二区三区Q| 黄色片在线免费| 麻豆成人久久精品二区三区小说| 日韩免费高清一区二区| 一区二区日韩电影| 欧美三级午夜理伦| 日韩一区二区免费高清| 日本在线人成| 国产视频福利一区| 亚洲成人偷拍| 国产成人免费高清视频| 激情五月播播久久久精品| 深夜视频在线观看| 99re这里只有精品首页| 久久久久亚洲av无码专区| 欧美高清激情brazzers| aaa在线观看| 色综合久久久888| 国产精品亚洲综合在线观看| 亚洲欧洲精品一区二区| 欧美日本不卡| 欧美日韩一区二区在线免费观看| 成人av在线资源网站| 精品一区二区三区四| 欧美精品一区二区在线播放| 日本色护士高潮视频在线观看 | 中文字幕人成不卡一区| 中文在线免费看视频| 最近2019免费中文字幕视频三| 精品123区| 亚洲一区精品视频| 久久99精品久久久久久动态图 | 色喇叭免费久久综合| 精品人妻大屁股白浆无码| 国产精品综合一区二区| 播金莲一级淫片aaaaaaa| 欧美视频在线观看免费| 欧美精品少妇| 国产精品久久久一区| 97久久视频| 伊人五月天婷婷| 亚洲国产精品自拍| 午夜小视频免费| 国产精品第一视频| 欧美freesextv| 师生出轨h灌满了1v1| 午夜伊人狠狠久久| 六十路在线观看| 成人a在线视频| 欧美日韩看看2015永久免费| 国产黄色一级网站| 国产日韩欧美不卡在线| 一卡二卡在线观看| 亚洲视频在线免费看| 欧美视频免费看| 免费看日本黄色| 久久久久久久久久久电影| 91国产免费视频| 韩国精品久久久999| 久久99视频| 免费黄色福利视频| 亚洲国产精品精华液2区45| 天天操天天干视频| 国产一区二区三区四区福利| 久久久久毛片免费观看| 免费无码不卡视频在线观看| 国产精品免费视频一区| 中文字幕免费高清网站| 久久久精品免费视频| 老牛精品亚洲成av人片| av动漫在线播放| 久久婷婷国产综合精品青草| 国产精品久久久久久免费| 7777免费精品视频| 卡通动漫国产精品| 国产高潮免费视频| 五月天激情综合| 粗大黑人巨茎大战欧美成人| 成人国产精品久久久|