Facebook數(shù)據(jù)造假,竟涉及多家中國公司
一個創(chuàng)立十五年的社交網(wǎng)站,全球用戶量超過20億。但是卻屢屢遭遇隱私問題爭議,最近還出現(xiàn)相關(guān)報告發(fā)布稱其20億用戶或超半數(shù)都為“虛假賬戶”……
多年來的“私人恩怨”
在Facebook不斷發(fā)展的過程中,似乎從來不缺人氣與爭議。
除了隱私之外,還存在“私人恩怨”。扎克伯格哈佛校友的艾倫·格林斯潘,曾宣稱擁有facebook商標(biāo)的所有權(quán),并且多年來堅持同facebook公司“斗爭”。
格林斯潘說自己在Facebook上線前三個月就提出了類似的創(chuàng)意,名字叫「the Face Book」,他甚至還主動聯(lián)系過扎克伯格希望合作。為此,他對外公布了一些早期的通訊記錄,甚至還專門寫了本書,描述自己創(chuàng)造HouseSYSTEM網(wǎng)站的過程,并宣稱它是facebook的始祖。
“有好幾次,在路上碰到、從我的門前經(jīng)過、在帕羅阿托的餐廳吃墨西哥餐,我示以微笑,或者向他招招手,他都可以走過來,道個歉的。但是,他從來都沒這樣做過。他一點都不感覺愧疚。”
但是硬氣如扎克伯格,格林斯潘始終沒有等來Facebook的“解釋”。于是格林斯潘堅持“斗爭”,在各個方面找扎克伯格茬,越來越“檸檬”了,并且2012年的時候就直接狀告Facebook盜用其商標(biāo)。
跨國官司的引火線
沒想到上訴也沒得到道歉,一氣之下格林斯潘憋了一個大招。
2019年1月底,格林斯潘公布了一個關(guān)于Facebook的報告,長達(dá)70多頁的報告直接指出Facebook的20億月活用戶中有超過一半都是虛假賬戶。
報告一出就引起軒然大波,沸沸揚揚的隱私安問題還沒有解決,就又出現(xiàn)了“虛假賬號”的負(fù)面新聞。Facebook官方也趕緊出來澄清,說:“有關(guān)虛假賬戶的報告是明顯錯誤的,并且是不負(fù)責(zé)任的。”之后就直接起訴了四家中國公司和三位個人。
就這樣,跨國官司的序幕打開。
被狀告的四家中國公司主要販賣Facebook、twitter等國外社交賬號。Facebook指控這些企業(yè)和個人創(chuàng)建及銷售虛假網(wǎng)絡(luò)賬號、點贊和關(guān)注者,用于傳播虛假消息或其他欺詐行為。從2017年開始,這些公司通過myfacebook.cc和9xiufacebook.com等六個與Facebook有相似域名的網(wǎng)站行銷和賣出了大量虛假賬號。
糾纏數(shù)年的噩夢——虛假賬戶
回過頭來看,虛假賬戶并非新傷,而是Facebook的一個糾纏了數(shù)年的噩夢:
2012年9月,F(xiàn)acebook開始嚴(yán)打僵尸粉,刪除虛假賬號;
2013年3月,F(xiàn)acebook可能有8300萬個“僵尸賬號”;
2015年3月,F(xiàn)acebook清理僵尸粉導(dǎo)致名人點贊量下降10%;
2018年8月,F(xiàn)acebook刪除試圖干預(yù)美國中期選舉的虛假賬號;
2018年11月,F(xiàn)acebook公布有害內(nèi)容清理報告:清理15億虛假賬號;
2019年2月,有報告稱:Facebook 20億月活用戶一半都是假賬號;
2019年2月,F(xiàn)acebook狀告4家中國公司和3位個人推銷虛假賬號、點贊和用戶好友;
……
除了官方公布虛假賬號情況之外,早在2014年在YouTube就出現(xiàn)過一個名為《Facebook Fraud》的視頻,里面主要介紹一位博主參與Facebook的推廣計劃之后,出現(xiàn)了粉絲量增加但推文關(guān)注、互動情況不變甚至減少的情況,懷疑Facebook用戶中存在著大量“機(jī)器用戶”。
Facebook Fraud
而這次格林斯潘的報告中,指出Facebook的系統(tǒng)性欺詐“不容小覷”。根據(jù)Statista的數(shù)據(jù),F(xiàn)acebook在2018年的廣告收入高達(dá)338億美元。 也就是說,如果說10億的“虛假賬號”數(shù)量是真實的,那么就意味著Facebook從廣告主那里獲得的收益是“不義之財”。
圖片來自新浪財經(jīng)
不僅如此,除了Facebook這次上訴的幾家中國企業(yè),全球售賣虛假賬號的灰產(chǎn)鏈條也早就野蠻生長、遍地開花了。
比如美國,類似Devumi、SocialBoss等營銷推廣網(wǎng)站,內(nèi)容點贊、漲粉、視頻播放刷量都應(yīng)有盡有,價格多從1到20美元不等,還有一些網(wǎng)站直接售賣相關(guān)賬號。
而國內(nèi)相關(guān)的灰產(chǎn)就更多了,根據(jù)帶不帶cookie、注冊年限、好友多少,賬號價格不等。
有意思的是,通過灰產(chǎn)的宣傳,發(fā)現(xiàn)其實國內(nèi)外購買這些虛假賬號的目的也有些許的差別。美國購買賬號的大部分主要用于漲粉、增加點贊量等,而中國購買賬號還涉及到不少跨境電商推廣等商業(yè)目的。
在上述博主的視頻中通過統(tǒng)計,發(fā)現(xiàn)他的“虛假粉絲”主要來源于發(fā)展中國家。Facebook在2017年的觀察報告中也指出,大部分虛假帳戶來自孟加拉國、印度、埃及和巴基斯坦等國。而這背后也反映出整個虛假賬號、虛假流量市場不同地域的犯罪成本差距。與發(fā)達(dá)國家比較,發(fā)展中國家的確存在相關(guān)法律不健全、監(jiān)管不到位、懲戒體系不完善、意識很欠缺等問題,甚至在斯里蘭卡、埃及、印尼等地區(qū)還存在“機(jī)器工廠”,點擊1000次只需要1美金。總體來說犯罪成本都遠(yuǎn)遠(yuǎn)低于發(fā)達(dá)國家,所以也就出現(xiàn)下圖的情況。
機(jī)器之爭,如何掌握主動權(quán)
而如今困擾各大社交平臺的“虛假賬號”、“虛假流量”其實在發(fā)展初期并沒有受到過多的關(guān)注與打擊,甚至還成為當(dāng)時用戶量、活躍度統(tǒng)計中重要的一部分。遺憾的是,水能載舟亦能覆舟。當(dāng)初各平臺所追求的“數(shù)字”如今卻成為難以擺脫的夢魘。
當(dāng)然,從2012年到今天,其實我們也看到了Facebook在面對“虛假賬號”、“虛假流量”之下在不斷作出努力。甚至還想過請F(tuán)BI調(diào)查…
但是就目前來看還是存在許多問題:
- 一是誤殺較多,影響用戶體驗;
- 二是對于異常賬戶檢測技術(shù)方面還有許多進(jìn)步空間。
第一個誤殺的情況,由于Facebook的封禁是從設(shè)備硬件、賬號登錄情況、運營內(nèi)容等多維度進(jìn)行的。Facebook主管分析的副總裁Alex Schultz之前在采訪中透露,平臺已經(jīng)在使用機(jī)器學(xué)習(xí)判定假賬號。通常來說,一個被批量制造出來的帳號會在幾分鐘內(nèi)被移除。
這樣一來,如果出現(xiàn)IP、賬號反復(fù)登錄等異常情況,很可能就會被封禁,誤殺率就這樣被提高了。
第二點是從2012年到現(xiàn)在,F(xiàn)acebook多次大面積封禁虛假賬號,但是這“野草燒不盡”般的勢頭背后反映出其在防御策略和技術(shù)方面還是有很多進(jìn)步空間。
而目前對于異常賬戶的檢測主要有以下幾種方式:
- 基于行為特征的檢測方案;
- 基于內(nèi)容的檢測方案;
- 基于圖的檢測方案;
- 無監(jiān)督學(xué)習(xí)。
目前很多平臺主要使用的還是基于內(nèi)容的檢測方案,輔之基于行為特征的檢測方案。但是隨著AI的不斷發(fā)展,“機(jī)器賬號”的偽裝能力越來越強(qiáng),這場機(jī)器之戰(zhàn)之下,我們必須采用更為精細(xì)、科學(xué)的處理方式。比如從注冊審核環(huán)節(jié)、使用軌跡等維度建立多維度、多環(huán)節(jié)、長周期的分析模型,盡力提高對于異常賬戶的檢測精度。
而目前隨著圖學(xué)習(xí)、社交網(wǎng)絡(luò)等研究的不斷發(fā)展,我們也可以采用基于圖的檢測方案。這種方式的關(guān)鍵是構(gòu)造一個圖,在圖中異常帳號與正常帳號具有不同的結(jié)構(gòu)或者連接方式,然后利用圖挖掘的相關(guān)算法找到圖中具體的異常結(jié)構(gòu)或者異常節(jié)點。從一個“異常賬號”找到相類似的更多機(jī)器賬號。
對于異常賬戶的檢測,一直是做安全、做風(fēng)控的研究重點。隨著機(jī)器學(xué)習(xí)的發(fā)展,這兩年復(fù)雜網(wǎng)絡(luò)、GCN逐漸崛起,新技術(shù)的創(chuàng)新將近在咫尺。



























