程序員的一個爬蟲,把估值175億的馬蜂窩給捅了
10月21日,一篇名為《估值175億的馬蜂窩,竟是一座僵尸和水軍構成的鬼城?》火了!直指旅游網站馬蜂窩大量內容和評論涉嫌造假。
事情是這樣的:
某數據團隊的幾個同學回國參加創業大賽,吃外賣拉了肚子,就在平臺寫了一段差評,結果反而被污蔑詆毀。
碰巧這個團隊在美國學的都是數據分析,一怒之下決定訓練一個模型,用于篩選餐飲評論的水軍,恰巧馬蜂窩成了他們的練手對象,沒想到不爬則矣,一爬把馬蜂窩給捅了!
這篇文章中表示:“在馬蜂窩網站上,發現了7454個抄襲賬號,平均每個人從攜程、藝龍、美團、Agoda、Yelp上抄襲搬運了數千條點評,合計抄襲572萬條餐飲點評,1221萬條酒店點評,占到官網聲稱總點評數的85%。”
文章中還列舉了幾項抄襲石錘:

還有的抄襲賬號自相矛盾,性別忽男忽女,甚至有些直接調用Google翻譯接口

馬蜂窩回應
22日早上,馬蜂窩也隨即發布了聲明,表示會對涉嫌虛假的信息,進行查處。
另據***消息,針對自媒體報道的馬蜂窩數據造假一事,馬蜂窩已向北京市朝陽區人民法院提起訴訟,稱乎睿數據侵犯名譽權,目前已獲立案。
23日,馬蜂窩CEO陳罡也針對此事作出回應:馬蜂窩在餐飲等點評數據方面存在部分問題,但遠沒有外界所表述的那么夸大。目前已經重新梳理工作流程,堵住漏洞。
網友怎么說?
目前,這件事已經在各大論壇都議論紛紛:


這件事總算讓我見識到程序員的厲害之處了:

‘水軍’和‘爬蟲’一直都存在于互聯網行業,因為流量和數據對于一個互聯網企業不可或缺,關于數據糾紛問題在互聯網更是屢見不鮮,目前此事真相還未明了,我們暫時不予置評。
但通過這件事情告訴我們,惹誰也別惹程序員!尤其是有正義感又閑的技術宅。





























