近日,公眾號“小聲比比”發(fā)布了來自深圳乎睿數(shù)據(jù)有限公司的調(diào)查報告,稱旅游攻略網(wǎng)站馬蜂窩所宣稱的2100萬條“真實點評”里有1800萬條數(shù)據(jù)是通過軟件從點評和攜程等競品網(wǎng)站上抄襲而來,并貼出大量截圖作為證據(jù)。
文章發(fā)出后,在網(wǎng)絡(luò)引發(fā)關(guān)注。“點評造假”是否只是個別現(xiàn)象?通過調(diào)查,記者發(fā)現(xiàn),旅游網(wǎng)站之間點評雷同的現(xiàn)象并不少見,“點評搬運”或成旅游網(wǎng)站“潛規(guī)則”。
馬蜂窩捅了“馬蜂窩”
22日,北京螞蜂窩網(wǎng)絡(luò)科技有限公司回應(yīng)承認(rèn)部分點評造假,已對涉嫌虛假點評的賬號進(jìn)行清理,并表示針對文章中歪曲事實的言論,和已被查證的有組織攻擊行為,馬蜂窩將采取法律手段維護自身權(quán)益,并于22日晚間起訴爆料公司深圳乎睿數(shù)據(jù)有限公司名譽侵權(quán)。
乎睿數(shù)據(jù)在發(fā)布的報告中宣稱,其以“一字不落”才算抄襲的標(biāo)準(zhǔn),共發(fā)現(xiàn)了7454個抄襲賬號,這些賬號合計抄襲了攜程、藝龍、美團等競品網(wǎng)站572萬條餐飲點評,1221萬條酒店點評,占到馬蜂窩官網(wǎng)聲稱的總點評數(shù)的85%,并提出了多個點評賬號出現(xiàn)自我身份矛盾、時間錯位、翻譯錯誤等現(xiàn)象。
文章發(fā)出后,引起網(wǎng)友極大關(guān)注。有網(wǎng)友戲稱該事件是“馬蜂窩捅了‘馬蜂窩’”。
記者梳理發(fā)現(xiàn),這并非點評和旅游網(wǎng)站首次被爆出類似事件。今年7月,小紅書App就曾在微博發(fā)布消息稱,大量用戶向其反映大眾點評疑冒用小紅書用戶名稱賬號,批量建立虛假賬號,抄襲及搬運用戶在小紅書發(fā)布的原創(chuàng)筆記。
而據(jù)相關(guān)媒體報道,旅游網(wǎng)站攜程與“去哪兒”同樣發(fā)生過“點評數(shù)據(jù)之爭”。2018年,因“去哪兒”網(wǎng)站中有數(shù)萬個頁面轉(zhuǎn)載有攜程酒店點評文章,攜程將“去哪兒”告上法庭。最終經(jīng)法院審理確認(rèn),攜程擁有該網(wǎng)站內(nèi)容及資源的版權(quán),“去哪兒”行為屬于侵權(quán)。
記者調(diào)查:
多個旅游網(wǎng)站均存在“點評搬運”現(xiàn)象
按照乎睿數(shù)據(jù)的說法,馬蜂窩若抄襲了1800萬條點評,如此量級的數(shù)據(jù)遠(yuǎn)非人力所能完成,有業(yè)內(nèi)人士表示,該行為或是利用爬蟲軟件完成。
所謂爬蟲軟件,是指按照一定規(guī)則,自動抓取互聯(lián)網(wǎng)信息的程序或者腳本。該人士表示,利用爬蟲軟件,抓取其他網(wǎng)站數(shù)據(jù),再搬運到自身平臺,這在互聯(lián)網(wǎng)行業(yè)并非新鮮事。
事實果真如此?爬蟲軟件抓取數(shù)據(jù)難度有多大?記者隨機選取了北京一家酒店,利用爬蟲軟件,不到兩分鐘便抓取了其在攜程和同程旅游網(wǎng)站中的百余條點評內(nèi)容。通過比對兩份數(shù)據(jù),記者發(fā)現(xiàn),該酒店在兩個網(wǎng)站中存在13條完全雷同的點評,而且多數(shù)點評在兩個網(wǎng)站所顯示的日期完全相同。
其他平臺是否也存在此類現(xiàn)象?記者進(jìn)一步檢索該酒店在其他平臺的點評數(shù)據(jù),發(fā)現(xiàn)驢媽媽、馬蜂窩等旅游網(wǎng)站中,點評雷同的現(xiàn)象同樣存在。其中一條103字的點評內(nèi)容在同一天內(nèi)分別出現(xiàn)在了攜程、同程旅游和驢媽媽網(wǎng)站上——這意味著有消費者在一天內(nèi)通過三個平臺訂了同一家酒店,并發(fā)表完全相同的點評,顯然并不合理。記者發(fā)現(xiàn),該酒店在驢媽媽上一共有5條點評,均能在其他平臺的點評中找到完全相同的“孿生兄弟”。
“點評搬運”是網(wǎng)站行為還是個別酒店的行為?對此,記者又隨機抓取了上海兩家排名較靠前的酒店在不同平臺的點評數(shù)據(jù),發(fā)現(xiàn)或多或少均存在雷同的點評,這些點評中,既有相對簡單的好評,也有長篇控訴和差評,部分點評賬戶連名稱都是“搬運”而來。值得一提的是,記者在比對數(shù)據(jù)中將“一字不差”作為判定雷同的標(biāo)準(zhǔn),許多在搬運后由人工進(jìn)行“洗稿”的點評并未反映在內(nèi)。
一名旅游自媒體從業(yè)者告訴記者,作為“非剛需”的行業(yè),旅游網(wǎng)站的流量往往受季節(jié)影響。而對于普通人而言,如果不是想給差評,往往不會特地上網(wǎng)站進(jìn)行點評,這也造成許多中小旅游網(wǎng)站缺乏人氣的現(xiàn)狀,某種程度上也催生了“搬運點評”的需求。
根治“數(shù)據(jù)造假”
立法執(zhí)法須形成合力
對于此次“數(shù)據(jù)造假”的風(fēng)波,馬蜂窩與乎睿數(shù)據(jù)的爭執(zhí)依然未有定論,具體證據(jù)將有待雙方開庭時公布。
但在業(yè)內(nèi)人士看來,互聯(lián)網(wǎng)行業(yè)的“數(shù)據(jù)注水”似乎并不意外,特別是中小網(wǎng)站,主要靠的就是“流量+廣告”實現(xiàn)內(nèi)容變現(xiàn)。馬蜂窩曾在上一次融資時表示,每月有1億活躍用戶,其中85%來自其移動應(yīng)用程序。網(wǎng)站用戶每月發(fā)布超過13.5萬篇旅游文章,當(dāng)時預(yù)計2017年個人旅游產(chǎn)品的銷售額將超過90億元人民幣(合13億美元)。
法律專家蔡湘南表示,如果“數(shù)據(jù)造假”的行為被坐實,平臺方可能涉嫌侵權(quán)以及不正當(dāng)競爭。而從公司角度來看,如果平臺提供了虛假的數(shù)據(jù),導(dǎo)致投資公司因為其虛假數(shù)據(jù),做出錯誤判斷,對其進(jìn)行投資,可能在民事上涉嫌“欺詐”,有可能導(dǎo)致其投資合同“撤銷”,其自身運營發(fā)展也將受到很大影響。
盡管“數(shù)據(jù)造假”受到業(yè)內(nèi)外普遍詬病,但是如何根治數(shù)據(jù)造假,從體制機制上建立有效的防范糾錯和應(yīng)對處置機制,依然任重道遠(yuǎn)。
“數(shù)據(jù)造假行為的治理應(yīng)該是一個多主體、多元化、綜合規(guī)制的過程。” 中國互聯(lián)網(wǎng)協(xié)會研究中心秘書長吳沈括認(rèn)為,首先應(yīng)該明確各個主體的權(quán)責(zé),鼓勵各方積極承擔(dān)相關(guān)責(zé)任,比如立法部門應(yīng)盡快填補法律在這一方面規(guī)制的空白。其次,執(zhí)法部門也應(yīng)當(dāng)革新監(jiān)管方式,加大處罰力度,可采取設(shè)立“黑名單”、違規(guī)主體曝光等形式,為行業(yè)的發(fā)展劃定一條原則紅線。
來源:新華社 記者:吳劍鋒 唐弢 實習(xí) 黃心怡
監(jiān)制:周年鈞
澄而難清的馬蜂窩:明碼標(biāo)價虛構(gòu)游記 上市前途未卜
馬蜂窩被捅了 為什么“受害者”集體陷入沉默?
女子馬蜂窩預(yù)訂酒店因漲價被取消 平臺:正處理
馬蜂窩等互聯(lián)網(wǎng)平臺靠“灌水”洗不清自己
大水沖了龍王廟?數(shù)據(jù)機構(gòu)指水軍炒熱馬蜂窩注水新聞
搜索更多: 馬蜂窩