对于马蜂窝来说,上个周末无疑焦头烂额。
10月20号,“小声比比”发表了一篇名为《独家|估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城》的文章,直接把枪口对向了马蜂窝:评论抄袭、内容、抽奖涉嫌造假!
同一用户12次中奖
7454个抄袭账号,贡献了85%的点评每条游记下面千篇一律的机器人口吻灌水
一条条数据摆出来,作者仿佛提着98k大枪,入了无人之境,哐哐哐地一顿干!操作一流,胆量超一流!
爽过了周末。从周一开始屠(si)杀(bi)场(zhan)……
10月22号,马蜂窝一纸告了深圳市乎睿数据有限公司、丁子荃;
紧随其后,“小声比比”三度公众号发声,再度数据打脸马蜂窝;
10月23号,有媒体报道,马蜂窝创始人兼CEO陈罡回应称,在餐饮等点评数据方面确实存在部分问题,但远没有外界表述的那么夸大。
10月23号,马蜂窝的百度搜索指数达到半年来最高。
数据造假这一指控对于马蜂窝来说,太重。
作为主打UGC的旅游平台,早在2014年的5月,陈罡曾在微博上公开炮轰去哪儿评论造假, 指责刷点评行为已经动摇到了行业诚信的根基。
如今,是成也UGC,败也UGC。
一顿外卖引出的造假案
马蜂窝倒了霉!
纵观这场造假案,可以说是来得突然又有节奏感。马蜂窝在微博上称之为:有组织攻击行为。
作为“被定义”的一方,小声比比说起捅马蜂窝的缘由,则有点曲折。
据说:乎睿数据的团队几个同学,回国没多久,参加创业大赛,没想到吃外卖拉了肚子,一怒之下去平台差评,反而被污蔑诋毁。碰巧这几位同学在美国藤校学的都是数据挖掘、语义分析。
因此决定训练一个模型,用于筛选餐饮点评中的水军,当时恰逢马蜂窝铺天盖地地打广告,就决定拿他们练练手,谁知道越爬越奇怪。“这点评怎么还带‘简明英汉词典’的”,这才发现马蜂窝的点评抄袭严重。
于是决定寻根究底,这一挖,就是四个月。
认真追究起来,马蜂窝是被“外卖”拖累的。算得上人在家中坐,祸从天上来,但是,也不算冤枉,只是没想到遇上了这么一群较真又坚持的人……
网络平台数据造假难道不是常态吗?
是的。
有人问过场主:网络平台数据造假难道不是常态吗?是的。
在《独家|估值175亿的旅游……》一文中,指出马蜂窝2100万条“真实点评”中,有1800万条都是通过机器人从竞品网站抄袭过来的。
这是如何做到的?数据挖掘。
程序员们对此并不陌生,爬取数据,从海量数据中分析信息,从而把信息转化为产品需求去推进,那么结果是产品的升级。
爬取数据,从海量数据中搬运数据,那么结果就是100体量的东西在互相抄袭来抄袭去之后变成虚假的10000体量的东西,仅仅是为受众增加了有效信息筛选的难度。
造假的成本更低了,那为什么不能用数据堆砌一个海市蜃楼,盛世太平?这就是常态,是行业里公开的秘密。刷单、刷粉、刷好评、甚至还有被调侃的“五毛钱水军”……
但正因为这个时候有1个人先反应过来并且群而告知:常态并不代表正确!谁给的脸让造假如此堂而皇之?
于是,文章一出,振聋发聩,群起而捅之(马蜂窝)。
并不是针对马蜂窝
谁不是在里面狂欢呢?
回到马蜂窝被捅事件,马蜂窝这个平台有错吗?有的,但不应该以偏概全地把它一棒子打死,用最大的恶意去揣测它。
场主早年的时候也用过几次马蜂窝,只能说,那几次的体验都还可以。
刷了下全网的态度,其实支持与抨击还是一半一半的,有人看到的是真实,以UGC起步的马蜂窝上确实有一批用户在真诚地分享,他们感受了平台“有温度”的一面,也有人看到的是欺骗,被大量机器水军刷出来的评论伤害。
而我们所针对的,不是这一个旅游平台,而是这些肆虐、泛滥的黑灰产,是马蜂窝方面对虚假评论的态度,而非简单的一纸诉讼的老套路!
就像楚门的世界,你看到的是真实,那么安然无恙,你发现了虚构,就一心想逃离、打破。
如同我们所在的大数据时代,怎么看清真实虚假,怎么坚守本心,明辨是非,一定是持久的考验。
希望数据构建的是一个更智能利民的社会,而不是一个个失去诚信和真话的评价市场——送给场主自己,也送给所有程序员!
谁还在这座“僵尸和水军构成的鬼城”里?
我们一直都在。