瑞幸造假背后,一个“零售数据智商税”的故事

发布于: 雪球转发:0回复:0喜欢:2

瑞幸昨晚“自爆”数据造假,资本市场震荡,开盘暴跌80%,数度触发熔断,收跌75%。而在媒体普遍关注诚信问题、造假细节、责任人选的同时,笔者想从“数据”的角度聊聊,瑞幸造假的前世,造假过后,留给其他企业的“今生”教训。


互联网行业“祖传手艺”:数据造假

“长达11260小时的门店客流量监控视频显示,2019年第三季度和2019年第四季度,每家门店每天的商品销量分别至少夸大了69%和88%。”

——来自浑水做空瑞幸报告


尽管始终打着“新零售”的招牌,瑞幸源头上无疑还是一家互联网公司。对于互联网行业来说,“数据造假”本就是一门“祖传手艺”。Reddit前首席执行官Ellen Pao,曾在Twitter上发文抨击互联网数据造假现象:“一切都是假的(这却是个真的不能再真的事实)”。在互联网泡沫大行其道的时代,用户是买出来的、点击是刷出来的、融资是吹出来的……有太多文章披露国内外互联网企业数据造假,本文不再赘述(可参考文章《人有多大胆,流量多高产:互联网世界中的花式数据造假秀》,或是直接看知乎问答“你知道哪些互联网造假细节?”)


“数据”是判断一家互联网企业价值最重要的指标之一。在泡沫盛行的时代,“数据好看”远比“数据真实”重要。在投资方审视一家被投企业时,“数据好看”往往第一优先,而不是第一时间去验证真实。这样的环境,催生了创业者(数据造假)的动机。从产业链的角度来看,“数据造假”也是一个多边共赢的行为。对于创业公司来说,造数据更划算,忽悠了用户也能忽悠投资方,投入产出比低;对于部分投资方来说,被投企业数据好看,也方便后期投资接盘,击鼓传花;“水军”们则能从中牟利。

瑞幸的肥皂剧若是放在早几年经济环境好,泡沫不衰退的时候,或许能多演几集,但全球经济下行,投资趋于理性,“现金流”成为金科玉律,“数据造假”或成为未来上市者需谨慎的“智商税”。美国有很严格的反不正当竞争法制约造假——美国法律对提供不实财务报告和故意进行证券欺诈的犯罪的个人,要判处10至25年的监禁,个人和公司的罚金最高达500万美元和2500万美元。审计机构也可能会涉嫌犯罪并面临严格的举证责任。同时根据美国《1934年证券交易法》项下的一般性反欺诈条款,瑞幸公司、相关董监高、审计机构等中介机构,还可能面临巨额的集体诉讼。国内虽在法律制约上还不够完善,但经过瑞幸一役,基于对中概股及整体“可信度”的负面影响,相关制约条例的出台也将加速。

零售关键命脉:成也“客流”数据,败也“客流”数据

“长达11260小时的门店流量监控视频显示,2019年第三季度和2019年第四季度,每家门店每天的销量分别至少夸大了69%和88%。我们动员了92名全职员工和1418名兼职员工,在981个门店日进行监控和记录门店客流量,覆盖了100%的营业时间。门店的选择是基于城市和地点类型的分布,这与瑞幸完全直接经营的门店组合是一样的。”

“我们统计了每家店的客流量,并记录了从开门到关门的视频,平均每天11.5小时。当我们再次检查人流量和记录的视频时,如果视频监控丢失了超过10分钟的片段,我们就会丢弃一整天的数据。我们的成功率只有54%,因此所有成功的数据都是100%的完整。”

——来自浑水做空瑞幸报告

作为一家始终打着“新零售”牌子的企业,瑞幸对上述数据质疑的回应是:“客户在瑞幸咖啡的每笔订单都是通过线上下单的,并会被自动记录在公司系统中,订单付款程序通过第三方支付服务提供商完成。因此,公司的所有关键运营数据均被实时追踪,包括店均日销售商品数、单均商品数和有效销售价格,且可被验证。公司在数据管理方面拥有强大的内控系统,以确保自身系统及第三方合作伙伴系统中数据的完整性和一致性。

回顾整个瑞幸造假事件,最关键的证据,就来自于匿名机构对瑞幸的981个线下门店客流进行的监控和记录,通过统计学方法对瑞幸门店视频监控进行分析,将客流数据与订单数据比对后证明虚报销量。而瑞幸回复中,谈及店均日销售商品数、单均商品数和有效销售价格,却唯独没有与线下实际客流数据匹配,可“马脚”就露在了这里。

“客流”是实体零售的命脉,是运营数据的关键指标。作为一个拥有数千家线下门店的“新零售”企业,瑞幸似乎低估了“客流”“商品”数据的匹配性,线上数据和线下数据的打通性,对其生死的重要性(当然,也大概率是刻意而为之,只是掩藏不到位,毕竟线下数据造假成本远高于线上,线下也已经有大量成体系的数据分析系统,后文详解)。华尔街对中国企业的数据一向警觉,浑水对瑞幸的胜利,且不悲观地说一票中概股将会为瑞幸陪葬,退一万步,瑞幸造假会让华尔街为代表的资本市场,对于“Made in China”的互联网、零售企业数据更为谨小慎微。

瑞幸事件后,“数字智商税”该缴的还是要尽快缴纳

在整个调查报告中,有个细节虽被众多媒体“传颂”,但笔者却满头问好——这场调查从2019年11月13日(瑞幸公布第三季度财报)持续到了2020年1月31日(浑水做空报告发布),长达接近4个月的时间。匿名机构动用了92名全职员工和1418名兼职员工,在981个门店日进行监控和记录门店客流量,笔者很难理解,在2020年的今天,这家匿名机构选择了最传统的统计方式——人工计数。

要知道线下实体商业的客流统计方案已经经历了人工计数、红外客流统计、WIFI探针统计、视频智能分析四个发展阶段。人工计数最为传统,准确率偏低且无法长期进行。红外线客流统计技术则是上一个时代比较常用的做法,依据人体的经过阻断红外线之间的对射进行客流量统计,统计方便,传输量小,简单易实施,但缺点是不够精准——不能双向统计人流量,无法统计并排时顾客人数。此后,市面上出现了大量WIFI探针技术,能够根据手机统计出店内消费者的数量情况,还能够根据手机IP进行消费者在店内行动轨迹的追踪。但无法统计没带手机、关闭无线等情况。

在红外与WIFI之外,目前较被广泛采用的方案是智能视频分析,这类方案也经历了三代的延展,第一代主要基于对顾客头肩识别进行计数,由于头肩相似度高,容易重复计数,精准度不足;第二代则基于人脸识别+ReID(行人重识别)技术,通过打点连线来绘制顾客行为路径,但与真实行径还是有一定出入,比如顾客反复穿行,所记录的数据则无法显示;第三代则超越第一代和第二代,可通过三维重建等方式,精确并完整地分析顾客场内行为路线。

事实上,目前大量的线下零售企业都已应用、或正在探索这些“数据”方案(缴纳“数据智商税”),原本是为自身运营服务,要知道在此之前,线下是一片“盲区”,完全无法像线上一样,呈现不同维度的销售漏斗数据(来了多少人、看了什么商品、停留多长时间无从知晓)。但随着线上红利逐渐消失,流量价值回归线下实体后,实体的“数据”需求日益上涨,如何基于数据运营零售实体,也成了未来市场大势所趋。加之瑞幸数据造假事件,实体零售尤其是有着互联网基因,或是向往互联网、数字化运营的零售企业,缴纳“数据智商税”的迫切程度也将增加。不止如此,投资等相关机构、监管机构对于线下数据的重视程度也将提升一个Level。

这里不得不提及浑水报告中的一个细节,“瑞幸的每个门店都有8个内部监控摄像头,没有死角,投资者/审计师可以要求瑞幸提供监控视频,并随机抽样,以核对报告的订单号。”如果利用最新的人工智能技术来对这些监控视频进行分析,完全不需要4个月的调查时间,或许今天二级市场的损失就不会如此惨重,瑞幸及相关利益机构也不太能堂而皇之地套利,中概股往后的压力,或许也没有那么大。

在瑞幸事件发生后,评估一家企业的价值,或许会更依赖于严格的数字化系统。这不只基于投资方、资本市场对其的审视需要,更是企业自身发展的需要。而相信该事件后,国家也将会在法律相关体系上有所举措,努力维护一个诚信、公平、有序的创业环境,确保其他创业企业无论在国内还是国外的上市之路,不再因“瑞幸”们而前路坎坷。