再遭做空!跟谁学收盘跌逾7%,浑水质疑其超80%用户是机器人

腾讯证券5月19日讯,跟谁学股价早盘一度暴跌逾16%,截至收盘跌逾7%,报32.84美元。此前浑水再次发布做空报告称,跟谁学至少有80%的用户是机器人;我们怀疑跟谁学至少有80%的营收是虚假的,甚至可能是90%以上。
报告全文如下:
- 做空跟谁学是因为我们得出的结论认为,其是一场近乎彻底的骗局。
- 我们得出的结论是,跟谁学至少有70%的用户是假的,而且我们认为,很有可能至少80%的用户都是假的。
- 我们的结论是基于跟谁学自己的用户和出勤数据文件而得出的。我们从200多个付费K-12课程下载了跟谁学的数据,这些数据覆盖了54,065名独立用户。
- 此外,一位前跟谁学经理证实了我们的分析,并解释了跟谁学广泛的“机器人”运营的各种细节。
- 基于我们有关跟谁学用户全部几乎造假的结论,我们假设跟谁学营收中的造假部分至少等于造假用户的百分比。不过,如果跟谁学业务中真实部分的平均售价(ASP)也被欺诈性夸大,那么我们也不会感到惊讶。
- 我们的结论是,跟谁学是一家大规模亏损的企业。没有用户,就没有收入。我们还得出一个结论,即跟谁学大大低估了费用。不管怎么看,跟谁学都几乎是个空壳。
- 令人惊讶的是,跟谁学董事长陈向东已经找到了一种方法,让跟谁学的股票对长期持有者来说更加危险——他已经质押了价值至少3.18亿美元的股票。跟谁学股票的长期持有者面临的风险是,保证金贷款人将被迫大举抛售股票,从而导致其股价暴跌。
我们非常确信,在被分析的课程中,54,065名用户里至少有73.2%是“机器人”。通过我们称之为“精确加入者”、“跟谁学IP加入者”和“突发加入者”的模式,我们对这些机器人进行了识别。但我们认为,很可能至少有80.8%的用户是机器人。当我们将表现出异常行为的用户(我们称之为“早期加入者”)包括在内时,虚假用户就会达到这个比例。此外,我们使用自认为对跟谁学有利的假设得出了这些结论。如果使用一种对该公司不太有利的假设,那么虚假用户比例就会达到接近90%。
上个月,跟谁学董事长陈向东很奇怪地试图劝阻我们不要将目光投向该公司。他在4月8日接受中国媒体采访时说道:“我认为,如果浑水认真分析我们的数据,那么我认为浑水很有可能不会那么愚蠢。浑水人员的水平和智商都相当高。”
这很明显是虚张声势,而我们识破了这一点。
搜寻和识别机器人
在2020年上半年,我们分析了200多个付费K-12班级中54,065名跟谁学和高途课堂用户的463,217条签到记录,并确定了三种我们高度确信的机器人模式,这些机器人在我们研究的独立用户人数中所占比例为73.2%。如果加上第四个模式(我们认为这种模式很可能也指向机器人),那么机器人的比例就会上升80.8%。倘若改变某些假设,使其对跟谁学不那么有利,则将使得机器人总数达到90%左右。这些虚假用户显然是由跟谁学的教师和导师以及第三方控制的。
任何付费学生都可以看到这些记录,并可通过Google Chrome、一部iPhone手机和一个代理服务器合法访问。我们在附录1中提供了有关如何访问这些记录的详细说明。
我们认为,有四种用户加入的模式可以表明用户实际上是机器人。一位前跟谁学经理证实了我们的观察,并提供了有关跟谁学如何实施用户欺诈的更多细节。我们将识别机器人用户的这四种模式命名为:精确加入者(Precise Joiners)、突发加入者(Burst Joiners)、跟谁学IP加入者(跟谁学 IP Joiners)和早期加入者(Early Joiners)。
精确加入者
在我们的样本中,超过一半(52.8%)的独立用户因其是“精确加入者”或与之相关而被识别为机器人。精确加入者指的是,至少在两个不同的星期中的同一天同时(精确到秒)加入一门课程的用户,以及与其存在关联的用户。我们认为,单个用户在单个课程中出现这种精确登录两次或两次以上的概率极低。除了(人类)用户在登录时间上会有所变化之外,跟谁学自身网络内的互联网流量和数据流动的方式也存在时刻差异,这就使得用户几乎不可能一周或几周在精确到秒的相同时间登录。在我们看来,这类似于每周从A市到B市的航班在完全相同的一秒降落两次或更多次。
在我们分析的54,065名独立用户的数据中,我们发现有5,742名用户(10.6%)的登录记录有这种精确加入的现象。还要注意的是,在这些所谓的精确加入者中,100%的用户都至少显示出我们讨论的其他机器人行为之一,这就有力地验证了这种机器人识别方法。
虽然大多数精确加入者都只记录了一次“精确登录”(也就是有两次在同一秒进行登录),但我们的数据发现,1,261名独立精确加入者(21.6%)有过两次或以上的精确登录,有一名精确加入者记录了九次精确登录。
然后,我们发现这些精确加入者与另外33,145名共享相同IP地址的用户和在完全相同的时刻加入课程的用户之间存在联系。减去10,342个重复项后,总共有28,545个用户(52.8%)被我们高度确信是假的。
跟谁学IP加入者
在加上跟谁学IP加入者之后,高置信度机器人用户的总百分比达到63.9%,即34,534名用户。跟谁学IP加入者是指,声称与教师或学生使用相同IP地址或链接至此类用户的独立学生用户。由于跟谁学不再运营实体学校或学习中心,学生应该不可能共享教师或导师的IP。然而,15,239名声称的学生用户(28.2%)至少在一次场合共享过教师或导师的IP。上述前跟谁学经理证实,有些教师和导师为跟谁学运营机器人网络。
接近三分之二的跟谁学IP加入者同时也是精确加入者,这强化了我们的结论。另有1,364名独立用户链接到这些跟谁学IP加入者,从而使得以这种方式被识别出来的独立用户的总百分比达到16,603,即30.7%。
4额外的1,364个用户通过共享IP链接到15,239个声称的学生用户。
有10,614个跟谁学IP加入者(63.9%)同时也是精确加入者。剔除重复的独立用户,高置信度的机器人总数比例达到63.9%。
“突发加入者”
我们统计到了“突发加入者”新增的5016个机器人,使高可信度机器人总数达到39550个,占73.2%。所谓“突发加入者”是指在同一秒内加入的大量用户(4528/8.4%),例如在同一秒内加入的20或30个用户,以及通过共享IP链接到它们的其他用户(488/0.9%)。使这一现象更加明显的是,这些“大量用户爆发”往往发生在很少或没有人加入的课堂活动中。这一反常现象给我们的印象就像是“在一小时内看到10列地铁列车驶过,其中9列完全是空车,1列则完全满员”。现实生活并不是这样的。
这也强化了我们的结论,即62.8%的突发加入者至少表现出了一种其他的高可信度机器人行为。我们非常确信,当这种“大量用户爆发”发生在上课前五分钟以上或上课后时,就意味着突然有一群机器人登录到了课堂上。我们相信这个“5分钟”的截止时间是对公司(跟谁学)有利的,而不在这一窗口期内突然加入的机器人真实数量或许是相当可观的。
某一堂课的“突发加入者”模式可以通过一个图形来进行可视化展现。在该图形上,Y轴是时间,增量单位为1秒,而X轴是每个唯一的用户。当“突发加入者”模式发生时,此图形会显示长水平线。下图显示了跟谁学平台上一个小学高年级付费数学课程的加入模式,该课程在跟谁学平台上持续了几个月时间。
在“突发加入者”事件中,1104个独立用户在上课前9分40秒开始的4秒内加入。在第一次人数激增中,有六位是“精确加入者”(Precise Joiners)。
为了对公司(跟谁学)有利,我们不把上课前五分钟到上课后五分钟之间发生的突发加入者事件计算在内。因此,尽管它们非常可疑,但我们不将第二次人数激增中的登录算作机器人,除非它们表现出其他机器人行为(包括与“精确加入者”同时加入)。在从开课前5秒到开课后3秒的9秒钟时间里,648名用户——包括37名精确加入者加入了这一课堂。因此,我们没有将这些登录中的大约三分之二算作机器人,因为它们并不像精确加入者那样在同一秒内加入。
虽然第三次人数激增发生在开课后4分7秒(在5分钟的窗口内),但我们将这些新增人数算作为机器人,因为在这3秒的窗口内,在96个人中,有3个精确加入者在同一时间加入课堂。
整体高可信度机器人组合
我们观察到的各种机器人使用模式之间有很大的重叠。在独立的基础上,我们高度相信每个行为都可以表明为机器人。然而,当我们看到各种行为之间的重叠时,他们甚至可以被更牢固的确立为机器人的标志。
三分之一的高可信度机器人表现出了至少两种机器人行为的标记。这个数字中大约有一半的机器人表现出了所有三种标记
包括“早期加入者”在内,机器人总数达到80.8%。
把前三类加起来,有73.2%是高可信度机器人。我们认为,根据“早期加入者”的行为模式,另外7.7%(4143人)也很可能是机器人。
所谓的“早期加入者”是指那些难以置信地提早登录在线课程的用户,因此我们认为他们很可能是机器人。我们把截止时间定在开课前30分钟以上,我们认为这对公司(跟谁学)是有利的。虽然在现实世界中,提前30分钟看到一些学生出现在演讲厅并不少见,但这也不是我们期待真实学生在网络环境中会做的事情,这就类似于提前30分钟登录视频会议一样。然而,早期加入者对跟谁学来说并不罕见。
在我们的样本中,典型的早期加入者总数为7579人(14.0%),其中3676人(48.5%)至少表现出一种其他假设的机器人行为,这加强了它作为机器人的指标。剔除其他类别的重复项后,早期加入者人数为3903人(7.2%)。加上其他共享早期加入者IP地址的用户后,早期加入者的总数为4143人(7.7%)。
如果我们将截止时间缩短至上课前15分钟以上,早期加入者人数将增加1962人(3.6%)。
“群控软件”--一位来自前经理的佐证
一位前跟谁学经理证实了我们对虚假用户模式的观察。他展示了自己对跟谁学机器人运营的详细了解,他说这项操作始于2015年。
他说,跟谁学使用绰号为“群控软件”(Group Control)的软件来控制机器人网络。他说,群控软件显然可以通过“涓涓细流”或“人数突然激增”的方式来提高上座率。这种控制机器人登录模式的能力表明,跟谁学可能正在考虑如何伪装其机器人活动。
群控软件的后端显然具有指挥学生出勤流程的工具,例如安排机器人登录并确定登录模式。像典型的机器人农场一样,一台或多台服务器用于控制500到1,000台或更多的手机(IMEI)。每个设备都有一个单独的手机号码,微信号码,并可以进行编程以购买产品或参加课程等。
跟谁学还利用运行bot网络的外部公司。根据前任经理的说法,这些公司通常会根据所需任务,通过支付大概2%至5%的佣金来获得报酬。一些公司专注于参加这些课程并付费。 跟谁学显然提供了使交易合法化所需的现金,并且通过生成这些机器人运行记录了大部分营销费用和销售成本。这位前经理指出了三家分别向跟谁学提供机器人用户的公司,其中包括Weishi(由跟谁学拥有的应用程序)和百家友联(跟谁学占30%)。
以下是大约两分半钟的访谈片段,其中提供了一些特别有趣的细节:
前任经理:跟学谁自己都有怎么一个机房,一个机房里面概有上万多的这样的机器,
就是我们叫做群机器人,来自己去控制, 一个人大概能控制一千多手机也
没有问题,然后去远程也好,还是在机房也好,我可以控制所有的机器,然
后去模拟真实的学生或者是真实的购物的数据, 这个已经很成熟的技术。
Q:跟谁学 他们自己有一个小的团队来操作吗?是这个意思吗?
前任经理:对。一直都,一直都有存在个团队。
Q:一直是从哪一个阶段来开始?是什么 17 年,这样,从新的一个模式?
前任经理: 不是,我们在2015 年开始就有了。因为那时候我们做 O2O, 我们
给很多的机构引流, 那时候学生特别少,我们要老师感觉来上课人不少,特别刚开始的时候,我们已经有这样的技术, 比如说只报了五个学生然剩下的 500 个我们就有机器人去,让流量很大,上网去听课,让他们感觉这个平台流量很大,从15年开始就有。
Q:那这样学费是怎么做的呢?这个我有点不太了解,是给他们一个代码免费买课程吗?或者是这个小公司会怎么样付这个学费?
前任经理:比如说我是跟谁学,我会跟另外一家公司,比如[redacted],我会跟它签合同,
我要投一百万的广告,然后我会承诺给你,比如说,其中百分之二,你可以自己留下来,比如说你可以留下两万块钱。
Q:两万块钱的佣金?
对。人民币20,000元的佣金。另外的98万元人民币,他们必须使用这些虚拟单元号或微信帐号来购买我的课程,这样才能成为我的收入。就像这样。这样的话,跟谁学将至少损失2%,对吧?这只是一小部分。另一种方法是与老师合作……例如,像以前一样,我提供了1,000,000元人民币,然后与他们签订合同[以交换]广告,您必须拿走1,000,000元人民币并通过购买广告返还给我。他们为什么要这样做?因为这样可以帮助我完成此任务,并且当他们自己在平台或Weishi(应用程序)上上课时,我们将帮助他们免费推广,提供免费广告或为他们提供广告展示位置或在平台上运行广告。我们可以给他们提供这些钱,但是他们必须以购买的形式退还1,000,000元人民币。通常他们不会支付任何钱(如佣金)。他们投入了100万元人民币购买广告作为返还,然后我在市场上为他们提供广告,或者以其他方式为他们提供这些资金。它是另一种模型。这样,跟谁学不会亏本。只需要人民币1,000,000元就可以反复操作。我们使用广告展示位置以换取这种刷单(机器人或假冒学生用户)。
针对Gaotu100.com(下称“Gaotu”)和Genshuixue.com(下称“Genshuixue”)的分析,需要两种完全不同的做法。在附录1中,我们对两种方法进行了更加详细的描述。
Genshuixue的平台,拥有一个网站,以及一个供学生使用的桌面应用程序。一旦用户注册并登录,用户便打开谷歌Chrome Developer工具,打开Network选项卡,切换至XHR,并查看在浏览器和 Genshuixue之间传递的数据。这项数据中包含了大量的信息,其中包括所购每种课程的存档。我们用此数据对两个平台上的机器人活动进行了分析。需要指出的是,这项分析不需要特殊工具或 技术。
Gaotu在设计和功能上与Genshuixue非常相似,与后者共享域名和资源。在设置帐户和购买课程之后,用户可能会看到一些在浏览器之间传递的数据,就和在Genshuixue看到的一样。
不过,Gaotu的数据不会立即显示课程索引,需要多一个步骤。如果用户使用的是iPhone,需要在手机上安装Gaotu的应用程序,并将设备配置为通过拦截HTTP代理发送数据。这种方式让我们的 数据分析师能够观察到用户电话和跟谁学服务器之间的信息,查看来回传递的数据,并确定类存档的路径。查找类存档之后,我们下载并检查了我们所购的每类课程的文件。我们惊讶地发现, 不仅有课程材料,还有包含大量用户信息的文件,其中包括:
1. 用户数量
2. 名字
3.别名
4. 昵称
5.用户类型(0、1、2)
6.课程ID和班级ID(Gaotu只有班级ID)
7.上课次数和退出次数
8.IP地址
为了进行分析,我们的样本包含了2020年1月至3月之间所购买的200多个付费K-12课程,在Gaotu和Genshuixue的购买量几乎相同。我们获得的课程覆盖了K-12不同年级水平和主题。总的来说, 我们对54065个独立用户(学生、导师和教师)的463217个登录进行了分析。相比之下,Gaotu更忙,约占登录总数的三分之二。在班级数据中,我们发现了用户编号(在班级考勤记录中)和用 户类型。通过将课堂数据与Genshuixue教师和导师页面显示的数据进行交叉参照,我们发现Genshuixue的教师100%被标记为1类用户,同时
在我们的数据库中该网站的导师100%被标记为2类用户 。对于识别跟谁学链接接合器来说,类型识别非常重要。有关此方法的更深入解释,请参见附录2。我们的用户数据库,包含29个1类用户(教师),371个2类用户(导师),以及53694个独特 的0类用户。由于确定所有1类和2类用户都使用跟谁学,所以我们得出结论:所有0类用户都是学生(非教师、非导师)。
董事长陈向东持有3.19亿美元的承诺:
2020年3月3日,跟谁学董事长陈向东承诺通过旗下实体Ebetter International Group Ltd发行600万股B类普通股,相当于9000万股ADs,市值高达3.19亿美元。
考虑到跟谁学接近完全是一场骗局,上述承诺对该公司长期持有者构成了突然亏损的更大风险。我们不排除陈向东已经做出其他股票承诺的可能性。