互联网公司抓内鬼指南

图片
图片来源@unsplash
文|半佛仙人
1
老读者都知道我是做风险控制的。
对外,需要去对抗羊毛党,欺诈分子,以及技术攻击。
​对内,需要去发掘业务设计漏洞,挑战业务方的设计,抓内部腐败。
这其实是一个非常吃力不讨好的工作,里外不是人。
对外,老板会觉得不出问题的时候,养你就像养猪;
出问题的时候,养你还不如养猪。
这就像是做的最好的风控,是没有存在感的。
对内,那更惨。
业务方往往认为你是来找茬的,不配合你,然后还要甩锅,KPI只要不达标就是风控卡的太严,不给羊毛党留机会。
技术方往往认为你的需求优先级不高,但是占用研发资源很多。
而且给风控做东西不容易出PPT成果,于是需求Delay。
就连老板,也往往很讨厌较真的风控,因为很多靠从投资人那里骗钱过日子的公司,数据体系是一塌糊涂的,业务指标基本靠编,幸亏投资人也不怎么懂业务,只懂看三张表,不会看表内容设计与业务吻合度。
本来就是一个基于我看你顺眼的商业互骗行为,一个较真的风控,往往会让大家都尴尬。
所以长期以来,我一直认为风控拿的不是工资,而是精神损失费。
如果说做风控什么最好玩儿。
我的答案是,抓内鬼,最好玩。
2
什么是内鬼?说白了就是拿公司的钱来给自己捞好处的人。
为什么抓内鬼好玩儿?
因为抓内鬼是为数不多的可以扬眉吐气的日子,平时都是给研发和业务当狗。
对上,老板肯定是不允许除他和他亲戚以外的人来坑走公司的钱而且没有分给他,所以抓内鬼这件事情和老板的利益一致,并且挽回的损失都是老板的钱。
当然老板就是要搞数据骗投资人的除外,不过搞数据的时候,也得注意别让买数据的坑了。
对下,抓内鬼为数不多可以站在道德制高点和法律制高点来干的工作,毕竟盗窃公司财产于情于理都是无解的问题。
所以今天,我打算简单讲一讲,一个风控抓内鬼的简单思路。
这些思路其实是适合很多行业的,希望各位老板看了之后可以好好的研究一下自己的钱到底哪去了。
希望各位内鬼看了之后好好提升一下自己的操作水平,不要总犯常识性错误。
很多内鬼的操作真的是在侮辱人智商,比起和羊毛党相爱相杀,抓内鬼有时候都没有成就感。
希望各位投资人在投资尽调的时候,也多注意一些有技术含量的点,很多业务数据细节可能没法让你找到好公司,但是能找到雷。
内鬼,也是一门技术活。
3
先来谈一个最常见的领域,活动运营,也就是发券or补贴。
一家公司发出大量的优惠券,往往是期望于通过给用户让利的方式,来让用户在贪便宜驱动的心态下来进行交易,最终驱动GMV。
但是问题来了,发的券太少,其实用户是不积极的,这年头很少有人会为了一点点钱下大力气。
而发券太多,则用户过于积极,甚至积极到占了便宜就走,除非是再有相同级别的便宜,不然根本不出手。
发券可以说是业内的内鬼出现最严重的领域,因为这个领域出现的损失,可以很轻易的归结到羊毛党身上,当然很多羊毛党和内鬼本来就是一伙的,投资人的钱,五五分账。
甚至我曾经出现过抓出来的内鬼一查,根本就是羊毛党头子来刺探情报应聘的。
这种专业精神令我动容,要是每个人都像羊毛党一样努力,这个世界一定会变得更加积极。
怎么去抓发券or补贴的内鬼行为,核心思路是,抓链路和关联度。
简而言之,关注这几个核心问题。
(1)发出去的补贴,到底被谁拿走了?
这里的谁,不是指一个人,而是指一组数据。
这组数据可以是一个收货地址。
可以是一个收款支付宝账号。
可以是一台手机设备。
可以是一个WIFI地址。
一个人,可以被拆出几十甚至数百种不同的数据维度,如果这些数据不具备唯一性,你就要意识到,这里面大有问题。
例如注册用户送话费,但是很多话费指向同一个手机号。
例如送实物,但是大量实物指向同一个区域的收货地址。
例如现金补贴,但是出现了大量相同收款账号。
例如天南地北的人出现了同一个ip号段,同一个网络地址,这属于猫池的基础特征。
你要清楚的知道,在拿补贴的人中,到底有多少是同一个人,发现无效补贴,是抓内鬼的第一步。
(2)这些拿补贴的人,到底有什么关系?
承接1,当你发现无效补贴,也就是大量相同数据的时候,一定要把相同数据指向的群体全都抓出来,然后做数据关联。
假如出现了一堆人用了同一个设备号,那么这个设备号的所有群体都要抓出来,然后,看与这批人的其他资料相同的人(例如支付账号,例如收货地址),也抓出来。
最终,形成了一个池子,这些数据会形成一张网络。
然后,在这个网络中,找到核心的数据交叉点。
然后,抓着这些点,开始研究链路。
(3)这些被拿走的补贴,是经过了哪些链路?
承接3,一个用户补贴活动,从活动ROI计算,到卡券配置,到卡券分发,到卡券兑换,到财务实现(用户提现,财务记账),这一系列流程中,一定是会分归到不同的业务线的,你需要的是,理清楚这套链路,然后找到出问题的环节。
是在注册阶段就来了大量的黑号注册?
是在下单环节有人下了大量的相同产品?
是在支付环节就有了大量相同的支付ID?
是在发券环节出现了大量相同信息人领券?
是在物流环节出现了大量的地址改派?(很多羊毛党聪明到只留模糊地址,然后电话改派)
这套链路回溯,是做风控策略的核心环节,一般策略都是在回溯中提炼的。
(4)补贴出自谁手?是否有人经常出现被薅?
抓内鬼开始了,从内部寻找关联,当然最好的结果是毫无关联,这说明不是内鬼,就是公司的水平不行。
一般抓业务内鬼的时候,典型的操作方法是把环节123的数据来撞内部人员信息。
例如大量的异常用户能够和内部某个同事之间产生关联,我就经常抓出来很多活动运营给一些群体定向派券,当然,这个要求每类券要有唯一的券ID。
例如异常地址中出现了同事的地址,常见于为自己的亲属牟利,我曾经抓出过活动运营给自己家人发大奖。
例如某些运营配置的活动和券,ROI和羊毛率总是和别人不一样,那就要重点监测了。
例如某些利益变现的时候,账户信息出现了内部信息。
至于如何合法获取这些数据,那就是凭本事了,我不教人使坏。
不过目前业内大多数公司的水平,只要学会用异常数据关联内部,差不多就能把内鬼抓出好几个了,然后通过面谈话术,可以抓住一条链子上的内鬼。
至于话术怎么诱导,那就不适合在文章里写了。
我还要维持纯洁善良的形象。
4
再谈一个比较容易被忽略的领域,数据采购。
数据采购一直是一个内鬼严重但是并未被真正重视的领域。
数据采购里面懂行或者不懂行,完全可以造成成本的天壤之别。
(1)拉新
数据采购里面最初级的就是拉新,买流量,很多互联网公司都会买流量。
这个就要开始检测流量质量了。
买回来的流量,到底是活得,还是死的。
如果是死的,那要么渠道不行,要么买量的人不行。
如果是活得,那么要监控这些人是怎么活的,是不是只进行了大量相同的操作,就不动弹了。
如果是这样,那要么渠道不行,要么买量的人不行。
如果是活得,还活得很好,那么要监测,这些人最终给公司带来了多少的ROI。
拉新属于比较常见的出问题的地方。
拉新数据抓内鬼其实比较简单,就是监控为什么有的人总是买来垃圾流量,为什么合作的流量渠道质量总是忽高忽低,为什么总是不小量监测就大量支出。
总会有一些人露马脚。
(2)核身数据
核身就是核实身份的意思,一般代指核验信息真伪。
核身类数据我随便举几个例子,身份信息核验,人脸识别,银行卡三要素四要素验证,驾驶证行驶证核验。
这些数据属于很多互联网公司业务中的必备流程,一般业务流跑到某个节点的时候,必然跳出某些信息核验。
这里面,就有操作的空间。
第一是价格,由于核身类数据本身市场上能提供的供应商比较多,所以这个行业默认的规则就是为甲方的采购负责人提供一点回扣,例如合同上查一次3毛钱,但是实际上其中有5分钱以其他的方式给到相关负责人。
抓这些人很简单,那就是派另一个不对付的人去市场询价,然后替换供应商,然后从老供应商嘴里套词,因为利益受损,只要话术骚,很容易出现他们互相指责,然后就能抓出很有趣的东西。
价格造假都是比较低端的操作。
第二是要盘查业务必要性。
很多数据虽然价格没问题,但是其实在业务上是在空跑的,也就是本身这个支出就不该有。
例如人脸核验数据,分为2种计价模式,1种是与高清网纹照做对比,1种是与缓存的人像做无源1比1.
第一种超贵,第二种超便宜。
简单解释下,第一种是拿用户的新照片A,和权威照片做对比,一般是用在用户第一次核身。
第二种是拿用户的新照片B,和第一次缓存下来的通过核验的用户照片A来做对比,一般用在重复核身。
对于大多数业务而言,一般的策略都是新用户用1,从第二次开始持续用2就可以了。
但是很多中小公司的采购负责人,欺负老板不懂,每次都用1,1的价格贵呀,自然利润空间也有。
数据是正常数据,价格是正常价格,但就是能吃。
第三是要盘查缓存使用情况。
要知道很多数据是没有实时性要求的,也就是不太会频繁变动。
随便举2个例子。
例如学历信息,其实理论上是至少每120天才变动一次的。
例如芝麻分,30天一变。
例如一些信用类产品,3天后者7天一更新。
假如业务中使用到了一些数据,这些数据本身是业务必须要用的,但是数据的时效性要求不高,那就必须要有缓存策略来省钱。
就是第一次的时候调用某个产品,然后系统内部记录下第一次的调用结果,然后设置缓存有效时间,如果在第二次来的时候,还在有效时间内,那么不去调用三方接口,而是直接内部提供第一次的结果做业务使用。
很多公司抱怨数据成本高,不如查查自己公司采购的很多数据,是不是缓存机制没有设计好。
至于是水平不够没有设计,还是价值观有问题没有设计。
这就要好好设计设计了。
第四是业务必须数据有效性评估
刨除掉价格和缓存问题,但就某一个数据对于业务是否有效,都需要认真来思考。
假如我是做电商的,我买了一堆防黑产的产品。
在买产品阶段,我肯定是会严格的测试这个产品是否能够有效区分黑产用户以及对于业务的影响(准确率/误杀率),肯定是ROI划算的才买。
但是,在买了之后,有没有考虑过这些数据的有效性呢?
实际上绝大多数公司,都是只在购买前认真测试过,购买后是很少会再核验这些数据有效性的。
很多数据公司会在测试阶段给到最好的高成本数据,等到正式提供服务了,就把自己的数据源切到缓存或者低成本数据。
而甲方如果没有定期进行数据有效性双盲测试的话,很容易花钱买一堆没用的东西。
甚至,每次新加了全新的数据源的时候,都要和已有数据源做有效性比对,数据不是越多越好,很多时候还会互相影响效果,甚至是具有互相替代性。
这里面的操作空间,其实同样非常大,存在很多合理性放水的空间。
而很多时候数据有效无效,是风控说了算的。
你看,一个合格的风控,是连自己的同行都不信的,这真是一个残酷的行业,我要改行。
5
本次的内容就到这里了,这只是该系列文章的第一篇。
简单科普了一点点抓内鬼的思路,后面还会有其他的文章给到其他方向的思路,抓内鬼真的是很有意思的一件事情。
与人斗,其乐无穷。
其实不管是抓羊毛党还是抓内鬼,核心原理还是从利益角度出发,只要存在利益的地方,就一定存在猫腻,这是人类本性的贪婪。
顺着利益链去抓,一定多多少少都有问题。
但是,很多问题其实老板都知道,只不过从老板的角度出发,从公司整体利益的角度出发,会做出不同的决策。
很多时候,很多关键岗位的人,其实暂时容忍他们的谋私行为,对公司整体可能会有更多的好处。
不是说有问题就一定要抓问题的,抓大放小,也是一种智慧。
所以做风控最重要的是什么?
是要学会洞悉一切,把信息都抓出来,然后装傻。
做人又何尝不是如此呢。