学员分享:反外挂风控浅谈

大家好,我是橘子侠,做淘宝之前是在一家游戏公司做数据分析师,主要的工作内容就是研究研究工作室外挂,从数据角度去对异常行为进行判别,形成一套套规则模型,作为日常打击外挂的标准,进而对作弊账号进行封号(哈哈哈哈,就是专业一点的封号的!!)


本片文章仅仅只是站在我个人工作经验的角度上,谈一谈淘宝上的一些稽查,可用到的一些数据维度,以及其对应的用户行为。大家当个参考就行,因为具体的规则,阀值设计这些在风控,稽查系统中都是机密,外人不可能算出来。

具体能指导我们淘宝日常操作的,还是得依靠经验,依靠大文这种有比较多的问题处理经验的大佬,在这个风控黑箱子面前,实践是检验真理的唯一标准,多测试,才知道什么是安全的!

好了,废话不多说,正文开始!


一,一个简单的稽查系统,前期时候如何搭建的

首先这个稽查系统是如何出来的?

最初当淘宝刚刚诞生的时候,肯定比是没有那么多规则的,随着平台扩大,积累的用户数据越来越多,有一部分商家就开始利用规则漏洞去获取自己的利益,平台一般是不愿意看到这种事情发生的,于是乎就找专门的人,通过研究后台数据,潜水到商家群,刷单群里面去研究这些商家是如何操作的,再基于此去研究商家在操作过程中的那些行为是和普通商家用户不一样的,以此为基准,设立阀值。

初期的时候,肯定会有很多漏网,很多误伤,但随着数据量的增大,这个误伤率和准确率就会大幅度提升,同时现在机器学习技术相对也比较成熟了,稽查的数据系统都是可以自我更新迭代的。也就是自己的反馈循环。

稽查系统的黑盒子,由此丢诞生了。后面的稽查,输入端就是商家的各类行为,输出端就是违规的概率。

但关键的指标阀值一般还是人工控制的,毕竟如果误伤,面对如此大的用户量,影响就会很严重。淘宝对于刷单或者其他,肯定都是控制在一定概率下的,不会一棍子打死。

上面说了稽查系统的诞生以及原理,下面聊一下商家行为数据,毕竟这些才是我们可以控制的。


二,淘宝会收集哪些数据?

PS:这里我们暂时先假定,支付宝,淘宝,菜鸟的数据都是互通的。里面说的唯一这些,也是说正常情况,不考虑技术修改。

1.从参与对象的基本属性来讲:手机,电脑,网络

对于数据系统而言,以上的这些东西就是以下几个数据指标而已:
a.手机型号(主要是鉴别云手机这种)
b.手机硬件MAC地址(唯一)
c.电脑硬件MAC地址(唯一)
d.IP地址(识别地区位置信息,网络环境信息)

对于稽查打击而言,最简单的方式就是通过上面这些指标。比如说,你在同一个硬件地址(IP)上注册了多个淘宝,支付宝之类。就可能引起系统的注意。系统可能就会对你做进一步识别,如果有问题,可能就会抓你。

这也就是坤哥经常说的,在同一个局域网络下刷单,被抓概率很大。因为这个稽查起来很简单。另外我个人也有个猜想,比如你在你的亲戚都是在你们某个县镇之上,你们之间没有支付宝好友关系,也没有共用一个网络wifi,都是用的手机流量,这个时候你让他们帮你刷单,还是有可能被稽查到的。

原因在于指标IP地址,通过用户的IP地址,是可以直接还原到IP所在的县的。如果短时间内有大量这样的订单,那么可能被稽查。

2.从操作参与的过程来说(主要是刷单):时间,浏览行为,消费用户属性

a.时间:这里指的时间主要是指间隔时间,以及具体时间点。比如,大量的用户同时下单之类。
b.浏览行为:早期刷单的时候,很多商家会要求刷手货比三家,收藏点赞之类的,通过用这种模所谓正常用户的行为,去逃避稽查,早期可以,但随着稽查系统完善,这些行为早已经被系统收录了,没有太大用处。
c.消费者用户属性:这个也就是和大家常说的黑号,标签之类的有关。如果在你店里购买的用户淘宝给的属性和同行,同类目差异比例过大,那么系统就可能去识别的到这个异常(当然对咱们小类目没什么关系),而黑号大家就更容易理解了,有部分刷手,因为操作行为或者长时间购物量之类的过于异常,淘宝就可能将其识别为一个刷手黑号,如果这样的账号在你店铺的比例过大,那么你就有被查的风险。

3.从产品售出之后的参与对象来讲:物流,收货信息,确认收货,评价

a.物流:真实的物流过程,重量。 重量这个,不同产品,参考标准不好确定,会不会用它不清楚,但肯定是会上报。
b.收货信息:订单共用一个收货信息(地址,手机号等),以及提前确认收货这些。
c.确认收货,评价:这些都是正常的操作行为,主体还是看一个比例。

总的来说,上面这么多的 指标,肯定不是说某偶一个指标除了问题,就一定会被抓。这些指标每一个都有不同的权重,看你触犯的指标权重占比大小,最终综合计算,才得出结论的。比如说,消费者用户的属性,它的占比就可能非常大,如果很多的风险账号在你店里下单,那么你的店铺被认为风险的概率也就越大。而像评论这些,可能你也有超出正常值很多, 但因为这个指标的权重比较低,因此就不会动你。


三,基础指标计算得出的二级指标

所谓的二级指标,指的就是通过一次计算得出的指标。如转化率=支付买家数/访客数。这些指标往往都是从基础数据计算而得,异常判定和类目,产品直接相关。这个就比较复杂了,咱也不知道这个黑盒子算了些什么。

与此类似的还有加购率,评价率,停留,浏览路径等等。


四,总结

总之,上面说的很多指标,都是我们不可控制的,我们能控制的就是设备,网络,刷单资源(消费者用户属性),转化相关的。这些也都是内训社的大佬们实践得出来的,都是最宝贵的资源(毕竟这个稽查黑盒子可以说无人能破解),只有实践,才能知道什么情况是安全的,以此减少后续的失误。

另外,像刷单严查这种,可能就是风控人员把权重改一点,阀值降一下的事,被抓了也无可奈何。只有总结操作经验,找更靠谱的资源,控制后续节奏,接着再上,大家都一样,都是同一个标准(天猫,大客户这些肯定稽查标准也是分层的)对于普通大众都一样,重新再干就行!

以上,就是我作为一个过去反外挂的人员,对稽查系统的一些看法,希望对你有一点用,欢迎交流

大文内训社:橘子侠

留言列表

写留言

轻触这里 取消留言