• 风控系统之数据服务,名单、标签、IP、设备、地理信息、征信等


    个人博客无奈何杨(wnhyang)

    个人语雀wnhyang

    共享语雀:在线知识共享

    Githubwnhyang - Overview


    提要

    早些年,“马云提出,人类已经从IT时代走向DT时代,IT时代是以自我控制、自我管理为主,而DT(Data technology)时代,它是以服务大众、激发生产力为主的技术。这两者之间看起来似乎是一种技术的差异,但实际上是思想观念层面的差异。”

    在这样一个我们自己都不如大数据了解自己的时代,应该都深有体会吧。

    那么,在风控系统中数据有哪些,他们在风控系统中如何应用?

    参考:

    智能风控筑基手册:全面了解风控决策引擎

    以下两图都来源于此

    事件

    首先,风控系统的所有进件数据就是最重要的数据,事件包含最基础的数据。

    风控系统要做的就是通过这些基础数据来分析计算,最终得到决策结果。

    解析数据

    基础的事件数据,可以是已加工过的,如:IP归属国家/地区、GPS归属地、证件号归属地等等。也可以是基础的IP、经纬度、证件号等。但作为统一的系统处理还是基础数据好一些,一致性上有些保障。这样的话,就需要解析数据,如IP归属地数据库、GPS归属地数据库、手机号归属地数据库、身份证归属地数据库等等。

    这些可以是系统本身提供,也可以是外部提供。

    但是通常这些数据,都只能是一些数据服务商提供,自己来做确实比较难搞。

    关于这个解析数据会另一篇文章介绍这近一周的折腾。

    指标

    指标是风控系统中最重要的数据之一,灵活多变、实时计算。

    名单/标签类数据

    之前在规则的介绍中有提到,名单可用于规则判断也可以用于规则命中后的操作。

    标签作为事件完成后的附属品,与名单类还稍微有些不一样,因为标签只在事件生命周期结束后产生,而名单事前和事后都是有的。

    外部数据

    要讲起外部数据,那可太多了,接什么数据就有什么数据。

    人行、三方征信、工商、法院、税务、银联、运营山、社交平台、公安…

    作为三方数据最大的缺点就是不可控,不可控就是最可怕了,如果是离线数据给出,风控系统自己开发业务逻辑使用这些数据,倒还好(但这通常更不好搞,联系更紧密了,关联太深了)。换是通过api、rpc等接口调用方式的话又要考虑到安全、稳定、熔断等等。总之很难有两全其美的方法。

    其他

    设备数据不可以单独讲一下吗?

    设备其实可以归结到客户端风险检测,常见有:ROOT越狱、HTTP代理、VPN代理、模拟器检测等等。

    写在最后

    拙作艰辛,字句心血,望诸君垂青,多予支持,不胜感激。


    个人博客:无奈何杨(wnhyang)

    个人语雀:wnhyang

    共享语雀:在线知识共享

    Github:wnhyang - Overview

  • 相关阅读:
    【C++】缺省参数 函数重载 内联函数
    winform语言切换C#设计笔记(八)
    RISCV汇编指令
    试用阿里云GPU服务器进行深度学习模型训练
    数据结构与算法_排序算法_四个基础排序算法性能对比
    EMC RS485接口EMC电路设计方案
    248: vue+openlayers 以静态图片作为底图,并在上面绘制矢量多边形
    阿里云大学Apache Flink大数据学习笔记
    遭到全网嘲讽,宋丹丹这次被骂惨了...
    机器学习 第11章 特征选择与稀疏学习
  • 原文地址:https://blog.csdn.net/weixin_44783934/article/details/138201539