• 风控中策略规则发现的两种模型方法


    这一两期的课程是模型专场。我们知道金融风控模型,不单单指评分卡,而是针对产品营销、定价、授信、管理、催收、监测等业务流程开发的一系列策略、规则、评分卡的集合。
    目前,利用有监督、无监督、半监督、深度学习等算法开发的评分卡是风控模型中卓有成效的技术。
    模型应用于业务场景,即在特定场景下,利用数据,高效,准确地完成特定的预测或者判断的任务。
    在模型训练过程中:每一种场景下,模型都可以通过数据进行训练而生成,建模过程就是模型训练的过程或者说找出这种模式或者规则的过程。从一种可能拟合关系或者模式(模型空间)通过历史数据或者样本进行训练,从而得到确定的拟合关系或者模式(模型)。
    整体而言风控全流程模型包括贷前、贷中、贷后模型,每个模块的模型大致包括如下内容:

    【贷前阶段】
    ⽤户响应模型:分析获客阶段的⽤户转化情况,如:引流、导流、注册成功等信息;
    申请反欺诈模型:识别欺诈风险⾼的客户,捕捉各类欺诈⾏为,如⾝份造假;
    申请评分卡模型:A卡,侧重贷前风控,授信阶段预测客户未来客户在放款后逾期与违约的概率;

    【贷中管理阶段】
    ⾏为评分卡模型:B卡,关注客户的风险变化,进行交叉销售产品和提额;

    【贷后催收阶段】
    催收模型:C卡,对于逾期的客户,预测客户还款的可能性,针对不同还款意愿的客户采取不同催收手段。

    在模型开发过程中,我们常常使用模型+策略的方式来组合应用到风控决策流程中。今天除了讲模型,我们也将讲如何用模型策略的方法来发现规则。尤其在风控策略迭代过程中,我们通常需要从高维变量中搜索组合得到一些规则集(Rule Set),通常用的方法有:CART决策树、关联规则发现等等。
    以下我们采用单特征规则发现与决策树(多特征)规则发现这两种方法,来重点讲解风控规则发现的方法:

    一.单特征规则发现
    针对数值类型特征,可以根据变量的分位数作为切分点,根据切分点左右客群的badrate/lift/hit rate来构造规则,并结合业务含义筛选出满足要求的规则。对于排黑硬规则的制定,这是一种颇为有效的方法。
    在这里插入图片描述

    在这里插入图片描述

    二.决策数规则发现
    【决策树规则发现】下面我们介绍一种决策树规则发现的例子
    第一步:根据样本设置参数跑决策树
    在这里插入图片描述

    第二步: 输出决策树规则明细
    在这里插入图片描述

    第三步:决策树规则–统计考察指标
    在这里插入图片描述

    第四步:决策树规则–输出统计结果
    在这里插入图片描述

    在相关规则上线后,如何判断这些指标是否合适?可以综合从以下这些关注指标中进行综合分析:

    命中率(hit rate):规则命中的样本量相对于总体样本量的比例,反映规则命中率;
    正样本浓度(bad rate):规则命中的样本里,正样本的比例,反映坏人浓度;
    提升度(lift):规则命中的样本,bad_rate相对于总体正样本bad_rate的提升,反映规则的提升杠杆。

    以上提到风控规则发现的要点,可继续关注:
    在这里插入图片描述

    ~原创文章

  • 相关阅读:
    y87.第五章 分布式链路追踪系统 -- 分布式链路追踪系统起源(一)
    进程间通信的方式及其特点
    抓取内网windows密码和利用hash横向及相关问题
    Python网络通信 TCP/IP/HTTP的区别
    初学python记录:力扣216. 组合总和 III
    面了一个测试工程师要求月薪26K,总感觉他背了很多面试题...
    Nodejs和Node-red的关系
    奇迹mu开服教程:开服服务端的架设及服务器推荐需要那些东西
    【Linux】非正常关机启动报错-解决方案
    [python]python监听、操作键盘鼠标库pynput详细教程
  • 原文地址:https://blog.csdn.net/weixin_45545159/article/details/127416678