这一两期的课程是模型专场。我们知道金融风控模型,不单单指评分卡,而是针对产品营销、定价、授信、管理、催收、监测等业务流程开发的一系列策略、规则、评分卡的集合。
目前,利用有监督、无监督、半监督、深度学习等算法开发的评分卡是风控模型中卓有成效的技术。
模型应用于业务场景,即在特定场景下,利用数据,高效,准确地完成特定的预测或者判断的任务。
在模型训练过程中:每一种场景下,模型都可以通过数据进行训练而生成,建模过程就是模型训练的过程或者说找出这种模式或者规则的过程。从一种可能拟合关系或者模式(模型空间)通过历史数据或者样本进行训练,从而得到确定的拟合关系或者模式(模型)。
整体而言风控全流程模型包括贷前、贷中、贷后模型,每个模块的模型大致包括如下内容:
【贷前阶段】
⽤户响应模型:分析获客阶段的⽤户转化情况,如:引流、导流、注册成功等信息;
申请反欺诈模型:识别欺诈风险⾼的客户,捕捉各类欺诈⾏为,如⾝份造假;
申请评分卡模型:A卡,侧重贷前风控,授信阶段预测客户未来客户在放款后逾期与违约的概率;
【贷中管理阶段】
⾏为评分卡模型:B卡,关注客户的风险变化,进行交叉销售产品和提额;
【贷后催收阶段】
催收模型:C卡,对于逾期的客户,预测客户还款的可能性,针对不同还款意愿的客户采取不同催收手段。
在模型开发过程中,我们常常使用模型+策略的方式来组合应用到风控决策流程中。今天除了讲模型,我们也将讲如何用模型策略的方法来发现规则。尤其在风控策略迭代过程中,我们通常需要从高维变量中搜索组合得到一些规则集(Rule Set),通常用的方法有:CART决策树、关联规则发现等等。
以下我们采用单特征规则发现与决策树(多特征)规则发现这两种方法,来重点讲解风控规则发现的方法:
一.单特征规则发现
针对数值类型特征,可以根据变量的分位数作为切分点,根据切分点左右客群的badrate/lift/hit rate来构造规则,并结合业务含义筛选出满足要求的规则。对于排黑硬规则的制定,这是一种颇为有效的方法。
二.决策数规则发现
【决策树规则发现】下面我们介绍一种决策树规则发现的例子
第一步:根据样本设置参数跑决策树
第二步: 输出决策树规则明细
第三步:决策树规则–统计考察指标
第四步:决策树规则–输出统计结果
在相关规则上线后,如何判断这些指标是否合适?可以综合从以下这些关注指标中进行综合分析:
命中率(hit rate):规则命中的样本量相对于总体样本量的比例,反映规则命中率;
正样本浓度(bad rate):规则命中的样本里,正样本的比例,反映坏人浓度;
提升度(lift):规则命中的样本,bad_rate相对于总体正样本bad_rate的提升,反映规则的提升杠杆。
以上提到风控规则发现的要点,可继续关注:
…
~原创文章