风控规则
风控规则
- 规则的类型
- 条件判断:决策路径独立
- 决策表:决策路径有交集、规律
- 决策树:决策路径不规律、可能重复检查同一数据
- 规则引擎:接受数据输入,解释业务规则,根据业务规则、使用 预定义语义做出业务决策
制定原则
- 监管、公司政策类
- 年龄准入
- 行业准入
- 有金融属性行业
- 政策敏感娱乐行业
- 地域准入
- 场景准入
- 风控层面
- 黑名单类
- 多头类:申请次数
- 共债类:申请量
- 反欺诈类
- 评分拒绝类
规则发现
规则评分
强弱规则
- 强规则:可作为独立规则,直接指导决策
- 弱规则:具有一定区分度,但不决定性
弱规则可组合使用,通过评分方式衡量弱规则
- 使用规则评分衡量规则影响力
- 规则影响力则可以通过命中坏占比、odds变动衡量
- 设置阈值,命中规则的评分之和超过阈值才触发报警
笛卡尔积法
- 步骤
- 获取变量:定义好坏,关联特征变量
- 变量筛选:通过IV值等指标快速筛选变量
- 指标统计:分组统计申请量、放款量、坏账量等指标
- 透视呈现:分申请率、放款率、坏账率等指标制作交互,如列联表等
- 规则提取:结合各维度选择满足要求的组别,提取规则逻辑
- 规则评估:评估跨期稳定性
- 策略上线
决策树法
- 决策树法优势
- 可根据划分依据自动对人群细分
- 决策树法缺陷
- 难以调整决策树划分结果
- 划分结果可能缺乏业务意义
- 可能出现过拟合现象
规则阈值设置
阈值设置指标
- Lift 值
- 收益/风险比
阈值设置依据
- 对分类取值,根据 Lift 值、收益/风险比 确定是否作为规则
- 对有序、数值取值,结合不同阈值点计算 Lift 值、收益/风险比,绘制曲线
- 曲线平缓变化,则阈值切分收益变化稳定,阈值调整空间比较大
- 曲线存在明显陡、缓变化,则阈值切分收益在拐点处收益较大,阈值调整空间有限
规则评价
- 案件调查
- 用信前报警调查
- 逾期后调查
- 根据不同目标,可以对不同的案件区分重点调查
线下 / 离线(标签已知)效果评估
- 自身效果评估
- 混淆矩阵
- TPR/FPR
- 准确率/误拒率
- 提升度
- 拒绝样本中坏样本Lift提升度
- 通过样本中好样本Lift提升度
- 通过率、拒绝率
- 加权收益:好数量 好收益 + 坏数量 坏收益
- 混淆矩阵
- 对比/增量效果评估:和其他数据源比较
- 有效差异率:查得命中 / 其他通过且为坏样本
- 无效差异率:查得命中 / 其他拒绝
- 类似名单类数据评估
线上 / 在线(标签未知)效果评估
规则报警次数、报警率
- 规则(触发)报警次数:命中规则后账户被拒绝次数
- 对强规则,即为规则命中次数
- 对弱规则,小于规则命中次数
- 规则报警率 = 规则报警次数 / 规则命中次数
- 规则报警率低、趋势走低表明规则需修正
- 规则(触发)报警次数:命中规则后账户被拒绝次数
规则调查次数、调查率
- 规则调查次数 = 对案件调查分析时调查其次数 (短路调查)
- 规则调查率 = 规则调查次数 / 规则报警次数
- 调查率低则因考虑其他规则替代该规则,或
or
合并规则 - 规则可以为调查提供提示,而过多不能给调查提供提示的 规则反而浪费时间
规则命中次数、命中率
- 规则命中次数 = 命中触发报警之后被认定为坏样本数
- 规则命中率 = 规则命中次数 / 规则报警次数
综合命中次数
- 综合命中次数 = 规则命中次数 + 逾期调查认定坏样本数
- 综合命中率 = 综合命中次数 / 规则报警次数
- 在线效果效果是无法在体系内自评估的,必须引入外部信息,包括:人工审核、额外数据源、扩招回机制等
规则稳定性
通过率波动应对
- 寻找通过率变动的时点
- 计算各维度通过率波动程度PSI
- 定位各策略节点主次影响
- 分析主要影响策略节点规则、阈值
- 指导决策
逾期率波动应对
- 定位逾期率波动客群:存量客户、新增客户
- MOD
旁路规则
Swap Set Analysis
- 新、旧模型可用离线指标比较优劣,但最终要在业务中比较通过率、坏账率,二者正相关,swap set 则是反应模型的通过的变化
Swap Set Analysis 用于分析新、旧模型更替
- 根据订单在新、旧模型的通过情况,可以分为三类
- Swap-in Population:旧模型拒绝但新模型接受
- Swap-out Population:旧模型接受但新模型拒绝
- No Change:新、旧模型同时接受、拒绝
- 从 swap set 角度评价 “新模型优于旧模型”
- Swap-in Population >= Swap-out Population 且坏账率不升
- Swap-in Population = Swap-out Population 、坏账率不变,但用户响应率提升
- 根据订单在新、旧模型的通过情况,可以分为三类
实务中,已上线的旧模型拒绝订单无法获取表现期,只能通过拒绝推断近似得到坏账率
- 同时间窗 A/B-Test:切分流量让旧模型只打分不拒绝
- 跨时间窗 A/B-Test:用旧模型在灰度期坏账率替代
扩召回
扩召回:独立召回之外,利用额外模型扩召回部分样本
此处召回一般指通过 成熟 的规则、模型从全体中获取部分样本
- 召回一般为历史沉淀、专家经验规则
- 召回的理由充足,但泛化性较差
扩召回和二次排序训练用的样本是相同的,但
- 二次排序是在召回的样本基础上再次排序
- 目标:(全局)排序能力
- 评价标准:AUC、头部准召
- 扩召回一般是独立于召回建立的模型
- 目标:学习召回样本的规律,完善召回机制、补充召回样本
- 因此,扩招回也可以用召回样本作为正样本
- 扩召回也可用于在线验证新、旧规则的有效性
- 评价标准:额外召回准确率(对召回样本的学习能力)
- 事实上,若采用召回样本作为正样本,则 AUC 为 1 的扩召回是无价值的,只是复现了召回
- 特征:可能包含一些专供于扩召回使用的特征
- 扩召回的正样本可能还包括人工举报、隐案等
- 目标:学习召回样本的规律,完善召回机制、补充召回样本
- 二次排序是在召回的样本基础上再次排序
准入规则
- 风控准入规则应为强拒绝规则
- 不满足任何规则均会被拒绝
- 规则无需经过复杂的规则衍生
- 策略理念:验证借款人依法合规未被政策限制
- 风控流程中首道防线
- 准入策略已经趋同
- 但对不同信贷场景仍应采取更适应业务的准入规则
基础认证模块
- 风控基础认证模块:验证申请人真实性
- 身份证信息验证
- 人脸信息验证
- 银行卡四要素验证
- 运营商三要素验证
按数据来源分类
- 个人信用类
- 个人基本信息
- 年龄准入
- 地区准入
- 行业准入
- 经济能力信息
- 月收入
- 流水
- 社交信息
- 个人基本信息
- 设备信息
- 短信
- APP安装信息
- 外部数据源
- 征信报告
- 外部黑名单
- 行为数据
- 活动轨迹
- 登录、注册时间
- 评分卡规则
黑、白名单
白名单
白名单:风险相对可知可控的客户构成的内部名单
- 业务初期:通过白名单控制入口
- 控制放量节奏
- 降低风险
- 通过宽松风控规则提高审批通过率
- 通过贷前策略规则筛选白名单,协助调整贷前策略
- 业务中期:部分客户走特殊的贷前审批流程,满足特殊审批 要求
- 业务初期:通过白名单控制入口
白名单筛选方式:有部分存量数据情况下
- 联合建模:缺乏特定业务场景预测变量,与外部机构建模 补充预测变量
- 内部数据探索:寻找与违约表现相关性较强的特征规则
- 类似场景、产品
- 纯粹凭借专家经验规则
- 引入外部数据匹配
黑名单
黑名单:还款能力、还款意愿不能满足正常客户标准
- 通常多个好客户才能覆盖坏客户的本金损失
- 通过黑名单客户全部拒绝,但是对于导流助贷机构,业务 核心是流量和客户质量,拒绝全部黑名单客群成本巨大, 可能会随机、结合评分放过部分
黑名单建立
- 建立黑名单参考维度
- 还款表现
- 渠道
- 利率
- 失信名单
- 黑名单主体
- 身份证
- 手机号
- 邮箱
- 银行卡
- IP
- 建立黑名单参考维度
三方黑名单
自建黑名单命中率不高(二次申请概率低),且需要长期 积累
不同三方黑名单往往会有其侧重点
- 团伙欺诈名单
- 公安、司法名单
- 被执行人名单
三方黑名单效果也有好有坏,对效果较差、但通过率影响 不大黑名单也可以考虑保留
- 黑名单一般是查得收费,外挂较多黑名单不会提升成本
- 黑名单可视为容错机制,黑名单不一定能所有样本上 表现优秀,保留其可防止欺诈团伙等集中攻击
同样值得注意的是,黑名单的质量需要考核
- 非公信黑名单定义各家不同
- 名单没有明确的退出机制
- 黑名单按查得收费,有些黑名单会掺沙子
- 有些名单提供商同时作为信贷放贷方,有动力将优质客户 截留,将其添加进名单