Posted 2021-01-11Updated 2021-07-16ML Specification / FinTech / Risk Control18 minutes read (About 2745 words)

风控规则

规则的类型
- 条件判断：决策路径独立
- 决策表：决策路径有交集、规律
- 决策树：决策路径不规律、可能重复检查同一数据

规则引擎：接受数据输入，解释业务规则，根据业务规则、使用预定义语义做出业务决策

制定原则

监管、公司政策类
- 年龄准入
- 行业准入
  - 有金融属性行业
  - 政策敏感娱乐行业
- 地域准入
- 场景准入
风控层面
- 黑名单类
- 多头类：申请次数
- 共债类：申请量
- 反欺诈类
- 评分拒绝类

规则发现

规则评分

强弱规则
- 强规则：可作为独立规则，直接指导决策
- 弱规则：具有一定区分度，但不决定性
弱规则可组合使用，通过评分方式衡量弱规则
- 使用规则评分衡量规则影响力
- 规则影响力则可以通过命中坏占比、odds变动衡量
- 设置阈值，命中规则的评分之和超过阈值才触发报警

笛卡尔积法

步骤
- 获取变量：定义好坏，关联特征变量
- 变量筛选：通过IV值等指标快速筛选变量
- 指标统计：分组统计申请量、放款量、坏账量等指标
- 透视呈现：分申请率、放款率、坏账率等指标制作交互，如列联表等
- 规则提取：结合各维度选择满足要求的组别，提取规则逻辑
- 规则评估：评估跨期稳定性
- 策略上线

决策树法

决策树法优势
- 可根据划分依据自动对人群细分
决策树法缺陷
- 难以调整决策树划分结果
- 划分结果可能缺乏业务意义
- 可能出现过拟合现象

规则阈值设置

阈值设置指标
- Lift 值
- 收益/风险比
阈值设置依据
- 对分类取值，根据 Lift 值、收益/风险比 确定是否作为规则
- 对有序、数值取值，结合不同阈值点计算 Lift 值、收益/风险比，绘制曲线
  - 曲线平缓变化，则阈值切分收益变化稳定，阈值调整空间比较大
  - 曲线存在明显陡、缓变化，则阈值切分收益在拐点处收益较大，阈值调整空间有限

规则评价

案件调查
- 用信前报警调查
- 逾期后调查
- 根据不同目标，可以对不同的案件区分重点调查

线下 / 离线（标签已知）效果评估

自身效果评估
- 混淆矩阵
  - TPR/FPR
  - 准确率/误拒率
- 提升度
  - 拒绝样本中坏样本Lift提升度
  - 通过样本中好样本Lift提升度
- 通过率、拒绝率
- 加权收益：好数量 好收益 + 坏数量 坏收益
对比/增量效果评估：和其他数据源比较
- 有效差异率：查得命中 / 其他通过且为坏样本
- 无效差异率：查得命中 / 其他拒绝

类似名单类数据评估

线上 / 在线（标签未知）效果评估

规则报警次数、报警率
- 规则（触发）报警次数：命中规则后账户被拒绝次数
  - 对强规则，即为规则命中次数
  - 对弱规则，小于规则命中次数
- 规则报警率 = 规则报警次数 / 规则命中次数
- 规则报警率低、趋势走低表明规则需修正
规则调查次数、调查率
- 规则调查次数 = 对案件调查分析时调查其次数（短路调查）
- 规则调查率 = 规则调查次数 / 规则报警次数
- 调查率低则因考虑其他规则替代该规则，或or合并规则
- 规则可以为调查提供提示，而过多不能给调查提供提示的规则反而浪费时间
规则命中次数、命中率
- 规则命中次数 = 命中触发报警之后被认定为坏样本数
- 规则命中率 = 规则命中次数 / 规则报警次数
综合命中次数
- 综合命中次数 = 规则命中次数 + 逾期调查认定坏样本数
- 综合命中率 = 综合命中次数 / 规则报警次数

在线效果效果是无法在体系内自评估的，必须引入外部信息，包括：人工审核、额外数据源、扩招回机制等

规则稳定性

通过率波动应对

寻找通过率变动的时点
计算各维度通过率波动程度PSI
- 定位各策略节点主次影响
- 分析主要影响策略节点规则、阈值
指导决策

逾期率波动应对

定位逾期率波动客群：存量客户、新增客户
- MOD

旁路规则

Swap Set Analysis

新、旧模型可用离线指标比较优劣，但最终要在业务中比较通过率、坏账率，二者正相关，swap set 则是反应模型的通过的变化

Swap Set Analysis 用于分析新、旧模型更替
- 根据订单在新、旧模型的通过情况，可以分为三类
  - Swap-in Population：旧模型拒绝但新模型接受
  - Swap-out Population：旧模型接受但新模型拒绝
  - No Change：新、旧模型同时接受、拒绝
- 从 swap set 角度评价 “新模型优于旧模型”
  - Swap-in Population >= Swap-out Population 且坏账率不升
  - Swap-in Population = Swap-out Population 、坏账率不变，但用户响应率提升
实务中，已上线的旧模型拒绝订单无法获取表现期，只能通过拒绝推断近似得到坏账率
- 同时间窗 A/B-Test：切分流量让旧模型只打分不拒绝
- 跨时间窗 A/B-Test：用旧模型在灰度期坏账率替代

扩召回

扩召回：独立召回之外，利用额外模型扩召回部分样本

此处召回一般指通过成熟的规则、模型从全体中获取部分样本
- 召回一般为历史沉淀、专家经验规则
- 召回的理由充足，但泛化性较差
扩召回和二次排序训练用的样本是相同的，但
- 二次排序是在召回的样本基础上再次排序
  - 目标：（全局）排序能力
  - 评价标准：AUC、头部准召
- 扩召回一般是独立于召回建立的模型
  - 目标：学习召回样本的规律，完善召回机制、补充召回样本
    - 因此，扩招回也可以用召回样本作为正样本
    - 扩召回也可用于在线验证新、旧规则的有效性
  - 评价标准：额外召回准确率（对召回样本的学习能力）
    - 事实上，若采用召回样本作为正样本，则 AUC 为 1 的扩召回是无价值的，只是复现了召回
  - 特征：可能包含一些专供于扩召回使用的特征
  - 扩召回的正样本可能还包括人工举报、隐案等

准入规则

风控准入规则应为强拒绝规则
- 不满足任何规则均会被拒绝
- 规则无需经过复杂的规则衍生
- 策略理念：验证借款人依法合规未被政策限制
- 风控流程中首道防线
  - 准入策略已经趋同
  - 但对不同信贷场景仍应采取更适应业务的准入规则

基础认证模块

风控基础认证模块：验证申请人真实性
- 身份证信息验证
- 人脸信息验证
- 银行卡四要素验证
- 运营商三要素验证

按数据来源分类

个人信用类
- 个人基本信息
  - 年龄准入
  - 地区准入
  - 行业准入
- 经济能力信息
  - 月收入
  - 流水
- 社交信息
设备信息
- 短信
- APP安装信息
外部数据源
- 征信报告
- 外部黑名单
行为数据
- 活动轨迹
- 登录、注册时间
评分卡规则

黑、白名单

白名单

白名单：风险相对可知可控的客户构成的内部名单
- 业务初期：通过白名单控制入口
  - 控制放量节奏
  - 降低风险
  - 通过宽松风控规则提高审批通过率
  - 通过贷前策略规则筛选白名单，协助调整贷前策略
- 业务中期：部分客户走特殊的贷前审批流程，满足特殊审批要求
白名单筛选方式：有部分存量数据情况下
- 联合建模：缺乏特定业务场景预测变量，与外部机构建模补充预测变量
- 内部数据探索：寻找与违约表现相关性较强的特征规则
  - 类似场景、产品
  - 纯粹凭借专家经验规则
- 引入外部数据匹配

黑名单

黑名单：还款能力、还款意愿不能满足正常客户标准
- 通常多个好客户才能覆盖坏客户的本金损失
- 通过黑名单客户全部拒绝，但是对于导流助贷机构，业务核心是流量和客户质量，拒绝全部黑名单客群成本巨大，可能会随机、结合评分放过部分
黑名单建立
- 建立黑名单参考维度
  - 还款表现
  - 渠道
  - 利率
  - 失信名单
- 黑名单主体
  - 身份证
  - 手机号
  - 邮箱
  - 银行卡
  - IP

三方黑名单

自建黑名单命中率不高（二次申请概率低），且需要长期积累
不同三方黑名单往往会有其侧重点
- 团伙欺诈名单
- 公安、司法名单
- 被执行人名单
三方黑名单效果也有好有坏，对效果较差、但通过率影响不大黑名单也可以考虑保留
- 黑名单一般是查得收费，外挂较多黑名单不会提升成本
- 黑名单可视为容错机制，黑名单不一定能所有样本上表现优秀，保留其可防止欺诈团伙等集中攻击
同样值得注意的是，黑名单的质量需要考核
- 非公信黑名单定义各家不同
- 名单没有明确的退出机制
- 黑名单按查得收费，有些黑名单会掺沙子
- 有些名单提供商同时作为信贷放贷方，有动力将优质客户截留，将其添加进名单

风控规则

风控规则

制定原则

规则发现

规则评分

笛卡尔积法

决策树法

规则阈值设置

规则评价

线下 / 离线（标签已知）效果评估

线上 / 在线（标签未知）效果评估

规则稳定性

通过率波动应对

逾期率波动应对

旁路规则

Swap Set Analysis

扩召回

准入规则

基础认证模块

按数据来源分类

黑、白名单

白名单

黑名单

三方黑名单

Categories

Recents

Advertisement

follow.it