个推大数据 金融风控算法实践

  • 大数据金融风控简介
  • 金融场景机器学习的基本流程
  • 金融风控建模算法实践
  • 金融风控系统产品化

晓骏 个推高级数据工程师,负责个推大数据平台画像系统相关建模和开发,已主导完成金融风控、广告营销、APP用户画像产品等业务的落地工作,在用户行为属性刻画、海量数据商业分析、机器深度学习等方面有着丰富的一线经验。

展开查看详情

1. 个推大数据 金融风控算法实践 个推高级数据工程师 晓骏

2.简介 晓骏 个推高级数据工程师 负责个推大数据平台画像系统相关建模和开发,已主 导完成金融风控、广告营销、APP用户画像产品等业 务的落地工作,在用户行为属性刻画、海量数据商业 分析、机器深度学习等方面有着丰富的一线经验。 X GDG

3.大纲 1 大数据金融风控简介 2 金融场景机器学习的基本流程 3 金融风控建模算法实践 4 金融风控系统产品化 X GDG

4. 大数据金融风控简介 • 大数据金融风控的内容 • 大数据金融风控的现状与意义 X GDG

5.大数据金融风控的内容 什么是大数据金融风控? 海量数据:线上线下特征数据,8个维度、350+特征层 数据,实时性,动态性 核心技术:算法(WALS、协同推荐算法、XgBoost等), 模型(营销模型、多头模型、信用分模型) 应用场景:获客、流量筛选、信用评级、贷中监测、 贷后管理 X GDG

6.大数据金融风控的内容 海量数据: 应用场景: 8个维度,350+特征 获客、流量筛选、贷中监测、贷后管理 1 个人属性 2 社会属性 3 资产 4 消费偏好 5 金融 6 风险 7 行为偏好 8 稳定性 X GDG

7. 大数据金融风控的现状与意义 现状 意义 传统风控 大数据风控 系统风险隐患 虚假注册泛滥 预防灰犀牛 人工、经验 数据治理 浪费营销成本 和黑天鹅 难以传承 数据仓库 过度授信 数据面不广 覆盖面广泛 集体欺诈 导致违约率上升 导致金融机构 增长乏力 风险预警监控 严重损失 Fintech——利用大数据等互联网创 智能风控——基于大数据、流计算、人工智能 新技术进行风险控制和平台管理 等前沿技术,实现全流程、全周期有效管理 X GDG

8. 金融风控机器学习的基本流程 • 建模基本流程 • 如何高效构建特征库 X GDG

9.风控场景机器学习的基本流程 RNN/CNN LR/SVM 个推平台 样本数据 特征工程 模型训练 数据仓库 模型应用 数据清洗 数据分类 海量一手数据 持续更新 特征数据库 模型预测 X GDG

10.如何高效构建特征 数据源整理 数 据 构 数据稳定性分析 特征评估指标 建 特征分类 脏数据处理 KS分箱 IV值,Gain值 饱和度 数 特征稳定性分析PSI 据 构 特征有效性验证IV值 建 单调性 稳定性 8个维度与350+特 征 数 基础数据:针对已有的不同类别特征 据 构 聚合方法:1. 模式共振2.信息协同 3.评分卡聚合 建 筛选标准:客户样本IV值 X GDG

11. 风控场景机器学习的算法实践 • 拉——营销模型 • 选——欺诈分模型 • 评——信用分模型 • 管——贷中监测模型 • 催——催收价值评估 X GDG

12.大数据金融风控建模实践 X GDG

13.拉-选-评-管-催 营 • 场景:大额、小额 销 • 目的:注册、转化 模 • 有无样本 型 解营 营销模型 决销 方分 案优 化 营 流销 程分 图模 型 X GDG

14.拉-选-评-管-催 欺诈分模型 风险人群筛选 ID信息 设备信息 设备特征 黑名单 线上app偏好数据 线上app偏好特征 特征匹配 模型预测+ 实时/离线处理 定制规则 灰名单 线下场景数据 线下场景特征 风险特征筛选 ID信息 外部数据 其它特征 欺诈分 多数据源 8维度350+特征 风险人群 X GDG

15.拉-选-评-管-催 信用分模型 先根据模型训练与规则模型,得到各个维度分,再将五个维度的 个人评分作为特征输入模型,作为特征得到总体个人信用分 信用分模型由多个模型整合而成,第一层是分类模型 (lr+xgboost),得到分值;第二层在维度分的基础上再进行回归, 得到最终信用评分 X GDG

16.拉-选-评-管-催 贷中监测模型 综合评分模型 从整体人群筛选出逾 期相似(相关)人群 动态监测模型 结合实时数据与高危 特征异常监测得到 高可疑用户 综合研判 对高疑用户通过进一 步的精准研判得到逾 期风险人员 X GDG

17.风控系统产品化 业务人员A 规则设计层 HTTP服务层 库管理 规则集管理 规则仓库 函数仓库 ID 信 规则集管理 规则执行层 息 评分卡 数据处理 逻辑控制 函数 模型 四则运算 While 系统函数 模型API 外部模型 比较运算 if 内置函数 逻辑运算 内部模型 决策流 For 自定义函数 … X GDG

18.风控系统产品化 X GDG

19.个推金融风控服务——个真 个推金融风控,用大数据为各领域金融客户提供智能反欺诈、多维信贷风险评估和高意愿用户智能筛选等服务,帮助客户识别 “真”用户、“真”设备、“真”需求、“真”信息以及“真”能力,以大数据定义全流程智慧金融。 智能风控 精准获客 • 有效识别高风险人群、 • 通过大数据建模综合判 团伙欺诈、虚假设备等 定用户借贷和办卡等意 风险,降低放贷风险, 愿程度 减少资金损失 • 多指标筛选优质用户, • 多维度评估用户信用程 精准定向,降低获客成 度,动态跟踪用户信用 本 变化 X GDG

20.Thanks!