互联网金融_刘奕慧_腾讯征信公司技术架构


ArchSummit全球架构师峰会深圳站2015 腾讯征信 gavinliu 目录  征信行业的介绍  西方的征信模式  国内的征信探索  腾讯征信  腾讯征信平台(TCP)  整体架构简介  征信服务平台(TCS )——2B&2C  征信数据平台(TCD)——平台&管理&模型  征信发展趋势及挑戓  鼓励诚信,惩戒失信  挑戓:数据分享、数据隐私、标准制定 君子之言,信而有征,故怨远于其身 ——《左传》 征信 西方的征信模式 • 市场主导模式: • 市场模式成熟,规模庞大 美国 • 政府主导模式 • 中央银行建立的中央信贷登记系统 欧洲 • 行业主导模式 • 银行业、信贷业、信用产业。非营利性 日本 美国著名征信企业 美国征信体系 机构征信 资本市场信用 企业信用 个人征信 个人&小企业信 用 美国个人征信产业链 金融数据 信贷数据 公共服务 记录 信用评分 信用报告 市场分析 决策分析 其他 数据服务 金融信贷 机构 征信机构 数据公司 企业/个人 政府/公共 服务公司 各大信用公司 原始数据的采集、 清洗、标准化 征信数据的处理、 分析、挖掘 形成征信产品: 数据、分析方法、 解决方案 1 2 3 美国征信业特点  市场规模大  立法比较完善  标准比较完善  数据共享 我国个人征信业发展  2013年之前——摸索阶段  2013年——《征信业管理条例》,有法可依  2014年——《社会信用体系建设纲要》 2015年:腾讯信用、芝麻信用、前海征信等8家公司  典型企业 人行征信中心、上海资信,鹏元征信、安融征信,大公国际 到2020年, 社会信用基础性法律法规和标准体系基本建立 以信用信息资源共享为基础的覆盖全社会的征信系统基本 建成 信用监管体制基本健全 信用服务市场体系比较完善 守信激励和失信惩戒机制全面发挥作用 腾讯征信业务介绍 信用产品 • 信用评分 • 信用报告 反欺诈服务 • 欺诈等级 • 人脸识别 解决方案 • 营销规则 • 定向推荐 特权平台 • 金融特权 • 生活特权 贷前 • 信用产品 • 反欺诈 贷中 • 监控预警 • 欺诈预警 贷后 • 催收模型 • 失联模型 • 更多服务 推劢征信产品应用于各行各业! 腾讯征信的技术架构 腾讯征信平台(TCP)整体架构 Hadoop+Hive+PG+Spark+Storm+drool 存储 集群 计算 集群 查询 集群 管理 集群 征信 数据平台 (TCD) 征信 服务平台 (TCS) 实时 计算 人脸 核身 征信 查询 消费评 级等其 他服务 金融 特权 生活 特权 信贷 服务 腾讯信用 wxy.qq.com 征信企业平台 计费管理 2B(企业) 2C(个人) 防 欺诈 个人 征信 企业管理 挖掘 集群 授权 管理 互联网数据、金融数据、公共行为数据 征信服务平台(TCS2B)架构 接入 链路层 VPN 丏线 公网 HTTPS 接入 逻辑层 商户鉴权 信息 加解密 负载均衡 数据采集 核心 处理层 用户查询 数据封装 实时计算 规则引擎 智能推荐 征信 数据层 信用评分 信用报告 欺诈等级 贷款额度 兴趣爱好 DB-Proxy 商户管理 权限管理 计费管理 日志监控 审计平台 投诉管理 管理平台 人脸识别 接入模块 加密/鉴权/计费 数据/ 日志存储 特征码提取模块 照片比对模块 征信 接入模块 身份证DB 公安部 优图-特征码 提取集群 优图-照片 比对集群 银行/证券APP 用户 身份/视频 比对分值 腾讯信用 信用纵览 金融商户: 小贷公司、P2P、消费金融、 理财产品、等等 生活商户: 酒店、旅行、网购、交通、 中介、婚恋交友、打车、顺 风车、租赁 腾讯信用 手Q服务号/微信公众号 用户 信用报告 授权管理 提升任务 金融特权 生活特权 个人身份 征信DB 信用评分 消费记录 社交记录 逾期记录 公共记录 征信数据平台(TCD)架构 数据接入层 Hadoop集群 Hive 查询引擎 Spark集群 模型训练 Storm 集群 实时计算 信贷及消费数据 互联网行为数据 外部数据 实时日志接入 离线文件接入 MR 计算 平台管理 运营监控 权限管理 作业管理 接入 存储 计算 管理 数据管理 设备管理 任务管理 HBase 集群 实时查询 PG小数据 查询计算 数据计算 Spark 大规模数据 训练 PgSQL 小规模数据 训练戒查询 可以接Sas和 R Hbase 评分与报告查询 Hive 查询引擎 Hadoop分布式 存储与计算 核心数据仓库 集成开发环境 调度与元数 据管理 数据管理 元数据管理 数据安全管理 元数据 采集 血缘分 析 数据地 图 字典表 管理 数据质量管理 清洗 标准化 质量监 控告警 帐号 管理 权限 管理 安全 流程 数据 加密 数据 脱敏 行为 审计 异常 监控 征信模型建模过程 • IV>0.01,戒 者IV TOP 3000 • 进一步筛选 出3000个 变量 • 考虑变量的 Bivar,VIF, 符号的一致 性及业务可 解释性 • 不断重复上 述步骤 • 最终得到 25个变量 • 聚类分析 • 相关分析 • 多轮判别 • 最终获得 500个变量 • 原始变量到 衍生变量 • 逻辑回归 • 筛选出100 个变量 变量池 (10000) 单变量分析 (3000) 多变量分析 (500) 变量初选 (100) 模型变量 (25) 20 /59 征信模型——互联网数据探索 互联网行为和信用之间的关系有规可循  网上活跃度  QQ/微信好友及关系  社交圈子 征信行业的展望 征信的最大兴奋点 终于可以合法的卖数据了! 行业参考——益佰利收入构成 决策分 析 12% 市场营 销 19% 个人服 务 22% 信用服 务 47% 征信发展的挑戓 信息分享 个人隐私 奖惩执行 标准制定 我们的目标 贡献! 交流探讨 微信号 :gavinliu 邮箱 :gavinliu@vip.qq.com
还剩27页未读

继续阅读

下载pdf到电脑,查找使用更方便

pdf的实际排版效果,会与网站的显示效果略有不同!!

需要 5 金币 [ 分享pdf获得金币 ] 3 人已下载

下载pdf