• 1. 数据仓库和数据挖掘在商业活动中的应用刘建民 博士 首席顾问1
  • 2. 简介●数据仓库是公司成功的关键因素 ●随着数据的数量以指数速度增长,将原始数据转化为可供决策的信息就变得十分关键 ●这个演讲将展示一个数据仓库的结构及它在成功开展商业活动中所扮演重要角色 2
  • 3. 45+ Systems Feed Data3800万 帐户/服务世界资本 市场 活期存款市场活期存款个人贷款小型企业贷款定期存款银行分支业务 房屋贷款商务贷款 外部数据银行批发业务及 客户信息信用卡 每月 公司数据仓库 一览投资帐户通过电脑的业务 自动存/取款机业务每天每周通过电话进行 的银行业务3
  • 4. 数字(信息)量的成长趋势05001,0001,5002,0002,5003,0003,5004,00019861988199019921994199619982000USERSGIGABYTES4
  • 5. 数据和数据挖掘 ●消费者贷款信用数据 ●客户其它数据(社会、生活、经济) ●第三方专有数据 (UPDW, HVC, MM) ●统计模型,分析及报告数据 数据仓库 ●开放性客户服务器技术 ● 庞大的数据仓库/数据来源 系统 数据库营销 ●数据库营销的专业,技术知识和专长 ●对有待开发市场的数据营销。商业目标5
  • 6. 目标: ●创立一个世界一流的数据库营销系统和来帮助开发新市场 具体需求 ●促销活动的管理 (设计, 开发, 实施) ●促销活动的追踪和分析 ● 对不同问题的数据分析和数据挖掘 ●在线用户进网的可靠和方便商业解决方案 方案一览:我们了解您的需求6
  • 7. 商业解决方案 方案一览:假设数据库系统展望假设: ●最初系统将包含50个州5千万条记录 ●系统必须能够扩展到8千万条个人记录 ●每季度的报告要重建 ●每月和每周数据库更新 ●年度邮件数量达到1500百万 ●在旧金山的用户可直接进入 ● 6个远端用户 ● 5个月的开发和测试阶段 ● 36 个月的合同期限 7
  • 8. 3.5.7.6.SAS 服务器Extracting transforming & Loading(ETL)/ 数据仓库 服务器Data Mart 服务器富国银行最终用户4.8.促销活动 管理服务器ETL 流程促销对象--数据仓库选择 数据 Mart客户数据UPDWDataquickExperian Credit商业活动 数据其他 数据 来源1.商业解决方案 方案一览: 概念化系统设计2.8
  • 9. 房屋拥有者数据 ● Dataquick (5200万 homeowners) ● UPDW (7000万 homeowners) 贷款信用数据 ● Experian 信用数据季度性更新 ●系统设计可容纳3家贷款信用公司的数据 客户数据 ●由富国银行每两个月或更短时间内进行更新 促销活动数据 ●至少24个月的促销商业活动的数据得以储存 ●促销活动反应效果的历史记载(每周进行) 其它数据来源 ● 禁止促销的个人数据商业解决方案 方案一览:1.输入数据来源9
  • 10. 商业解决方案 方案一览:2.ETL流程 不同流程旧新数据清理数据库更新数据合并促销对象-数据仓库选择数据 Mart数据仓库 M/P键的管理匹配不匹配数据更新客户数据UPDWDataquickExperian Credit促销活动 数据其他数据 来源数据库 M/P10
  • 11. 数据仓库功能 ●保证所有联邦法律得以实施 所有经识别的数据都存储在数据仓库 ●管理文件输出流程 信件,审计文件,分析文件等 ●重点变量的维护和管理 ●文件输出流程 ●数据存储 硬件/软件 ● Compaq 8400 (12 processors, 8GB RAM) ●数据管理工具 (address standardization, M/P, etc.)商业解决方案 方案一览: 3. 促销对象的数据库(新市场)11
  • 12. 选择数据库的功能 ●促销活动的设计,开展和实施 ●数据挖掘和分析 ●促销活动的回应历史数据 ●信用、房屋拥有人及其它有关促销对象的社会、经济数据 硬件/软件 ● Compaq GS60E (8 processors, 6GB RAM) ● Oracle 8i RDBMS 商业解决方案 方案一览: 4. 选择数据 来源12
  • 13. 远程连接功能 ● Fractional闭路联网连接(T1) ● 6个用户进入 商业解决方案 方案一览: 5. 远程连接13
  • 14. 促销数据库是 可实施ODBC 的 用户工具 ●促销活动管理 – 软件IMPACT! ●数据挖掘 – SAS(Enterprise Miner) ●决策支持 – 软件“Business Object” 用户培训 ● 商业活动管理软件 ●数据库模型商业解决方案 方案一览: 6. 用户进入工具14
  • 15. 专用的SAS 服务器 ●保证 SAS 的运行不影响数据库的运行效率 ●不必将数据送回用户电脑 ●进入专用用户的工作区是可靠的 硬件/软件 ● SUN E450 或相同服务器 (4 processors 2GB RAM) ● Base SAS, Stat, Connect, Access to Oracle商业解决方案 方案一览: 7. SAS15
  • 16. Dedicated IMPACT! 应用服务器 ●确保能够进入专用的用户工作区 硬件/软件 ● SUN E450 或相同服务器 (4 processors 2GB RAM) ●促销活动软件包 商业解决方案 方案一览: 8. IMPACT!16
  • 17. 商业解决方案 商业活动管理流程: Process Flow促销对象选择 的数据库数据挖掘促销活动设计市场分割 SASSAS/ IMPACT!IMPACT!IndividualCellOffer...19847561XYZ...23475491XYZ...23424592LMN...............促销活动 设计和实施促销效果记载数据库部门促销数据 文件PPPPPPPPPPPPPPPPPPPPP终端 用户17
  • 18. IMPACT! 提供用户以下功能: ●操作简单 ●直接通过终端电脑进入数据库 ●具备开发复杂促销战略的能力 ●具备定义输出数据规格的能力 ●具备输出报告和数据的能力 ●具备追踪促销次数的能力 ●具备使用数据库数据与外数据库数据文件的能力 商业解决方案 商业活动管理流程: IMPACT!18
  • 19. 优点 应用标准 分类展望 创立样本 应用模型评估 定义联系方式 创立分析报告商业解决方案 商业活动管理流程: IMPACT! 模板19
  • 20. ●商业需求 ●功能需求 ●项目阶段 投资 计划 范围 定义设计开发发布商业解决方案 数据库开发方法: 构成●概念构架 ●逻辑数据模型 ●实际数据模型 ● ETL概念 流程 ● ETL 流程设计●系统设计和构造 ●实际数据模型实施 ●网络连接 ●用户工具具体化 ●系统测试 ●用户培训 IMPACT! 数据模型20
  • 21. 商业解决方案 数据库开发方法论: 构成房屋净值贷款 客户信息促销和回应历史信用数据: 400 变量金融 客户信息人口信息: 经济、教育 100 变量模型 评估: 回应, 利润, 属性,活性房屋贷款 客户信息经济和房屋价值客户 touchpoint 行为数据: Web, VRU, ATM, Phone bank其它产品客户和具体申请资料阶段 1: 2千9百万信用合格的 homeowners 包括 700万 WFB客户 阶段2: 所有 WFB 客户, 其它美国家庭21
  • 22. 数据挖掘和分析 充分利用一切数据市场潜力分析市场分额分析客户利润,市场分割和客户分类信息最佳风险 标准统计模型: 促销回应,利润促销(对象)目标下一个最佳 金融产品客户对银行不同渠道的选择模型22
  • 23. 数据仓库: 获取大量客户 和产品信息的地方新概念商业需求分析 分销 客户利润 市场分割贷款申请 扩展和 大规模市场销售 经济刺激销售 追踪销售 等..成长DELIVERY数据仓库23