大数据构建智慧税务-刘诚忠


数据治税 大数据构建智慧税务 刘诚忠 明略数据税务事业部总经理 目 录 01 税务大数据背景 02 实践案例分析 03 行业观察 Modem:56Kb ps ADSL: 10Mbps 光纤:1000Mbps 机器 互联网高速公路 人+服务 人+设备 互联网+ 物联网 C h a n g e 数据 爆炸 互联网数据 三方涉税信息 税务系统信息 征管 数据 增值税 发票 车辆购 置税 出口 退税 S t a t u s o f T a x a t i o n 国税局主题数据 种类多 专业性强 关联性强 2016海淀破获特大虚开发票案 上百个空壳公司 涉案金额30多亿 流失税额达5亿余元大型涉税案件 多方数据关联分析 4月份过后的国税局办税大厅 营改增 一般纳税人400万户 年开票量几十亿份 分各行业,各区域进行快速统计 01 数据是直接的核查信息 02 数据可以作为交叉比对 的辅助手段 03 多方数据流动和联合形 成数据生态 数据时代的税务方法论 以票 控税 数据 管税 《“互联网+税务”行动计划》 19.互联网+涉税大数据   将手工录入等传统渠道采集的数据和通过互联网、物联网等新兴感知技术采集的数据以及 第三方共享的信息,有机整合形成税收大数据。运用大数据技术,开发和利用好大数据这一基础 性战略资源,支撑纳税服务、税收征管、政策效应分析、税收经济分析等工作,优化纳税服务, 提高税收征管水平,拓展税收服务国家治理的新领域。   在互联网上收集、筛选、捕捉涉税数据和公开信息,通过分析挖掘,为纳税人提供更精准的 涉税服务,为税源管理、风险管理、涉税稽查、调查取证等工作提供信息支持。通过舆情监控, 对纳税人需求和关注及时了解,及时采取应对措施,提高税收工作的针对性和有效性。 传统架构的增长曲线 理想增长曲线 >>30s 挑战 数据 爆炸 税收 特点 营改增 互联网企业 有一小部分企业最先面临并成功解决了的问题 —— 用大数据的方式 背后的思路: 3-5年内如何升级? 单选题:当需要拖动更多的载重时 A. 找一匹更强壮的马 B. 找十匹马 大道至简 分而治之 极端案例: 大数据提供了可扩展的数据应对机制 years 30 数据科学家 运维工程师 100 建立 大数据 团队 With 14亿用户 support 目 录 01 税务大数据背景 02 实践案例分析 03 行业观察 我们关注 如何用合理的成本 应对海量增长的数据 如何充分挖掘出 数据价值来提升业务 达成前提:数据的业务含义和关联 大数据平台实施步骤 咨询规划 基础能力 建设 数据汇集 数据治理 数据应用 数据运营 ü 客服访谈 ü 需求调研 ü 整体规划 ü 大数据基础 平台 ü 数据存储和 计算能力 ü 数据汇集系 统 ü 各类数据大 集中操作 ü 数据治理 体系规范 ü 提高数据 质量 ü 新型的数据 应用 ü 数据价值的 变现 ü 数据运营 ü 数据交互 ü 数据合作 ü 数据开发 总行 源数据层 数据治理层 三农大数据分析应用 【 三农业务风险分析系统】 【三农行业信息分析系统】 【三农贷款还款预测系统】 大数据平台层 数据分析应用层 总行下载平台 / 拆分平台 生产系统 ECIF 下载平台 行外数据 【非生产系统 的】 数据处理 下载平台数据治理 【明略】外部数据处理 贴源层 整合层 中间汇总层 大数据平台 处理结果 行内行外数据重度汇总 轻度汇总 数据存储 法律合规部 【 员工账户监测系统】 某行整体大数据架构 金三业务数据 本地特色软件数据 外部交换数据 互联网数据 其他数据 大数据平台 总局决策一包 总局决策二包 本地特色分析及 大数据应用 金三数仓 其他数据应用 这些目前都不会发生 精细化的税源管理,大数据风控 纳税人画像分类,纳税遵从 基础环境 数据资产管理 数尽其用 数据分析挖掘 价值衍生 数据运营 01 02 03 目前大多数政府部门 还在第一阶段 开源产品成熟度 远远不够 数据清洗占到成本70%以上 数据校验,转换,数值合并 地税数据资产全景图 按年度、按区县统计各个纳税人的纳税贡献度。单个纳税人的贡献度为:当年 实际纳税金额总和/当年计税依据总和*100%,算出贡献度后,按年度、区县 聚合后进行排序 测试准备 ✓ 数据集合是纳税人的申报明细记录,总共1000万条记录 ✓ 测试环境是7台物理机器搭建的MDP集群。 测试结果 ✓ 传统数据仓库 25分钟 ✓ 大数据SQL引擎 9秒 需 求 省国税局大数据性能提升 基础环境 数据资产管理 数尽其用 数据分析挖掘 价值衍生 数据运营 01 02 03 省级地税单位大数据平台落地后规划 数据管 理能力 ✓ 通过建设元数据管理系统和规范,清晰勾勒出地税税务数据资产的全 貌,为后续基于数据的应用提供质量上的可靠保障 ✓ 通过建设ETL可视化套件,将数据分析挖掘处理的关键过程去技术化,暴 露在税务业务人员面前,使其能更深入理解和创新 数据应 用能力 ✓ 通过建立税源分析平台,并在其上构建种类丰富、形势多样的大数据应 用,真正使税务数据资产变现。在政策决策辅助、税款追缴、提高纳税 服务质量、降低纳税成本等方面发挥作用 税源分析解决方案 基础环境 数据资产管理 数尽其用 数据分析挖掘 价值衍生 数据运营 01 02 03 数据运营的价值体现 基础: 数据处理能力极大提升 简化: 让数据主控权回归业务人员 应用: 提升服务能力 对内 对外 宏观 微观 纳服 增值服务 领导视图 风控 稽查 税源分析 行业报告 跨部门 目 录 01 税务大数据背景 02 实践案例分析 03 行业观察 TAX大量发票,三方,互联网数据进入视野 以纳税人为核心进行快速组织和检索 深化风控和预测模型 客户真实需求 突破传统数仓 数据汇集 关联分析 感知 & 学习 理想与现实的差别 憧憬 现实 真实需求:高效直观的统计分析 数据 科学家 数据 挖掘 机器 学习 大数据 BI R支持 数据治理 元数据管理 ETL 可视化关联分析 产品化 我们需要的大数据公司 ? 经验丰富的数据猎手 统计和工程结合,核心参与开源 咨询到落地的全栈服务 相对成熟的商业化产品 互联网级别的数据经验 欢迎一起迈入2016 —— 大数据元年 Thanks!
还剩34页未读

继续阅读

下载pdf到电脑,查找使用更方便

pdf的实际排版效果,会与网站的显示效果略有不同!!

需要 10 金币 [ 分享pdf获得金币 ] 0 人已下载

下载pdf

pdf贡献者

lwq2006

贡献于2016-05-09

下载需要 10 金币 [金币充值 ]
亲,您也可以通过 分享原创pdf 来获得金币奖励!
下载pdf