• 1. 运维管理解决方案北京用友政务软件有限公司 2018年10月23日
  • 2. 目录运维管理存在的问题 用友ITOM3运维管理解决方案
  • 3. 信息化及业务平台快速推广,应用及维护复杂度相应大幅提高。以保障业务系统高可用性为核心、以提高运维服务支持效率为目标的运维服务需求同步快速增长,运维人员面临的压力越来越大。 IT 运维管理概念运维人员业务管理数据/存储/容灾应用/服务管理网络管理资源资产管理日常工作管理目录/内容管理设备管理信息安全管理决策分析
  • 4. IT运维面临的问题(1)终端维护问题:大量的终端维护工作(如打补丁、分发软件、操作系统、病毒等),终端系统软、硬件配置台帐不清;终端行为无法把握;外设无法控制;终端接入无法管理;终端安全无法保证 网络维护问题:设备故障或者链路阻断;设备或接口性能指标不健康;网络病毒或攻击;终端设备非法接入;配置丢失等 业务系统维护问题:系统运行健康度不清楚;问题定位不及时、不准确;服务性能下降;服务停止;业务支撑环境不健康等
  • 5. IT运维面临的问题(2)数据库维护问题:厂商众多;越权滥用、合法权限滥用、权限盗用;数据库平台漏洞、数据库通信协议漏洞;SQL注入、数据库攻击;缺乏详尽审计;数据备份保护 运维管理问题:没有一体化监控管理平台;缺乏统一的服务接口人,故障响应和跟踪混乱;故障处理过程缺乏监控;系统优化缺乏数据支撑;IT系统运行质量和管理员运维绩效无法量化;运维知识无法积累
  • 6. 2006年,4月20日10时56分至17时30分,中国银联系统突发故障长达7个小时,北京、上海、杭州等大城市纷纷出现无法跨行取款、POS机无法消费等情况,全球银联支付体系均受严重影响; 2009年1月份和2月份上海两家银行发生故障,导致停机业务约半个小时,造成非常严重的影响; 2011年1月22日下午,正值市民赶在春节前购物的高峰时段,上海地区商户的银联刷卡机突然集体出现半个多小时的中断“事故”,所有商场都不能刷银联卡;举例——IT系统几起典型故障
  • 7. 如何应对?
  • 8. IT运维管理项目成熟度模型 从分散、无序、被动、粗放、事后被动处理的服务型转化为集中、有序、主动、精细、事前预警、以业务为中心的运营型。
  • 9. 目录运维管理存在的问题 用友ITOM3运维管理解决方案
  • 10. 基础资源监控 目标:保障业务系统及IT基础架构的高可用性,提前预警,网络不断,系统不瘫,数据不丢! 手段:建立运行维护一体化监控平台 运维服务管理 目标:建立运维服务管理体系,规范并减少工作量,提高运维服务工作效率 手段:建立基于ITIL、ITSS、ISO2000的服务流程管理平台运维管理一体化平台目标 一体化、 可视化、可控化、自动化
  • 11. 监控管理体系拓扑管理故障管理配置管理性能管理资源管理终端安全管理数据库审计报表管理统一事件平台操作维护体系集中巡检操作自动化服务管理体系配置管理变更管理知识库管理发布管理作业计划值班管理项目管理资产管理工作流引擎服务台问题管理事件管理综合分析体系服务质量管理服务水平管理知识库管理服务体验分析绩效考核网络效能评估资产规划资产分析数据仓库/报表分析引擎统一运维展现门户门户管理单点登录综合报表搜索服务界面集成综合呈现统一资源配置库(CMDB)统一采集(NM3/BM3/ASM/DBAudit/AGENT…)网络设备服务器数据库中间件业务应用4A管理统一账号管理统一认证管理统一授权管理统一审计管理用友IT运维管理体系规划
  • 12. 用友ITOM运维管理逻辑架构终端安全管理 数据库审计系统应用监控 (BM3) 网络监控 (NM3)
  • 13. 基础资源监控层
  • 14. 用友ASM入网规范管理系统不必每台终端电脑安装客户端。 旁路接入方式,不改变用户现有网络结构,部署非常简单 具备对通过准入控制接入的电脑终端进行健康体检,对操作系统和病毒库补丁一键修复功能 嵌入式标准2U硬件,无需购买安装软件的服务器 双实名制认证,保证接入终端的合法性 支持思科的EOU、H3C的PORTAL/PORTAL+、PBR策略路由、L2-OOB-VG虚拟网关、DHCP强制、SNMP强制以及透明网桥等多种入网强制认证技术 支持双机热备和负载均衡内网版360+身份认证+访问控制“违规不入网、入网必合规”
  • 15. 入网规范管理
  • 16. 用友DM3产品---桌面管理平台软硬件资产管理 移动存储介质管理 安全检查及加固 补丁分发、标准化管理 应用程序、进程管理 网络异常、端口、网站访问控制 非法外联管理 远程维护 行为审计
  • 17. 用友DM3
  • 18. 用友NM3网络管理系统拓扑发现--自动、准确、及时地发现各类异构复杂网络的拓扑结构 故障管理--持续地监视、报告网络的运行情况 性能管理--提供网络运行状态和性能的多角度分析与统计 安全管理--拦截非法接入,保障网络系统安全 协议分析--监控异常流量及ARP欺骗等病毒
  • 19. 网络监测
  • 20. 用友BM3业务应用管理系统资源监测子系统 监控企业的服务器、中间件、数据库、业务应用、安全设备及基础支撑系统(如机房、空调、UPS等)的运行状况;建立性能基线;发现系统异常并及时告警。 运行展现子系统 围绕IT业务和IT资源,采用人性化多层导航呈现模式,由全局到局部、由粗线条到细颗粒度地逐层展现业务应用的运行状况。
  • 21. 业务视图通过业务视图快速定位故障、评价业务运行质量业务模型:通过对业务部件的关联分析,组成智能业务依赖模型,快速呈现判断业务问题的根源
  • 22. 用友EM3机房环境监控系统 机房立体视图、层级化展示 机房视频、温度、湿度监控 机房UPS电源、市电 机房烟感、漏水、门禁 机房IT设备
  • 23. 机房视图
  • 24. 用友DBAudit数据库审计系统完整审计数据库所有操作行为 数据库审计状况实施展现 中间件关联审计 内置多样的策略规则库 丰富的预警响应机制
  • 25. 数据库审计系统完备4W的审计要素详细信息展现前台用户与数据库操作关联前台用户与中间件访问的关联绑定变量审计详细信息使人员、操作、变量相关联数据库基于时间操作客户端、状态等所有条件组合查询,高速检索数据WhoWhenWhatWhere策略以4W为要素预警敏感表、字段等被访问可对返回的错误信息设定条件内置多种事件类型内置预警事件事件响应方式完全自定义系统提供三种攻击对象模型,监测危险事件数据库对象特征规则自定义报警级别特征库定期升级,应对最新安全事件
  • 26. 业务系统与用友OM3流程管理系统整合集成整合开发综合业务系统 法院审判管理、执行管理、信访管理等办案一体化平台 用友财政一体化平台 社保、税务、国土业务系统 其它一体化业务系统 ……用友OM3流程管理系统 服务台(工单) 事件、问题、变更、发布 流程引擎及表单自定义 知识库……为业务系统的快速推广和稳定运行保驾护航流程处理 业务终端用户上报问题集中记录、分类处理、按照ITIL标准流转、提高问题处理效率,提高业务终端满意度绩效评价 对终端使用人员、问题处理人员、项目实施质量、软件质量做全方位绩效评价,以数据说话,责权利清晰统计分析 所有问题按上报用户、问题类型、处理人、处理时长、处理结果、满意度等关键指标进行统计分析,辅助领导制定策略一键上报 业务终端使用问题、软件BUG、业务需求等各类问题,使用人员只需单击鼠标即可自动上报(包括用户信息、问题描述、自动截取问题屏幕等)业务系统故障台
  • 27. 业务系统故障台
  • 28. 运维服务管理层
  • 29. 用友ITOM3运维管理一体化平台统一展现、统一事件处理平台 统一资源与配置库 以ITIL规范为基准,提供系统的运维流程服务 服务台 事件管理、问题管理 变更与发布管理 配置管理 服务级别管理 日常作业管理、值班管理 服务外包管理 ……………
  • 30. 整体视图
  • 31. 事件驱动管理体系关联分析压缩归并标准化事件过滤SNMP TrapSyslogAgent第三方事件告 警 事 件配置变更触发 性能阈值触发关联规则策略rules告警库告警台告警通知自动化排障进入告警处理流程同步消除故障闭环故障管理业务系统故障台产生的问题
  • 32. 故障预警和自动化处理机制预警通知多样化 告警台 Email 短信、声音 Windows消息 预警通知策略化 什么类型的告警 来自哪里的告警 什么时间段的告警 可扩展的动作 自动处理策略(eg:重启进程等) 通知处理脚本
  • 33. 业务系统 应用系统 基础设备(各类硬件) 物理部件 链路资源 动态资源(IP地址域名) 人员账号 文档(规范、合同、技术、维护..)最佳配置模型设计经验资源配置管理
  • 34. 服务台
  • 35. 事件管理 目标是尽快修复故障,快速恢复业务,减少对业务的影响; 提高事件解决及时率,减少对业务的影响; 提高对IT基础环境的监控力度; 防止事件和服务请求的遗失; 提高CMDB信息的准确性; 提高用户满意度; 减少IT支持人员和用户之间的冲突。
  • 36. 问题管理(1)问题管理就是跟踪各类问题解决的过程,将问题的来源、种类、解决过程、相关的变更评估有效的记录下来,为今后的问题回顾提供依据。 (2)问题管理强调的是找出事故产生的根源,从而制定恰当的解决方案或防止其再次发生的预防措施。
  • 37. 变更管理
  • 38. 运维流程设计
  • 39. 作业管理(1)对日常运行维护工作进行管理,是一些周期性的、相对固定的日常维护作业的管理。 (2)其主要目的: 规范日常作业计划 规范日常作业内容 规范维护人员的维护行为 为人员考核提供基础数据
  • 40. 知识库知识的生命周期管理 共享运维经验 解放关键技术人员 降低 IT 工程师单点故障率 查询知识知识管理员工程师知识库解决方案用户查询知识知识审核/评级
  • 41. 运行分析
  • 42. 运维服务通过作业管理,标准化运维人员的日常维护工作 通过运维统计分析,对运维人员的服务质量进行考核。 通过运维统计分析,对业务问题故障的分类性质等进行统计,控制业务问题的产生
  • 43. 工作任务工作量统计 进度统计 费用统计 人力统计 工期统计 耗材统计 …
  • 44. 产品优势及特点资源监控与运维服务一体化平台 采用portal技术架构,克服了基础架构监控与运维服务管理的人为分割,实现集中管理、统一展示、统一配置、随需定制、分权使用。 层级化运维视图展现平台 以业务监控为核心,以事件为基础,将基础资源监控与业务服务贯穿在一起,建立从整体到局部、不同美观程度、满足不同对象及监控要求的层级化IT运维视图。 基础架构监控与业务系统整合的统一运维故障台 对各类业务系统使用、软件BUG、新需求和基础架构监控告警实现统一上报、集中流程化处理、分类统计、服务水平管理。 应需而动,随需而变可维护平台 置基于flex展现方式的灵动视图编辑器及动态表单和工作流引擎,实现视图化、仪表化、智能化、应需而动、随需而变导航管理。 全面深入、实时精细的综合监控平台 对各类基础架构元素性能、故障、配置进行全方位、个性化的监视和控制策略配置,针对用友财政产品提供专业化、深入、全面的运行监控。 全方位、灵活的IT资源管理平台 自动发现的IT资源数据库(RDB)与流程管理配置管理库(CMDB)的定期同步,实现资源管理数据的整个生命周期的管理。 全面、及时、准确的综合事件平台 各类基础架构的故障、性能、配置事件汇总并通过规则策略库(rules)和服务依赖模型 (iBDM),提供高效灵活的事件压缩、过滤、关联能力。
  • 45. 监测能力平台提供了上百种监测器,让用户从容应对复杂、异构的IT业务系统架构,通过全方位、细粒度的自动监测,让您时刻掌握系统运行状况,准确量化业务运行质量。网络管理系统管理数据库管理SNMP智能网络/安全设备 CISCO设备 华为/H3C设备 中兴网络设备 北电网络设备 Foundry、AVAYA、DLink ...Windows操作系统 Linux各发行版本系统 HP-UX操作系统 AIX操作系统 SCO UNIX操作系统 FreeBSD操作系统 …Oracle数据库 SQLServer数据库 Sybase数据库 DB2数据库 Informix数据库 MySQL数据库 …中间件/平台管理WEB/邮件服务管理通用服务和资源IBM WebSphere业务中间件 BEA WebLogic业务中间件 IBM MQSeries 消息中间件 BEA Tuxedo 交易中间件 Tibco 消息业务中间件 Tomcat中间件 东方通TongWeb业务中间件 … JAVA平台监测 .Net平台监测 …Microsoft IIS WEB服务器 Apache WEB服务器 Microsoft Exchange 服务器 IBM Lotus Domino 通用HTTP/HTTPS URL内容监测 通用HTTP请求序列响应监测 通用Email服务监测 …DNS服务 FTP服务 LDAP目录服务 … 通用SNMP资源 ICMP节点资源监测 TCP端口监测 …基础运行环境其他优势/特性桌面业务终端 智能存储设备 备份作业监测 智能电源监测 机房环境监测(定制) …Syslog日志监测 Windows日志监测 第三方SNMP Trap接入 …强大监测插件体系,通过插件不断扩展监测器 灵活的监测时间调度机制 智能化的监测阈值模型 提供主机的代理Agent和远程监测模式供用户灵活选择
  • 46. 客户价值面向领导决策者 全面了解IT运行维护情况(连通率、可用性、各类报表、故障分析) 资产配置管理、理清资产台账。 梳理固化流程、建立运维规范、全面了解下属工作情况、持续提升运维管理水平 外包管理(外包流程、合同、过程监控) 辅助领导决策、降低成本 面向运维人员 全面监控IT基础架构运行、事前预警、确保网络不断、系统不瘫、数据不丢 帮助快速定位问题,优化问题处理流程、提高支持效率、摆脱救火队员角色 绩效及工作量统计分析、总结汇报有数据依据 实现运维知识的积累、沉淀和共享,降低IT运维管理对个人的依赖 各类性能及趋势报表,为优化IT环境提供科学依据
  • 47. Thank You !