唯品会运维平台建设的心路历程


唯品会运维平台建设的心路历程 王喜春 2016.6.7 Agenda  平台初始背景  运维平台建设  一些坑和感悟 平台初始背景 2013,那一年 • 单日订单均量13万+; • 会员数量5000万+; • 服务节点8000+台,应用域130+个; 2013,那一年 • 运维系统只有zabbix监控; • 管理资源依然靠史上最强大的excel; • 发布仍然是脚本级别,增量发布; 运维平台建设 运维平台建设 • who,why,when; • how; who • 把控系统安全各个层 面 • 和运维合作 • 经常需要到线上查东 西 • 上下线和他们相关• 专业技能强 • 有超级服务器权限 • 琐事杂事较多 运维 测试 安全开发 why when  测试——应用上下线,测试环境搭建  运维——解决故障,日常运维工作  开发——定位故障,日志分析  安全——漏洞巡检,审计审查 HOW 工具阶段 2013.05—2014.05 流程阶段 2014.05—2015.03 平台阶段 2015.03—至今 工具阶段系统 发布系统 监控告警系统 网管系统 cmdb1.0 生产回溯系统 业务展示系统 配置中心 工具阶段特点  生产回溯系统  业务展示系统 工具阶段特点  每个系统解决现实中的单一问题;  系统适应线上的标准,而不是改变;  快速迭代,不需要过多的设计;  系统的主要用户是运维人员。 工具阶段确定方向 监控 部署 自动化 流程阶段系统  流程类系统: 变更系统 事件系统 问题系统 goose系统  非流程类系统: cmdb2.0 流程阶段流程  变更流程:  事件流程:  goose流程: 流程阶段流程  发布流程: 流程阶段流程  监控流程: 故障处理 流程管控 创建故障单 是否解决? 服务台 关闭 故障诊断 推进故障处理 是否需要 问题根因? 故障管理 关闭 记录 解决方案 调查 问题根因 需要变更 彻底修复? 问题管理 关闭 变更 批准流程 创建 变更申请 变更管理 关闭 实施变更 报告问题 配置管理 事件 是否解决? N N N N Y Y Y Y 发布管理 知识与案例库 监控平台 流程阶段特点  系统与系统之间开始交互,通过流程关联;  有N多流程和N多规范,和管理者风格,组织结构有关;  流程系统为指标而生;  系统的用户是运维人员,测试人员和开发人员。 平台阶段系统  数据类系统: 容量系统 cmdb3.0  平台类系统: 监控平台 巡检系统 部署平台 运维自动化平台 平台阶段系统  容量系统: 平台阶段系统  监控平台: 平台阶段系统  运维自动化平台: 平台阶段特点  系统开始融合,变少;  操作入口开始变得单一;  流程开始固化在系统之中;  系统的主要用户由运维变为开发,测试。 Others  安全在各个阶段都有渗入,安全评审;  平台阶段之后是智能运维阶段; 一些坑和感悟 ITIL OR DEVOPS? 1,前期最好选择ITIL作为运维实践的标准; 2,不急于转变,顺势而为; 标准化 or 快速执行? 1,标准化不是系统实行的绝对前提条件; 2,边开发系统,边促进标准化执行; 3,系统要从标准的适应者变为标准制定者; 谢谢大家
还剩29页未读

继续阅读

下载pdf到电脑,查找使用更方便

pdf的实际排版效果,会与网站的显示效果略有不同!!

需要 10 金币 [ 分享pdf获得金币 ] 0 人已下载

下载pdf

pdf贡献者

antgril

贡献于2018-06-06

下载需要 10 金币 [金币充值 ]
亲,您也可以通过 分享原创pdf 来获得金币奖励!
下载pdf