专业运维的最佳实践探索


专业运维的 最佳实践探索 萧田国 触控科技 个人介绍 萧田国,触控科技运维总监 ACMUG核心成员 InfoQ专栏作者【高效运维最佳实践】 70% 高效运维最佳实践 •  InfoQ官网 –  第1篇:七字诀,不再憋屈的运维 Top 3 @40天榜 –  第2篇:员工的四大误区及解决之道 Top 5 @10天榜 –  第3篇:Redis集群技术及Codis实践 Top 2 @10天榜 Top 5 @40天榜 •  微信朋友圈 –  3篇UV均过万,第1篇为1.7万 SaaS PaaS IaaS 奇点 暴风雨 留给运维的时间已经不多了 运维 危机 OaaS 我们必不可停止探索, 而一切探索的尽头, 就是重回起点, 并对起点有首次般的了解。 ——艾略特(英国) 四个问题 •  运维的贡献是什么? •  专业,谁说了算? 组织的成果 产生于组织外部 --彼得   德鲁克 •  运维的两大问题 分享内容 1、什么是专业? 2、为什么难以专业? 3、管理的专业化 4、技术的专业化 简单 技术透明 快速交付 过程预警 稳定 方便 可 依赖 快 人为事故多 故障多 推诿!被团团转! 资源申请太麻烦! 老犯同样的错 需求老不及时做完 老不知道找谁?! 做不完也不说! 不专业的 不专业的 专业的 故障时间长 专业不专业 专业不专业 ✖24h ✔10m 专业不专业 分享内容 1、什么是专业? 2、为什么难以专业? 3、管理的专业化 4、技术的专业化 •  分工不明确 •  职责不清楚 •  考核不量化 •  流程不合理 •  缺规范 •  少文档 多米诺骨牌效应 •  源自管理者 –  人员错配 –  时间错配 •  源自员工 –  时间错配 资源错配 未转变思维模式 忘记自己是管理者 忘记自己技术身份 过分转变思维模式 //沉迷解决技术问题 //一心扑在管理上 //沉迷单个业务模块 //分不清轻重缓急 //混淆技术进步&业务要求 自查有多难 •  “对运维操作要有敬畏之心” 分享内容 1、什么是专业? 2、为什么难以专业? 3、管理的专业化 4、技术的专业化 部门级 小组级 员工级 •  三个层次,逐层拆解 分工/职责/KPI 分工 职责 KPI 系统稳定 项目支持 成本控制 无故障率99.9% 客户满意度达标 费用控制达标 外网运维 部门级 分工/职责/KPI 运维经理责任制 •  实施之前 运维经理责任制 单一接口 对外透明 客户满意 度评定 •  完善的运维文档 –  故障响应及处理流程 –  部署/更新、值班文档 •  检查确认单 •  各种紧急应急方案 •  故障案例库、严格惩罚 –  防微杜渐、经常温习 更专业 没有不出问题 的机房 【检查确认单】 •  故障时间: •  故障影响: •  故障现象: •  故障原因: •  解决过程: •  后续措施: 【故障通报】 措施1,责任人,完成日期 措施2,责任人,完成日期 推进产生价值 【不要让流程吞噬责任】 流程的价值,在于能规避一些人性的弱点; 但拘泥于流程,则同样会埋葬人性的光辉 ——责任感, 以及基于责任才会迸发的判断力与行动力。 •  执行力: ü  Deadline、过程预警。 ü  一催二逼三请饭。 分享内容 1、什么是专业? 2、为什么难以专业? 3、管理的专业化 4、技术的专业化 技术专业化 减少故障次数 缩短故障时长 适度 技术服务业务 Redis的专业化运维 技术进步 & 业务要求 Twemproxy Codis •  支持缩容/扩容 •  可视化运维 •  开源 •  By 豌豆荚 Docker的专业化运维 •  Web前端 不足? 技术专业化 减少故障次数 缩短故障时长 适度 技术服务业务 Twemproxy Codis 专业服务 •  技术服务业务、放下姿态 •  不要被技术搞、少重复造轮子 •  技术是专业的最大障碍 3个石匠的故事: 1:我在养家糊口。 2:我在做全国最好的石匠活。 3:我在建造一座大教堂。 OaaS 意识 技巧 能力 生死攸关 问题&讨论 个人微信号 xiaotianguo,或扫我 高效运维最佳实践 @InfoQ @InfoQ infoqchina
还剩36页未读

继续阅读

下载pdf到电脑,查找使用更方便

pdf的实际排版效果,会与网站的显示效果略有不同!!

需要 10 金币 [ 分享pdf获得金币 ] 0 人已下载

下载pdf

pdf贡献者

1125281337

贡献于2017-01-01

下载需要 10 金币 [金币充值 ]
亲,您也可以通过 分享原创pdf 来获得金币奖励!
下载pdf