QCon上海2015 云时代运维转型:工具化,产品化,运营化 钟红军

2020-03-01 243浏览

  • 1.
  • 2.2015-10-15
  • 3.工具化,产品化,运营化 云时代运维转型摸索
  • 4.演讲者介绍 钟红军 2013年加入点评,在点评负责系统网络,业 务运维,数据库,安全,自动化开发,企业IT 等。
  • 5.核心内容 大众点评网  最近两年来  业务运维 “面向运营” 的转变
  • 6.1. 工具化 从问题开始!
  • 7.工具化之前的问题  手工操作:繁琐,不统一  容易出错,无成就感  无法快速交付
  • 8.工具化建设思路  用户应包括整个公司研发队伍  形成层次化的开发(普通运维参与开发)  自动化比例要达到80%以上
  • 9.两年的工具开发成果
  • 10.工具之间的架构关系 Workflow 流程系统 Cmdb CAT 监控系统 架构出品 Go 操控平台
  • 11.简单的思考 工具化/自动化解决的问题是什么? 效 率
  • 12.带来的问题 失 控  工具开发管理的失控  工具使用本身的失控  工具所产生的信息的失控
  • 13.2. 产品化 解决工具化带来的问题
  • 14.运维工具 常见不足  工具主要是重视功能实现,不太重视使用体验  工具不太注重多个工具之间的关联  工具通常不注重使用统计和报表  工具往往在开发管理方面不太严谨
  • 15.对“产品”的粗浅理解  Service + 接口 + UI 三者分离  多个工具之间 数据和功能打通  注重用户的操作体验  自带报表  用类似 业务研发 的方式来管理
  • 16.3. 运营化 产品化后发生的延续
  • 17.运营化分两块  运维工具产品的运营化  运维本身的运营化
  • 18.工具产品运营的思路  运营指标  功能 VS 技术难度 VS 内容  宣传推广(考核 PV )
  • 19.常见运营指标  workflow:覆盖率,平均单执行时长,自动化比 例,自动化成功率 CMDB:数据准确率  发布系统:发布效率;发布成功率
  • 20.重视运营推广 事件运营  发生热点事件时趁机推广 老板运营  总监在各种场合不忘推广自己产品 推广策略  比如,新功能何时推出才能获得最大反响?  能否同时推出两个新的运维工具?
  • 21.运维的运营化  再进一步:运维的运营化  何谓“运营”
  • 22.对“运营”的粗浅理解  精心打造数据和内容,  以一定的策略(类似营销),  去影响目标人群,  促成目标人群采取我们期望的行动  并达成期望的成果
  • 23.几个要点  数据一直都在,如何理解和运用  结果靠“目标人群”去达成  目标人群就是业务研发团队
  • 24.说人话!  把运维的结果表示为一系列数字  不断的去推动整个技术团队改进这些数字 线上环境的“质量运营”
  • 25.介绍DOM 运维与研发质量平台目的:  建设一套可多方位和多层次描述线上运营质量的 指标体系  从海量的监控数据中实时的提取
  • 26.DOM功能概览  服务运行数据  端到端成功率  数据库指标  资源利用  上线发布数据
  • 27.个人报表定制
  • 28.服务运行数据  可用性  响应时间  概要 详情  对比 查询
  • 29.APP端到端成功率
  • 30.Dom 的红黑榜举例  容量监控  绿帽子与出轨  慢查询  红黑榜
  • 31.DB容量指标
  • 32.“监控”和“质量运营”的区别 目的不同  监控 关注 具体问题的解决,运营关注 能力的持续提高 关注对象不同  普通技术人员更关注监控,技术leader更关注运营指标 数据不同  监控是实时详细数据,运营是提炼的有针对性指标 效果不同  再好的监控,不会导致问题的减少
  • 33.结果提升
  • 34.结果提升
  • 35.职责改变 运维团队构成的变化  线上环境质量运营  工具产品的开发运营  DO分离的O(逐步减少、云化) 与研发团队关系的变化  被动 VS 主动
  • 36.总结思考 两年来,我们发生了哪些转变?
  • 37.工作内容的转变 工具化 产品 化 运营化
  • 38.团队构成的转变 运维 业务运维 开发 产品 运营
  • 39.做事方式的变化 面向功能 注重推广 持续运营
  • 40.合作团队关系的变化 流程驱动 事故驱动 数据驱动
  • 41.云时代运维的转型  转型是动态持续过程  不能预见“转折点”,但可预见大方向
  • 42.云时代运维的转型 我们的方向是 “面向运营”  更直接的为公司业务发展提供价值  核心使命是持续提高各运营指标  “去边缘化”和所谓“运维特殊性”
  • 43.举个栗子 运维部署一套新的分布式存储 之前  该存储有多少机器,多少存储,多少iops 现在  该存储提高了图片保存成功率多少,图片的下载 速度 多少
  • 44.结束语  运维领导者,应意识到转型无时不在。不断的抛弃 和转变  转型的目标:不断逼近业务核心价值,并持续运营
  • 45.谢谢大家! 祝大家在云时代 成功成为 一个价值更大的运维
  • 46.