腾讯游戏 运维总监洪楷-腾讯游戏运维服务体系

2020-02-27 284浏览

  • 1.腾讯游戏运维服务体系实践 洪楷 腾讯游戏 运维总监 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 2.个人简介 洪楷 KemHong 腾讯自研游戏业务运维总监 • 专注海量运维、高可用以及自动化运维等相关技术,致力于提升业务运维的自动化,建设运维岗位价值体系,通 过运维服务整体提升团队价值和技术能力。 • 负责运营商SP网关开发工作,涉及计费平台、网络间通讯平台构建和持续集成 • 腾讯十年: • 负责腾讯TBOSS平台的平台设计以及运维系统开发设计以及运维工作,见证TBOSS从1.0到3.0的成长,并 在多次平台升级以及故障中得以锤炼。 • 腾讯游戏代理、自研&引领云梯运维服务团队 • 爱好: • 游泳、旅行、美食 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 3.目录 1 定义运维服务 2 腾讯游戏运维服务体系 3 游戏行业的开合服看服务实战 4 从内部用户到外部用户-版本服务案例 5 微服务引入-下载服务实战进阶 6 “智能+”与“微”服务 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 4.定义运维服务 运维基础服务:“发布、变更、故障处理”+SLA(安全、成本) 运维服务+:被你的产品或你服务的团队关注并且产生增值价值点,可计价 用户关注 G O P S 2016 全 球 运 维 大 会 · 北 京 站 增值效益 可计价
  • 5.为什么? 用户关注 增值效益 ? 可计价 幕后到台前,用户现在关注才会关心 用户潜在关注的才拥有更多核心价值 本份事情打基础,增值效益才体现核心竞争力 做任何事情都必须有价值,可衡量才可以对比 有价值才能够更让团队有动力 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 6.目录 1 定义运维服务 2 腾讯游戏运维服务体系 3 游戏行业的开合服看服务实战 4 从内部用户到外部用户-版本服务案例 5 微服务引入-下载服务实战进阶 6 “智能+”与“微”服务 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 7.腾讯游戏运维服务体系全貌 游戏运维服务体系进阶 版本服务 重例紧 大行急 版版版 本本本 场景工具 用户体验优化服务 玩玩 游 家家 VI 戏 登付 P 下内 陆费 用 载体 体体 户 优验 验验 关 化提 提提 怀 升 升升 场景工具 业务安全保障服务 软 硬攻 游操 件击 戏游 作 安发 特戏 安 全现 性对 全 漏与 监 账 场景洞工具防 审 测计 检范 测 SaaS 运营 运营 支撑 支撑 系统 系统 工具 工具 …… ABA B 运营活动服务 运营成本控制与优化服务 PaaS API 网关 & 服务总线 管 前 后 调配 作 数 控 端 台 度 置 业 设据 开 平服 台 扩务 框 冲架 服 周务 服 务 服 务 备务服 合成 缩 在年 区 容 AP线P Eng庆ine + Docker本 场景工具 优 化 … 带 宽 成 本 优 化 基础 DB 架构 Tdoc ker 网络 支撑 安全 防护 …… G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 8.目录 1 定义运维服务 2 腾讯游戏运维服务体系 3 游戏行业的开合服看服务实战 4 从内部用户到外部用户-版本服务案例 5 微服务引入-下载服务实战进阶 6 “智能+”与“微”服务 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 9.游戏行业的开合服看服务实战 特点 通过之前积累的数据,产品运营跟踪 开服后的效果,调整开服时间,开服 策略,运营策略等,达到既能让老区 玩家对游戏的某些玩法还能够顺利进 行,同时后来新进的玩家也追赶不至 于过于困难。 特点 导量速度一般会很猛,需要人力盯着 导量情况。新区的开放也一般是人工 判断,手动执行。 上线 初期 精细 运营 期 导量 稳定 期 G O P S 2016 全 球 运 维 大 会 · 北 京 站 合服 期 特点 单服人数低于某个量后,玩家流失速 度会非常块,游戏中一些核心团队 PVP玩法也会受到影响,业务一般通 过合服降低流失。 特点 每周的放量基本固定,已经不需要人 工操作,有的业务设定注册量,到量 后自动开新区,有的业务则会固定每 周的开放时间。
  • 10.游戏行业的开合服看服务实战 开服 手动开服 在智慧雪球项目组通过人工点击开服按钮,调后台任务自动完成大区对外开放操 作 自动开服 根据项目组制定的开服策略,如PCU或注册其中一项达到阈值,则调后台任务自 动完成大区对外开放操作,全程无人工干预。APP会有每天开服数量和开服时间 间隔限制 定时开服 项目组在智慧雪球上配置定时开服任务,到点即开服。当定时开服与手动、自动 开服冲突时,以手动、自动开服优先 G O P S 2016 全 球 运 维 大 会 · 北 京 站 运维场景 开服时长 2016 5分钟
  • 11.游戏行业的开合服看服务实战-开服进阶 PCU与注册 游戏区服 池子 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 12.游戏行业的开合服看服务实战-合服 项目组 运营团 队提交 需求 开发提 供数据 合并工 具 运营团 队提供 合服的 N合M 运维团 队挑选 合适服 务器 运维执 行工具 运维场景 合服时长 2016 2~3小时 数据合 并 正式对 外 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 13.游戏行业的开合服看服务实战-合服 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 14.游戏行业的开合服看服务实战-合服 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 15.游戏行业的开合服看服务实战-合服进阶 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 16.游戏行业的开合服看服务实战-合服进阶 合服聚类基础架构: 接入层 计算层 (Kmeans算法) 存储层 上报数据集 经分 /TDW/Mysql 聚类结果展示 数据转换/加权/初始化 数据计算/汇聚 DB G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 17.游戏行业的开合服看服务实战-合服进阶 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 18.游戏行业的开合服看服务实战-合服进阶 1064 业务累计合服次数 129 合服预估累计使用次数 G O P S 2016 全 球 运 维 大 会 · 北 京 站 260H 合服累计节约时间 250 大区对外开放累计执行次数 238 合服辅助决策累计使用次数 7368 推荐区服累计执行次数
  • 19.服务建设过程中几个问题 挖掘出产品需求 产品需求不断变化 开发效率 G O P S 2016 全 球 运 维 大 会 · 北 京 站 敏捷试错
  • 20.服务建设过程中几个问题 快捷的代码 部署与验证 丰富的原子层 让组合更加灵活 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 21.内部用户 延伸 G O P S 2016 全 球 运 维 大 会 · 北 京 站 产品用户
  • 22.目录 1 定义运维服务 2 腾讯游戏运维服务体系 3 游戏行业的开合服看服务实战 4 从内部用户到外部用户-版本服务案例 5 微服务引入-下载服务实战进阶 6 “智能+”与“微”服务 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 23.从日常发布中看服务实战 发布运维场景 2012 2013 2016 发布时长 3-4小时 2-3小时 0.88小时 G O P S 2016 全 球 运 维 大 会 · 北 京 站 发布 时长 DAU 在线时长 在线 恢复时 长
  • 24.从日常发布中看服务实战 玩家游 戏时间 纯用户行为 自动化 程度 在线恢 复时长 更新版 本包时 长 成本 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 25.从日常发布中看服务实战 在线恢复 时长优化 时间 自动化 更新成本 用户更 新版本 包所需 时长 版本发布时间点 更新包投放时间点 投放自动化 部署自动化 分发量 用户增量 在线恢复时 长优化 完整包 自动包 阉割版完整包 回流玩家和QQ网吧预推送 推动开发方进行资源精简和废弃资源清理 分发量、成本 停服后立即开启不限速更新 更新包分解拆包 预下载自动推送、错峰时间点预判 根据玩家平均在线时长分布计算预下载投放时间 时间 预下载多渠道推送 大区灰度、用户灰度 用户增量 P2P增量 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 26.从日常发布中看服务实战 用户和包量 200%+ 在线恢复时长 90% 带宽下降50% 2013H1 2013H2 2014H1 2014H2 2015 用户数(K) 包大小(K) 2016 2013H1 2013H2 2014H1 2014H2 2015 消耗带宽 在线恢复时长 2016 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 27.从日常发布中看服务实战 业务A 业务B 业务C 业务N 版本需求 服务报告 部署 灰度控制 包制作 版本质量 质量监测 成本监测 拆包 完整包管理 更新包管理 用户数据 推送时间 推送渠道 自动推送 版本质量 数据采集 SaaS 部署 自动 化 定时 任务 管理 打包 工具 数据 统计 …… PaaS API 网关 & 服务总线 管 前 后 调配 作 数 控 平 端 服 台 框 度 服 置 服 业 服 据 服 … 台 务 架 务务 务 务 APP Engine + Docker 基础 DB 架构 Tdoc ker 网络 支撑 安全 防护 …… G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 28.“用户”关注 增值效益 助力提升 DAU、在线时长 止步于此? 可计价 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 29.持续演进—核心问题 环节紧扣 依赖业务运维 更加复杂变化的需求 成本控制 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 30.持续演进—微服务的引入 Load Balancer 去中 解耦 独立 心化 合 演进 Service A WAR Cache DB Service B WAR Cache DB Service B WAR Service B WAR Cache DB G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 31.目录 1 定义运维服务 2 腾讯游戏运维服务体系 3 游戏行业的开合服看服务实战 4 从内部用户到外部用户-版本服务案例 5 微服务引入-下载服务实战进阶 6 “智能+”与“微”服务 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 32.持续演进—微服务的引入 服务分解(非原子) 消除依赖 成本细分 下载服务 包制作 版本管理 预下载渠道 投放 异常用户跟踪 实时数据 智能限速 防盗链跟踪 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 33.下载服务案例介绍—微服务思路 下载服务(衡量指标:下载成功 率、成本) 版本管 成功率 成本限 包制作 理 跟踪 速 优化前 下载服务(衡量指标:下载成功率、转化率、成本、最优速度) 包制作 普通 跨版 包更 本更 新新 最 新 版 本 管 理 预下载渠道投 放 异常用户跟踪 TG TCL 管 加速 鹰眼 玩家 白名 用户分级 P S 家 监测 单 关怀 实时数 智能限速 据 防盗 回源 链跟 更新 分钟 用户 单用 踪 秒级 地域 级 等级 户 优化后 专属 专属 礼包 VIP G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 34.持续演进—微服务的引入 灵活 可见收益 独立计价 独立演进 拓展 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 35.下载服务案例 转化率提升10%+ 5亿 玩家下载时长 下降60%+ 0 优化前 优化后 提升20%+ 玩家下载完成率 业务1 业务2 业务3 业务4 业务5 业务6 业务7 业务8 业务9 业务10 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 36.下载服务案例 实时数据 下载器 数据分析&控制 带宽数据 业务数据 下载后台管理 下载组件 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 37.服务更进一步,新挑战 最优速度 合理地下载时长 G O P S 2016 全 球 运 维 大 会 · 北 京 站 转化率 下载成功率 游戏道具礼包 下载取消/不转化 的用户
  • 38.问题? 礼包+ Who G O P S 2016 全 球 运 维 大 会 · 北 京 站 When What
  • 39.挑战 玩家 老玩家 新玩家 G O P S 2016 全 球 运 维 大 会 · 北 京 站 付费 等级 活跃程度 游戏类型 离开时长 游戏时长 … 付费 等级 游戏时长 回流时间 游戏类型 活跃
  • 40.WHO-用户分级 玩家等级与付费的分布关系 G O P S 2016 全 球 运 维 大 会 · 北 京 站 玩家等级成长分布图
  • 41.When—什么时候发“智能+“ 取消玩家下载完成比例分布图 X=当前完成率,Y=当前耗时,Z=当前下载速 率 拉格朗日函数 L ω, b, δ = 1 2 ω 2+ m δi 1 − yi ωTxi + b i 分类超平面 G O P S 2016 全 球 运 维 大 会 · 北 京 站 实时运算获得玩家下载过程中取消的概率
  • 42.What—发什么“智能+“ 道具ID 标签 A BC 0.5 0.8 0.1 道具ID 123 标 0.5 0.8 0.1 签 玩家 用 户 玩家道具消耗矩阵 基于隐因子模型的协同过滤推荐算法,确定单个下载玩家的礼包内容 结论举例:下载速度为1879KB/S、当前进度为5%、已下载 10分钟的玩家,在进度8%、15%和30%分别发送XX礼包 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 43.下载服务—“礼包+智能”效果展示 16.00% 14.00% 12.00% 10.00% 8.00% 6.00% 4.00% 2.00% 0.00% 业务1 业务2 下载完成率提升 业务3 转化率提升 业务4 下载转化率提升9%+ 下载完成率提升8%+ G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 44.目录 1 定义运维服务 2 腾讯游戏运维服务体系 3 游戏行业的开合服看服务实战 4 从内部用户到外部用户-版本服务案例 5 微服务引入-下载服务实战进阶 6 “智能+”与“微”服务 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 45.“智能+”&“微”服务 智能+ G O P S 2016 全 球 运 维 大 会 · 北 京 站 “微”服务
  • 46.“微”服务-无微不至 下载服务(最优、最新) 端游完整包(衡量指标:下载成功率、转化率、爬虫、成本、最 优速度) 端游更新包(衡量指标:成功率、成本、最优速度) 手游 更新 包 TGP 盗链 付费会员体系 更新包制作 预下 载 更新中 回源 更新 下发 CDN 合作 最新版 Ebit 智能 控速 封锁 媒体 本管理 加速 加速 P2P 失败 追踪 触达 玩家 自动 同步 跨版本 更新 TGP CDN 加速 Ebit 提速 P2P 失败 触达 跟踪 玩家 实时 专属下 专属下 数据 载器 载器 爬虫 爬虫 跟踪 跟踪 白名 白名 单单 心悦 专属 关怀 礼包 TCLS 白名 单 白名 单 管家 心悦 专属 关怀 礼包 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 47.“微”服务-无微不至 安装、登录服务 完整包安装(衡量指标: 成功率) 端游登录(衡量指标:成功率) 手游登录(衡量标准:成功率) 实时 数据 失败跟踪 自动 安装 TGP 网吧 TCLS MSDK MTCLS 手Q 微信 心悦 用户 关怀 触达 实时 数据 失败 跟踪 实时 数据 失败 跟踪 帐号 认证 选区 进入 游戏 失败跟踪 实时 失败 实时 失败 实时 实时 数据 跟踪 数据 跟踪 数据 数据 心悦 关怀 客户 心悦 快速 网络 端依 心悦 触达 关怀 登录 调优 赖优 关怀 玩家 化 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 48.“微”服务-无微不至 上线初期 手动开服 自动开服 大区状态更新 大区状态更新 自动推荐 数据 展示 开服 方案 开服数 量辅助 决策 预估 承载 PCU 自动推荐 数据 展示 开服 方案 开服数 量辅助 决策 预估 承载 PCU 开服服务 稳定运营期 定时开服 自动开服 大区状态更新 大区状态更新 自动状态更新 开服时间分 析 留存 LTV 效果 效果 灌服 时间 预估 分天注册玩家平衡 分析 等级 分布 战力 差距 根据单 区实际 数据智 能补偿 自动推荐 开服时间分 析 留存 LTV 效果 效果 灌服 时间 预估 分天注册玩家平衡 分析 等级 分布 战力 差距 根据单 区实际 数据智 能补偿 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 49.运维服务+智能进行更深领域探索 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 50.游戏运维服务进阶 保护 感知 呈现 分析 执行 决策 文化 人才 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 51.DevOpsDays 即将首次登陆中国 DevOps 之父 Patrick Debois 与您相约 DevOpsDays 北京站 2017年3月18日 门票早鸟价仅限前100名,请从速哟http://2017-beijing.devopsdayschina.org/G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 52.想第一时间看到 高效运维社区公众号 的好文章吗? 请打开高效运维社区公众号,点击右上角小人,如右侧所示设置就好 G O P S 2016 全 球 运 维 大 会 · 北 京 站
  • 53.G O P S 2016 全 球 运 维 大 会 · 北 京 站 Thanks 高效运维社区 开放运维联盟 荣誉出品