京东/云平台何小锋-京东Docker实践

2020-02-27 444浏览

  • 1.G O P S 2016 全 球 运 维 大 会 · 深 圳 站 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 2.京东Docker实践 何小峰 京东/云平台 G O P S 2016 全 球 运 维 大 会 · 深 圳 站 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 3.议题 1 京东容器之路 2 弹性计算架构 3 弹性计算应用场景 4 自动化运维 5 数据驱动的精细化运营 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 4.面临的挑战 硬件采购周期长,交付效率不高; 不能准确评估资源使用情况,无法精细化运营; 硬件成倍增长,成本高; 扩容慢,压力来的时候不能快速扩容; 部署环境复杂,运维压力大; G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 5.用户关注 稳定性 性能 用户习惯 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 6.容器化之路 2013 至今 2014Q4 2015Q1 弹性计算 平台 2015/6/18 弹性落地 10000+ 全面推广 100000+ G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 7.选择Docker的原因 轻量 Docker 安全性 要求不高 高性能 快速部署 高稳定性 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 8.议题 1 京东容器之路 2 弹性计算架构 3 弹性计算应用场景 4 自动化运维 5 数据驱动的精细化运营 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 9.弹性计算架构 业务系统 应用平台(CAP) (部署集成、弹性伸缩) 基础平台(JDOS) (OpenStack+Docker+JFS+OVS) IDC资源 弹性计算平台 = JDOS(JD Datacenter OS)+CAP(Cloud Application Platform)。 JDOS实现实现基础设施(网络,物理机,存储)的资源管理、容器的生命周期管理、 监控指标采集; CAP负责应用治理、部署、监控报警、资源利用率统计、手动和自动的弹性伸缩。 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 10.OpenStack 01 成熟度 很成熟,社区非常活跃 02 快速交付 积累了很多经验,快速交 付成果 G O P S 2016 全 球 运 维 大 会 · 深 圳 站 03 一套架构 公有云和私有云一套架构 。Windows虚拟机需求
  • 11.网络(OVS/VLan)  为了兼容现在的基础设施系统,满足用户习惯,每个容器都有独立的IP。  禁用了Docker网络,采用Neutron集成OVS;  优化OVS,提升网络小包延迟,提升性能; G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 12.存储 XFS 文件系统 JFS 块存储 数据卷 日志 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 13.镜像分层合并 变更频繁 变更少 变更很少 应用层 基础层 OS层 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 14.镜像中心 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 15.配置中心 App:CAPGroup:V2Env:Production 正式环境 分组1 配置中心 测试环境 分组1 正式环境 分组2 一个镜像部署到多个环境中,根据应用、环境和分组从配 置中心拉取配置。 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 16.CAP 架构 核心是一套工作流,基于Zookeeper分布式调度引擎来实现。能动态注册发现节点; 能控制单个节点并发任务数,失败重试次数,确保同一应用互斥任务串行执行。 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 17.调度流程 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 18.弹性扩容流程 应用在启动之前可能需要数据库授权,启动之后需要挂载VIP,注册统一监控和 统一日志。如何能自动发现应用的注册信息,采用了模版方式。应用先申请一个 容器,手工注册这些信息,后续的扩容会以该容器为模版来进行自动注册 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 19.故障迁移流程 当遇到容器或物理机故障,需要进行快速的迁移,迁移后的容器需要保持原有的 IP,避免还要重新申请授权。 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 20.弹性调度算法 G O P S 2016 全 球 运 维 大 会 · 深 圳 站  调度单元是应用分组在一个机房的 实例。  根据应用分组在指定机房的整体负 载情况,预测下一时刻负载来进行 弹性。
  • 21.议题 1 京东容器之路 2 弹性计算架构 3 弹性计算应用场景 4 自动化运维 5 数据驱动的精细化运营 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 22.应用场景  京东弹性云经过618和双11的大流量考验,新机房以弹性云作为基础架构;  核心应用如:网站,交易,订单履约,配送,售后,无线,拍拍,金融, O2O等等平稳运行在容器上 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 23.议题 1 京东容器之路 2 弹性计算架构 3 弹性计算应用场景 4 自动化运维 5 数据驱动的精细化运营 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 24.系统监控指标 CPU占用 内存占用 网络流入 连接数 指标 网络流出 系统负载 磁盘占用 存活 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 25.监控架构 指标数据带有明显的时间特性,每日数据上亿,采用了成熟的OpenTSDB方案。 提供了从应用和实例多个维度查看负载情况,满足用户的需求。 可以对应用配置警策略,进行短信或邮件报警。 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 26.监控页面 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 27.报警策略 系统提供了默认的报警策略。 可以对应用关注的监控指标进行个性化设置。 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 28.一键水平扩容 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 29.一键垂直扩容 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 30.一键水平缩容 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 31.一键垂直缩容 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 32.宕机探测架构 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 33.硬件故障探测 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 34.故障通知 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 35.应用部署巡检  定期巡检应用容器部署情况,邮件报告; 超载 01 未部署 02 规格不一致 03  单个机房部署过多  单个交换机部署过 多  单个物理机部署过 多  申请的容器没有使用  容器规格不均匀,可能 造成流量负载不均匀 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 36.议题 1 京东容器之路 2 弹性计算架构 3 弹性计算应用场景 4 自动化运维 5 数据驱动的精细化运营 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 37.资源利用率 容器 应用 部门 以小时为单位, 计算容器资源 最大使用率 根据应用和容 器的关系,统 计应用资源使 用率 根据负责人、 部门、应用 和容器的关 系,统计部 门资源使用 率 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 38.容器资源利用率 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 39.应用资源利用率 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 40.部门资源利用率 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 41.资源剩余情况 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 42.配额管理 G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 43.实践经验  无状态,同时对磁盘IO要求不高的应用,很适合部署到弹性云;  微服务应用由于能自动服务注册发现,辅助均衡,非常适合部署到弹性云  推荐万兆网络和网卡,避免网络共享出现资源竞争;  稳定的操作系统版本;  推荐高配置物理机,合理得CPU和内存比,便于充分利用资源;  采购高质量的交换机和物理机; G O P S 2016 全 球 运 维 大 会 · 深 圳 站
  • 44.谢谢 G O P S 2016 全 球 运 维 大 会 · 深 圳 站