阿里巴巴基础运维平台实践 FCNUTCon2017 songjian

2020-03-01 272浏览

  • 1.阿里巴巴w础运维平台实践 宋健C宋意D
  • 2.
  • 3.
  • 4.
  • 5.关O我 • 姓o:宋健C宋意D • 现任:运维M台E技术K家 • 负责:w础运维平台 • 经k: 2008 某企L独立负责服is与网络运维 2010 T无到有建立支U宝监控体系 2012 推动阿里集t监控体系统一 2014 负责运维工c&线IPEt队 2016 负责w础运维平台
  • 6.阿里运维体系 w础运维平台 StarAgent Ծߝຝ຅! ᔮᕹຝ຅! ೴౴/ᳯ᷌! StarOps Ծߝቘஷ! Ծߝ‫ۑ‬ᚆ!
  • 7.问题 • 百万级规模服is运维体系如何设计G
  • 8.对比 ๐‫࢏ۓ‬ᥢཛྷ ᇙᅩ ૡٍ ‫̵܈‬ጯ! ᓌ‫̵ܔ‬ො‫!׎‬ ᚕ๜̵ԯᛔଃ! ‫̵܉‬ӡ! පሲ̵ᑞਧ! ୏რ(puppet/salt/ansible)! ‫܈‬ӡ̵ጯӡ! ਞ‫̵ق‬ᑞਧ̵௔ᚆ! ᛔᎸҁ‫੶ړ‬҂!
  • 9.阿里运维体系 ॠሞ! ඪ՞ਪ! ោề! ṛ஛! Ⴃਪ! ᴨ᯾ԯ! սᯡ! ……! ଫአ/හഝପ/Ӿᳵկ ᬩᖌ! ਞ‫֛ق‬ᔮ! चᏐᬩᖌଘ‫ݣ‬-StarAgent! ๐‫!࢏ۓ‬ ๐‫!࢏ۓ‬ ๐‫!࢏ۓ‬
  • 10.w础运维平台
  • 11.StarAgent ጯӡᕆ๐‫࢏ۓ‬ᬩᖌ᭗᭲! • ‫ق‬ᗑࠔӞᓕഴ᭗᭲҅๦ᴴᦡᗝ̵඙֢ਭᦇ̶! • Ԇ๢ᯈᗝ҅Agent̵ᚕ๜̵ᨴ‫̵ݩ‬ਧ෸ձ‫ۓ‬ᒵ̶! ᨽᑯ๐‫࢏ۓ‬ኞ޸ޮ๗! • ᩒԾ໐੒! • OSਞᤰ! • ଫአ‫!૲ݎ‬ • ଫአፊഴ! • ෭ଉᬩᖌ! • ……!
  • 12.产r架构 运维系统/运维人p Portal/API/CLI w础功能 插X功能 命W通道 运维市u /EB终端 监控 日志 安全 数据通道 文X通道 定时任i 硬X 调度 … 管控通道 服is Agent! 插X平台 服is Agent! 服is Agent!
  • 13.系统架构 ! Portal! ! ! ! Config Service! Proxy Cluster! ! IDC 1! Agent! Channel Cluster! ! ! ! ! Agent! ! IDC …! Agent! Agent! Channel Cluster! ! ! ! ! Agent! ! Agent!
  • 14.功能 API! • Cmd! • Plugin! • File! • Store! • Cron! • Action! Portal! • ᬩᖌ૱࣋! • WEBᕣᒒ! • ෈կ‫!ݎړ‬ • ਧ෸ձ‫!ۓ‬ • Ԇ๢ᨴ‫!ݩ‬ • APIᨴ‫!ݩ‬ Agent! • Hostinfo! • හഝ᭗᭲! • ीᰁ෭ப[ൊ կ]! • P2P෈կ[ൊ կ]!
  • 15.数据 • API调用量:1亿+/x • 系统能力:50万台/e • 管理服is能力:百万级 • 插X数量:150+ • Agent性能:mem<20m cpu<2% • 支持linux/windowsN流l行版
  • 16.挑战 ᑞਧ! ਞ‫!ق‬ ሾह! ‫ݶ‬उ‫݌‬๢಄! ṛ‫޸ܧ‬եᴥෙ! ፊഴහഝ಑᭗! ୑ࣈग़Ӿஞ! ‫ق‬᱾᪠‫ੂے‬ᓋ‫!ݷ‬ चᏐ‫௳מ‬᯻ᵞᑕଧ! ݄ਂ‫ؙ‬୩ׁᩢ! ޸եฉ੘!
  • 17.问题
  • 18.解d ᔮᕹᳯ᷌! • ‫૲ړ‬ୗၾ௳ຝ຅! • ᛔۖಘᖽ਻̵ᛔۖᨮ᫹࣐ᤍ! ሾहᳯ᷌! • ಑᭗ፊഴහഝ҅ᛔۖᬬࢧ๢࢏ᇫா̶! • ᰓᰓ๢࢏Ոᛔۗ᦬ෙ̶! ᥢ᝜ᳯ᷌! • വۖ‫ګ‬ਧᕹӞᥢ‫!ڞ‬ • ᰒ੒ᥢ‫ڞ‬൉‫׀‬ੜૡٍ!
  • 19.StarOps Ӟᒊୗᬩᖌଘ‫!ݣ‬
  • 20.产r理念 ຽ‫ٵ‬۸! 传统运维 (ODe离 ᛔۖ۸! ฬᚆ۸! 新v运维 (DevOps
  • 21.产r边界 运维线 运行 监控 研l线 项目 V码 测试 构建 l布 配置 资源
  • 22.产r功能 Portal/API/CLI 资源 管理 配置 管理 l布 服i 监控 服i 运行 管理 AGE)T a有P 私有P LinuA/UniA//indows XE)/KV(/DockerB LinuA/UniA//indows XE)/KV(/DockerB 安全 管理
  • 23.
  • 24.联系我 • 钉钉n:songjian • 微信n:ipython