IT运维分析与日志搜索分析 引擎案例分析
2020-02-27 273浏览
- 1.IT运维分析与日志搜索分析 引擎案例分析 日志易CEO 陈军
- 2.提纲 IT 运维分析(IT Operation Analytics) 不同数据源及解决方案对比 日志处理技术的演进 日志搜索分析引擎详解 日志搜索分析引擎案例
- 3.IT 运维分析 ª 从 IT Operation Management (ITOM) 到 IT Operation Analytics (ITOA) ª 大数据技术应用于IT运维,通过数据分析提升IT运维效率 • 可用性监控 • 应用性能监控 • 故障根源分析 • 安全审计 ª Gartner估计,到2017年15%的大企业会积极使用ITOA; 而在2014年这一数字只有5%
- 4.ITOA 的四种数据来源 ª 机器数据(Machine Data) • 日志 ª 通信数据(Wire Data) • 网络抓包,流量分析 ª 代理数据(Agent Data) • 在 .NET/Java/Ruby/Python/PHP 字节码里插入代码,统计函数调用、堆栈使 用 ª 探针数据(Probe Data) • 布点拨测 • 在各地模拟ICMP ping、HTTP GET请求,对系统进行检测
- 5.ITOA 四种数据来源使用占比 100% 90% 93% 86% 80% 72% 70% 60% 47% 50% 40% 30% 20% 10% 0% machine data(日志) wire data(网络抓包) agent data(插入代码) probe data(模拟检测)
- 6.ITOA 四种数据来源/解决方案比 较 ª 机器数据(日志) • 旁路 • 日志无所不在 • 但不同应用输出的日志内容的完整性、可用性不同 ª 通信数据(网络抓包) • 旁路 • 网络流量信息全面 • 但一些事件未必触发网络流量 ª 代理数据(嵌入代码) • 侵入式 • 代码级精细监控 • 对C/C++无效 • 带来安全、稳定、性能问题 ª 探针数据(布点拨测) • 旁路 • 端到端监控 • 只是模拟,不是真实用户度量(Real User Measurement,RUM)
- 7.ITOA 解决方案厂商(1) ª 机器数据(日志) • Splunk • ELK • 日志易 ª 通信数据(网络抓包) • Netscout • 科来 • 天旦 ª 代理数据(嵌入代码) • New Relic • AppDynamics • DynaTrace (Compuware) • 云智慧 • OneAPM
- 8.ITOA 解决方案厂商(2) ª 探针数据(布点拨测) • Gomez (Compuware) • Keynote • 听云(基调) • 博睿 ª 大公司综合性产品 • IBM • HP • Computer Associate • BMC • Riverbed
- 9.日志:时间序列机器数据 ª 带时间戳的机器数据 ª IT 系统信息 • 服务器 • 网络设备 • 操作系统 • 应用软件 ª 用户信息 • 用户行为 ª 业务信息 ª 日志反映的是事实数据 • 深度解析LinkedIn大数据平台(http://www.csdn.net/article/2014-07-23/2820811/1) • “TheLog:What every software engineer should know about real-time data's unifying abstraction”, Jay Kreps, LinkedIn engineer
- 10.一条 Apache Access 日志 • 180.150.189.243 - - [15/Apr/2015:00:27:19 +0800] “POST /report HTTP/1.1” 200 21 “https://rizhiyi.com/search/'>https://rizhiyi.com/search/