SSD在新浪数据库平台优化实践
2020-02-23 209浏览
- 1. SSD在新浪数据库平台应用实践 杨尚刚 微博 @zolker
- 2. 自我简介 2011年加入新浪 负责新浪微博核心数据库架构设计和优化 负责新浪数据库平台底层软硬件平台优化 理念:设计简洁的架构
- 3. MySQL @ Sina MySQL版本官方社区版 数据量PB级 每日承担访问量百亿级 2011年开始使用SSD,数量在万片级别 集群上千台 承担新浪微博核心数据持久化存储
- 4. 我们如何使用MySQL 读写分离 Master-Slave 复制 Sharding 多IDC容灾 完善的监控和容灾策略 良好的Schema设计
- 5. MySQL Replication 解决读性能问题 数据容灾 原生复制有明显的性能瓶颈
- 6. MySQL Sharding Sharding is very complex, so itʼs best not to shard until itʼs obvious that you will actually need to! 不要轻易做Sharding
- 7. 后面会发生什么? 现实往往是很残酷的 预估的性能 实际的性能
- 8. 神马原因 服务峰值需求 服务SLA需求 TCO的需求 我们该如何解决呢 Scale UP VS Scale Out 继续Sharding
- 9. Scale UP VS Scale Out
- 10. 当时的现状 瓶颈 真得无解了吗? 答案当然是No 因为SSD
- 11. 必须知道的数字
- 12. SSD特点 使用电子元件实现数据的永久存储,没有机械组件 主要有基于DRAM和Flash两种 兼容目前HDD的接口 随机读写性能非常好 低延时,延时在微秒级
- 13. SSD有多快
- 14. HDD VS SSD
- 15. SSD关键技术 1.Read &Write 2. Flash translation layer 3. WL(Wear leveling) 4. Garbage collection & Trim 5. Over –provisioning &Write amplification 6. Bad block management & ECC
- 16. NAND Type SLC MLC TLC
- 17. PCIe VS SATA SSD 容量 4K随机读/写 每GB 带宽 延时 PCIe 1TB+ 70w+/20w+ 2-3$ 8GB/s 10-40 SATA <1TB 7w/2w 1-2$ 6Gb/s 50-100μs μs
- 18. NVMe is coming
- 19. 选择SSD 价格 容量 性能 可靠性 MTBF,UBER,TBW 稳定性 IO 延时 可维护性 功耗
- 20. 我们如何使用SSD 作为持久化存储,替换原有15K HDD 混合存储 在缓存场景作为扩展内存使用
- 21. SSD存储 主要是单机10块SATA SSD 硬Raid+Raid5 从库优先使用SSD,峰值写入高主库也会采用SSD 采用PCIe SSD 使用案例 12 3.5 10 3 2.5 8 2 6 1.5 4 1 2 0.5 0 0 服务器数 HDD SSD 99%响应时间(ms) HDD SSD
- 22. 针对SSD的IO 优化 echo noop/deadline >/sys/block/[device]/queue/scheduler echo 0 > echo2 > /sys/block/[device]/queue/rq_affinity(CentOS 6.4以上) echo 0 > /sys/block/[device]/queue/add_random /sys/block/[device]/queue/rotational 文件系统关闭barrier FastPath技术 CPU rq_affinity测试 IO调度算法测试
- 23. 针对SSD的MySQL优化 在5.5以上,提高innodb_write_io_threads和 innodb_read_io_threads innodb_io_capacity需要调大 日志文件和redo放到机械硬盘,undo放到SSD atomic write,不需要Double Write Buffer InnoDB压缩 单机多实例+cgroup
- 24. 混合存储 Flashcache SSD作为读写的缓冲,数据最好有热点,对使用场景有要求 Facebook的Mohan开发,并且线上一直在用,最新版本3.0 法和读写效率做了优化 对淘汰算 微博核心数据库之前线上有使用 LSI Cachecade & Nytro MegaRaid 混合存储优点非常明显 热点集中下性能表现优异 节省成本 不过缺点也非常明显 运维成本高 对SSD寿命损害大 性能不稳定 cache的特性决定了它并不适合高并发OLTP Flashcache原理
- 25. 缓存存储 把内存和SSD虚拟成一个设备来使用,实现缓存数据的持久化 缓存容量突破单机内存的限制,减少后端的压力 降低成本 提高服务可用性
- 26. 面临的问题 SATA SSD做Raid后Raid卡性能瓶颈 SSD寿命监控和生命周期管理 SSD自动化测试,测试流程和指标的规范化 挖掘利用SSD性能
- 27. SSD In Future 12G Raid卡 No Raid,HBA卡直连 NVMe 使用TLC & 3D V-NAND, 打造全flash数据库平台 定制SSD 更低的成本,更大的容量,更高的性能
- 28. No Raid 现有Raid卡很容易成为SSD性能瓶颈 Raid有容量损失 SSD可靠性已经得到验证,上层应用有多级容错策略 Raid卡也可能出问题的
- 29. TLC在企业级应用 寿命如何 性能稳定性 故障率怎么样 能否取代高速机械硬盘,完成使命
- 30.
- 31. SSD 性能极限
- 32.
- 33. 联系方式 微博或微信搜索 zolker