萧田国-天灾还是人祸-Oracle连环严重故障及引发的思考

2020-02-27 57浏览

  • 1.天灾还是人祸?   Oracle连环严重故障及引发的思考 触控科技 萧田国
  • 2.个人&公司介绍   萧田国    触控科技运维总监                                  ACMUG核心成员                                          InfoQ专栏作者【高效运维最佳实践】     70%
  • 3.高效运维最佳实践  InfoQ官网数据 
  • 4.分享内容   1、数据块损坏   2、服务器假死   3、数据库无法关闭   4、更换硬件导致   5、天灾还是人祸? 
  • 5.背景是这样的 
  • 6.报表      1:数据块损坏(A)      2:服务器假死(B)      3:数据库无法关闭(C)      4:更换硬件导致(D) 
  • 7.1、数据块损坏(服务器A)   负载正常、硬盘正常 
  • 8.解决过程   •  event  10231   •  dbms_repair   •  bbed   •  analyze   •  真正原因?   •  最后的解决 
  • 9.2、服务器假死(服务器B) 
  • 10.解决方法   Ø _allow_resetlogs_corruption   Ø alter  session  set  events  'IMMEDIATE   trace  name  ADJUST_SCN  level  1'   
  • 11.3、数据库无法正常关闭(服务器C) 
  • 12.解决方法   Ø ps  -ef    grep  dbrw   Ø iostat     Ø strace   
  • 13.4、更换硬件导致(服务器D)   •  H310  &  H710P 
  • 14.解决方法 
  • 15.智性? 
  • 16.5、天灾还是人祸?(服务器A)   •  无法归档模式   •  无法RMAN   •  无法DG   •  没法expdp   •  processes        &          sessions   •  ETL数据回溯 
  • 17.联系我:微信号  xiaotianguo,或扫码 
  • 18.