事故现象

  1. 614-15,医院反馈在体检高峰时,系统明显感到卡顿,并在159:40左右系统几乎无法使用,滨江和解放路两个院区同时受影响,并在1040以后系统逐渐恢复。

初步猜想

  1. 早上客流量少时,系统无明显卡顿,在客户量提升时逐渐卡顿,考虑可能是用户量增大,并发操作提升时的影响,并且两个院区互相影响,在服务部署上可能存在问题。

事故排查

服务部署问题
  1. 在数据量提升后,解放路的负载未起到性能提升的作用,并且两个院区互相影响,考虑可能是服务部署的问题。经查明,医院提供了三台服务器,.5配置324G,.7配置216G,.8配置312G。.5搭载了三个院区的数据库服务以及应用,.7搭载了解放路服务的应用集群,.8未使用。调整为将解放路院区数据库迁移至.8服务器,.5,.7做解放路的集群。其他不动。调整后并发性能明显增加,且院区之间互不影响。
数据库优化
  1. 调整表索引,优化高cpu占用语句
系统优化
  1. 界面异步刷新,降低页面卡顿感,优化代码业务逻辑,提升系统并发效率。
文档更新时间: 2022-06-16 19:13