系统A/B F5探测问题分析报告

问题描述:

2020年11月、2021年1月,系统A和系统B在使用我行自有开发框架升级投产时,发生F5探测失效问题。表现为应用启动正常,手动测试服务可用,但F5探测机制失效,无法判定应用是否存活。两个应用均选择了回退。

当前我行F5探测机制有两种方式,一种是根据端口号判定应用是否存活,另一种是配置某一具体服务,通过服务的返回来确定应用是否存活。考虑到端口探活其实并不准确,时常发生应用启动失败但端口仍被占用的情况,因此网络推荐采用具体服务的探测方式。经调研,系统A和系统B均采用配置服务方式完成F5探测。

端口探测在传输层完成,传输的内容理论上都是byte[],因此从理论上并不会出现应用正常但探测不到的情况。所以重点分析配置服务完成探测的场景。

继续阅读系统A/B F5探测问题分析报告