关于TCP连接DNS重解析与故障转移的技术问询
TCP连接生命周期、DNS重解析与跨区域故障转移的技术问询
我负责管理一批基于TCP的无状态服务,目前正在推进跨区域故障场景下的可靠性和可恢复性保障工作。但我发现自己对TCP连接的生命周期、连接对应的DNS解析逻辑,以及客户端库的具体实现方式都了解得不够深入,想搞清楚这些组件在几种故障模式下的表现。
基础设施组件
- 服务A部署在两个不同区域:Region X和Region Y
- Region X的服务A对应IP地址
IP_A_X,Region Y的服务A对应IP地址IP_A_Y - 地理分布式DNS服务器,同样部署在Region X和Y
- 一个地理感知(Geo-aware)DNS域名:来自Region X的请求会解析到
IP_A_X,来自Region Y的请求解析到IP_A_Y
Geo-aware DNS的健康检查机制
- 如果Region X的服务A宕机,健康检查失败后,Geo-aware DNS服务器会开始为来自Region X的请求返回
IP_A_Y(原文内容未完整表述,此处按现有信息整理)
备注:内容来源于stack exchange,提问作者Pablo




