记录一次网站故障排障过程

前言

昨天晚上发现我的博客(www.grbj.cn)突然无法访问了,出现了如下报错:

我第一时间怀疑是服务器故障了,于是立即登录了阿里云控制台,检查发现一切正常。我在该服务器上部署了多个网站,检查后发现其他网站都正常访问,只有博客和 Widely 云无法访问,这两个网站使用的是同一个 CDN 服务商(多吉云),因此,我登录了多吉云控制台开始检查,状态也是一切正常的。

于是便提交给客服发去了消息,但可能比较晚了一直没有回复,我也就将 DNS 解析直接解析到源站临时解决了这个问题,便没有管了。

开始排障

一天过去了,准备开始处理问题,再次给多吉云客服发去了消息,这次立马回复消息,我说明了一下故障情况,他们怀疑我的源站有问题,便开始对我的源站进行了多轮测试,因为源站的 ECS 性能并不高,他们的多轮测试(相当于是小型 DDoS 攻击)将我的源站给整挂了,我便立即跟他们说明,不要进行测速尝试源站经不住测试。

后面换了低速测试,进行了一段时间的排查,给了我一个答复。

这里为什么提到了阿里云 CDN 是因为我提到了说切换成阿里云 CDN 是一切正常的。

于是我把 ECS 的防火墙,WAF,宝塔面板的 WAF 都给关了,但还是一样的问题,并且在 Nginx 的日志中是能够看到多吉云的 CDN 请求 IP 的,也就是说应该是没有拦截的。于是我给阿里云提交了一个工单,因为 ECS 在阿里云。

image-20250416021031897

阿里云的答复就是没有任何的拦截,这其实和我想的是一样的。

到这里其实就已经僵持住了,没办法往下进行了,问题得不到解决,我也没办法用了,多吉云很爽快的给我把流量包给退掉了。

我不死心的开始了 Google,在 Google 上看到了一些解释说和网络线路有关,境外 IP 访问会有这个报错出现,于是我就开始用手机浏览器访问网站,神奇的一幕出现了,当我将手机卡切换成移动的时候是可以访问网站的,但是将手机卡切换成联通以后就访问不了网站了,于是再次找上了多吉云,多吉云拿出了一个回复。

问题应该算是定位了,但是不太好解决,要解决的话就只有删除了重新添加了。我也不想再折腾了先用着阿里云吧,后面再测试了。

当我提出要写文章公布一下过程的时候,多吉云做了一个回复,让我特别提及一下腾讯云线路,不知是何用意我也没问题。

最后我的结论就是重要业务还是不要用小厂商的服务,像我这种无关紧要的网站就无所谓了,无法访问也就无法访问了,没啥损失。

上一篇 Windows11 24H2如何优雅的使用eNSP
下一篇 你知道哪些 IPv4 地址有特殊用途吗?