记录一下今天的线上问题.如果现在有同样场景的小伙伴可以借鉴,少走弯路.同时梳理一下问题排查的过程,为以后问题处理方向提供参考!
最近运营从小程序上上架了一个推广活动,下午测试小哥说,不论是测试环境还是正式环境都出现经常连接超时的情况,之前一直正常;当时考虑的可能的原因是网速问题,因为后端项目均未有改变.阿里云上看服务器上各个参数都在正常范围内.并且当时其他部门反应网速不稳定,使用手机流量进行访问正常;所以也没怎么注意(那时候其实对于这种不能十分确定的现象未做进一步思考,当时有点想当然),以为明天早上会正常.
晚上九点半,BOOS在工作群中反应现在小程序的活动显示一致加载中,最后显示连接超时.看到消息后用手机流量打开发现也是相同的问题,所以感觉应该不是网速导致.然后开始重新排查定位,首先想到的是超时连接数的设置,前后端项目将连接超时数由10秒延长到20秒,测试发现不起作用.postman用ip访问服务器数据响应正常,顿时没有了思路,工作群里都炸了,一直在催问题处理进度,这种焦灼每个深夜排雷的开发人应该深有体会.催归催,处理问题还是得静下来从头开始分析,小程序出现访问超时问题,本地postman接口调试却能成功,想到了https请求,之前一直都是用ip进行访问服务器,试探性的用域名测试访问了一下,发现确实有问题.好至此问题已经确定范围,https域名问题.考虑是否是域名解析问题.从阿里云看使用的域名配置信息发现使用的域名已经欠费!
欠费好说,直接进行缴费,域名重新生效时间为ttl显示时间,当时显示是10分钟.这里说一下校验域名是否正常的方法.阿里云提供在线域名检测(当然也可以直接使用whois,后续补充访问地址).这里说一下,域名续费之后默认都会自动配置,https证书也不需要重新生成.等到10分钟之后,postman用域名访问发现没有问题.小程序电脑版打开之后显示正常,到这里以为一切都顺利结束.但是手机打开小程序之后发现还是显示一致加载中并出现了熟悉的连接超时.按理来说PC端可以,移动端应该也没有问题,不是专业小程序开发,这里大概猜测可能的原因是小程序端解析重新生效的域名也需要时间,果然,几分钟之后移动端显示正常.另外需要重新退出小程序重新进入正常;群里回复了一下问题处理方案以及原因定位,至此问题处理完成,当时已经是12点半.又是忙碌的一天.
后端开发,平常习惯ip访问服务器,惯性认为ip能访问,域名就没问题;正常的流程是对于https加密请求,会进行域名解析,解析完成之后会访问域名对应的ip服务器.还是遇到的问题少,缺乏经验积累.另外线上问题不要慌,静下心来,从头开始梳理问题,有时候问题原因理你很近,可能因为着急就错失发现问题的好机会!