GitHub 是一家广受欢迎的代码存储库和开发者平台。
在十几个小时前,如果你访问GitHub 主网站时,会显示一条错误消息,提示“当前没有服务器可以处理您的请求”,但之后网站又短暂恢复了运行。(错误消息中还出现了一张愤怒的独角兽图片。)
有详细事件报告这样描述道:
GitHub 主站无法访问,显示“无可用服务器”的错误信息。同时,包括 Pull Request、GitHub Pages、Copilot 和 GitHub API 在内的多个核心服务受到严重影响。
然而,随后此事件迅速升级。
GitHub Status 的第一条消息是在东部时间晚上 7:11 发布的,但几分钟后,GitHub 报告了其多项服务出现问题。问题似乎很普遍,而 Downdetector 显示有超过 10,000 名用户报告了类似问题,而且问题报告得相当突然。
晚上 7:13,互联网监控服务商 NetBlocks也发布消息称 GitHub“正在经历国际中断”。
之后,在 GitHub Status 又发布状态称 Copilot 也瘫痪了。
有一些人在 Hacker News 幸灾乐祸的说:“这下好了, 开发者可以正大光明的摸鱼,Copilot 也挂了”。
对于本次故障,GitHub 没有立即回应置评请求。
根据消息更新,当地时间 8 月 15 日 GitHub 表示在重大中断后已经恢复正常。
根据 GitHub Status 后期发布的消息,这次故障与数据库基础设施上的变更有关,正在组织人员回滚。
大家知道,无状态的服务有许多恢复手段,即使挂了也比较容易恢复。而有状态的数据库一旦出问题,就是大问题。我们尚不知道是哪种数据库故障,与哪种数据库基础设施变更导致的故障。
根据美国东部时间晚上 8:26 的状态消息,该公司已撤销了显然导致问题出现的数据库基础架构更改,并表示服务现在已经“全面运行”。
GitHub于 2018年被微软以75亿美元收购,用户数已从不到4000万增长到7300多万,但一些用户反映,被收购后的GitHub在服务稳定性方面似乎有所下滑。
作者:万能的大雄
本文为 @ 场长 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。