网易云音乐崩了!技术团队曾将机房整体搬迁至贵州

8月19日,多位网友表示网易云音乐出现页面白屏、无法登录服务器、音乐播放失败等情况。故障在持续约两小时后被修复。至于故障原因,网易云音乐相关负责人接受南都记者采访时表示以官方的口径为准。

网易云音乐发生故障

8月19日下午,“网易云音乐崩了”等上热搜,不少网友表示,网易云音乐打开显示加载失败,播放失败,网络错误,无法正常听歌,其官方网页也无法正常打开。

网易云音乐在今日下午15时08分发布微博回应称,因基础设施故障,导致网易云音乐各端无法正常使用,目前正在加紧修复,同时表示抱歉。

网易云音乐官方微博致歉

故障持续约两小时。17时30分,网易云音乐再发微博宣布故障已陆续修复,同时回应称“没有删库,没有跑路”,并再次致歉。

图片

网易云音乐再次致歉

南都记者就此事采访网易云音乐相关负责人,负责人回应称以此微博内容为准,并表示目前网上很多信息都是不实的,还是以官方的口径为准。

此前有媒体报道称,对于“裁员导致崩了”“机房搬迁,新机房总有很多问题”“开发删库跑路”等传闻,网易云音乐方面曾回复称,均为不实消息,“目前故障与机房无关,至于系统崩溃原因还在调查”。

此后又有媒体报道称,“网易在贵州建立了机房,旗下业务分阶段搬迁,2024年Q2网易云音乐刚刚完成了贵州机房的迁移,新机房确实问题会多,据说也节省了成本”。

南都记者发现,网易云音乐技术团队曾在今年7月11日发布《云音乐贵州机房迁移总体方案回顾》,该回顾文章提到,2023年确定要将云音乐整体服务搬迁至贵州机房,贵州机房迁移是云音乐历史上规模最大、人员最多、难度最高的技术项目。

文章中对此次贵州迁移主要带来的新增系统性风险进行了分析,主要包括因跨机房传输网络不稳定,带来的整体系统性风险;因杭州和贵州机房同时部署,带来的服务节点数量、API数量、RPC数量翻倍风险;因大规模数据变更,带来的系统性能风险;因新机房建设、搬迁,带来的底层基础设施风险及因全域团队协作、大范围配置变更&发布,带来的人因操作、协作风险等。

值得一提的是,文章同时指出,搬迁规模大参与人员规模大,整体协调难度大,带来较多的人因风险,可能因极小的细节未执行到位,就会造成全局事故。

采写:南都·湾财社见习记者 赵元