对于一般企业来说,服务器宕机的话,自家业务就会被中断,然而一旦公有云上的服务宕机,那么可是大事件了。
近日,Google公有云下的Kubernetes服务(GKE),从上周五(11月9日)凌晨4点30分开始,当机了将近19小时,直至当日深夜11点才完成修复,此消息也在知名开发者论坛Hacker News引起相当讨论。
谷歌官网发布故障声明
以太平洋标准时间为基准,根据Google所发布的公告,GKE服务从11月9日凌晨4点30分起,Kubernetes节点池建置功能出现异常,维运人员无法透过Cloud Console UI建立新节点,该公司随即分派工程团队调查故障原因,并开始着手维修。
到了当日清晨5点57分,该公司表示,受到影响的企业用户,可以先改为使用GCP内建的gcloud command,建置新Kubernetes节点。经过10个小时的维修,Google在下午2点30分时宣布,Cloud Console UI建立节点池功能已经恢复正常。
此故障事件是今年GKE服务故障最久的一次,先前最严重的故障事件发生在1月8日,该服务的丛集建置功能停摆了2小时后恢复正常。