微软“蓝屏” 多地“宕机”

此次故障波及规模为何如此之大
武汉晚报 2024年07月22日

    在美国新泽西州纽瓦克机场,一名工作人员站在出现故障的显示屏前。

    新华社发

    大量旅客滞留机场。

    新华社发

    格林尼治时间18日19时(北京时间19日3时)开始,全球多地微软视窗系统因一款安全软件更新而宕机,出现“蓝屏”,航空、医疗、传媒、金融、零售、物流等多个行业受到影响。微软和软件供应商、美国电脑安全技术公司“众击”已经向用户提供修复指南,但由于所涉企业太多,“蓝屏”电脑全部恢复正常仍需时日。

    这起宕机事件的影响范围和严重程度十分罕见,为各国政府、行业和个人用户敲响警钟。尽管程序错误已被修正,但其影响波及面太广,网络安全机构提醒公众和企业:要小心不法分子趁机行骗、窃取数据。

    这次宕机规模可能“史无前例”

    微软首席执行官萨蒂亚·纳德拉当天在社交媒体X上发文确认,为微软提供服务的安全技术企业“众击”公司发布的一项软件更新是造成这次全球性宕机的主要原因。

    “蓝屏”即表明微软操作系统陷入瘫痪,影响了全世界多地机场办理值机和预订机票以及医疗和银行系统登录、电视广播节目播出、超市和电信系统运作等,给人们日常生活造成不便。一些地区的港口运营、物流运输也受到影响。

    英国工程技术学会的网络安全专家朱纳德·阿里指出,这次宕机的规模可能“史无前例”,对全球信息技术(IT)行业团队构成了重大挑战,但同时也为软件工程专业人员提供重要经验。

    这也是继2017年以来全球规模最大的宕机事件。2017年,“想哭”勒索病毒软件利用微软视窗系统漏洞袭击全球多地联网电脑,影响多国政府部门和多个行业运转。

    微软网络安全主管戴维·韦斯顿在博客发文说,虽然受影响机器“占比很小,但其导致的大范围经济和社会影响反映出‘众击’软件在运营许多关键服务的企业中应用广泛”。

    微软说,“众击”已协助推出解决方案,加速微软利用Azure云服务平台所作修复进程。微软也会与亚马逊网络服务、谷歌云平台合作,分享其所获知的修复进度信息。

    尤其是眼下正值旅游旺季,航空业受到的影响比较突出。美国联邦航空局最初叫停美国境内所有航班起飞,航空公司稍后反映已经陆续恢复服务。欧洲主要机场也受到影响,其中德国柏林一家机场19日早些时候一度暂停所有航班。

    据美联社报道,此次宕机事件导致全球数千架次航班取消、数万架次航班延误。在欧美、亚洲和拉美许多机场,旅客为办理业务排起长队,大量旅客滞留机场。截至20日,受影响地区的航班运营逐渐恢复。

    短时间内难以完全修复故障

    总部位于美国的“众击”公司在全球拥有超过2万客户,其中包括微软和亚马逊等科技巨头。该公司首席执行官乔治·库尔茨19日在社交媒体X上发文说,此次事件不涉及网络攻击,而是源自该公司为微软视窗系统发布的软件更新中存在“缺陷”,该问题已被识别、隔离,并已部署修复措施。

    库尔茨当天还在媒体采访中说,“就我们给客户、旅行者以及所有受波及者造成的影响深表歉意”,公司正在努力解决问题,但一些系统可能需要“一些时间”才能从此次故障中恢复过来。

    微软公司副总裁兼副首席信息安全官安·约翰逊19日晚些时候说,客户正在或已经收到必要信息,并正在得到他们需要的支持,但无法估计需要多长时间让客户恢复使用微软系统。

    国际分析机构福里斯特公司分析师阿莉·梅伦说,手动修复需要删除受损文件等比较耗时,而“众击”的一些大客户可能管理着数百万台计算机,他们可能需要几天或更长时间完成修复工作。

    “众击”总部位于美国,在纽约上市,近期颇受投资者青睐,股价过去一年内翻倍。19日,其股价下挫11%。

    各国网络安全机构和“众击”公司的高管向全球公众和企业发出警告:已有不法分子冒充“众击”公司员工或其他机构的技术专家,假借向受影响个人或企业提供电脑系统修复服务之名,窃取数据以牟利,大家需保持警惕。

    英国国家网络安全中心表示,已注意到企图借宕机事件窃取数据的事件增多。曾任该中心首席执行官、现在牛津大学任教的夏兰·马丁说,他对于一起事故导致严重的全球性数据紊乱并不感到奇怪,但“有点惊讶事故由一家非常有声望的网络安全公司的软件升级引发”。“‘众击’公司将面对非常犀利的质疑。这次软件升级是怎么通过质量控制流程的?显然测试机制失灵了,不管是哪种。”

    出了问题“牵一发而动全身”

    微软视窗系统是世界上最受欢迎的个人电脑操作系统。虽然“众击”公司已经与微软合作迅速恢复大部分服务,但专家认为需要进一步评估这次宕机事件的长期影响。

    英国计算机学会网络安全专家亚当·史密斯指出,修复程序必须应用于世界各地的大量计算机,这需要一段时间。但如果计算机进入蓝屏和无限循环,恢复可能会更困难,需要几天甚至几周时间。

    朱纳德·阿里则认为,“众击”公司正将此事件列为最优先事项加以解决。“这次宕机的长期影响尚未被完全理解,但它们将影响到未来关键安全更新的及时采用。”

    这起宕机事件引发反思,全球多地、社会多部门严重依赖少数几家科技公司提供的服务,一出问题可谓“牵一发而动全身”。

    英国约克大学教授约翰·麦克德米德警告说,今后各行各业,尤其是基础设施领域应防范这类问题发生。

    美国市场预测机构D.A.戴维森公司高级软件分析师吉尔·卢里亚说,大部分公司找不到微软的替代品。这起事件发生后,一些企业用户可能考虑在安全产品上寻找可替代方案。

    美国韦德布什证券公司分析师丹·艾夫斯说,万幸的是,问题出自软件更新,而不是由黑客袭击或网络安全威胁导致。

    专家认为,宕机事件凸显全球互联网基础设施的脆弱性,需要对IT系统的复杂性以及各领域高度依赖网络基础设施的潜在风险保持警惕。英国工程技术学会专家伊恩·科登说,世界各地发生的重大IT系统中断事件反映了经济、国防和国家安全等方面对数字服务依赖日益增加的问题,也因此凸显数字服务安全和韧性的重要性。

    不能“把蛋都放在一个篮子里”

    巴黎奥运会组织方19日说,巴黎奥运会部分系统受到全球一次大范围电脑软件和云服务宕机影响出现问题。

    法新社援引巴黎奥组委一名消息人士的话报道,巴黎奥运会相关认证系统受到影响,导致一些人员无法在开幕式前领取到徽章。此外,鉴于一些运动员搭乘的航班因大宕机被取消,奥运村入住工作可能也将受到影响。

    巴黎奥组委说,这次大宕机没有影响奥运会票务系统,奥运火炬传递也将按计划进行。

    巴黎奥组委19日发邮件通知媒体,巴黎奥运会证件激活服务暂停,原因是微软系统出现问题。邮件中写道,微软系统问题影响了奥运会证件的激活流程,因此激活服务将暂停。“巴黎奥运会的技术部门正在努力减少影响,目前已经启动应急预案来保障系统的正常运行。”    

    截至发稿前,新华社记者赶到巴黎奥运会主新闻中心的一处证件激活处,发现相关服务已经重启。一位工作人员透露,当天上午证件激活全部暂停,经过抢修,目前又恢复了运行。

    巴黎奥组委主席托尼·埃斯坦盖对媒体记者说,组织方已启动应急计划,但宕机使认证等工作变得缓慢,希望微软公司尽快解决问题。

    此次事件影响波及全球,也暴露出高度依赖IT系统的一些“命脉”行业及大型企业应急响应能力的不足。例如,全球航空业受到宕机的严重冲击。美联社援引航班跟踪网站数据报道说,截至美国东部时间19日傍晚,全美近2800个航班被取消,近1万个航班延误,而全球约4400个航班被取消。

    澳大利亚国立大学计算机专家汤姆·沃辛顿警告,大范围宕机显示出依赖单一技术提供重要服务的风险,应使用不同软件建立备用通信链路。这确实增加了安全和维护成本,但“如果把所有鸡蛋都放在一个篮子里,最终可能会丢脸”。    

    本版稿图均据新华社