国际应急中心网络与新闻中心讯:
当地时间7月19日,全球无数打工人突然发现,他们的电脑屏幕要么蓝屏要么连不上系统服务器。而往常非常管用的“重启大法”也失去了效果,重启之后依然得面对那硕大的蓝屏。
这次微软蓝屏导致的系统瘫痪遍布全球,但在北美尤其严重,对社会运行产生了严重影响:航班停飞、911热线打不通、酒店无法办理入住、医院取消手术、商店无法营业,而这一切都源于一家鲜为人知的网络安全公司CrowdStrike——当然现在已经变成家喻户晓了。
这次全球性的“蓝屏事件”发生的原因说白了并不那么让人意外。作为全球网络安全与云计算端点保护领域顶尖公司之一,有大量公司和云服务器使用CrowdStrike公司的Falcon平台,并且运行在Windows平台上。
此次事件,就是由于CrowdStrike最新的一个软件更新与Windows平台出现了严重的兼容性问题,并由此导致出现了大面积的“蓝屏死机”,而且“无限循环”。如果仅仅局限于个人电脑上也就罢了,但问题更新同样应用在云服务器上(比如微软自家的Azure云服务)并且同样导致了严重问题,这使得“蓝屏事件”对公共领域造成广泛影响,而航空业又首当其冲。
由于各个国家的航空公司所采用的信息系统方案各不相同,使得在“蓝屏事件”中受到的影响也各不相同。由于身处美国具有“地利”,美国航空公司就成了本轮“蓝屏事件”的重灾区了,美国三大航(达美、美国、美联航)一个不落全部遭殃,对所有航班发出地面停飞指令,FAA要求空中交通管制员告知飞行员,航空公司目前遇到了通信问题。除此之外,捷蓝航空、边境航空、精神航空这些中小航空公司也受到严重影响,关键系统无法使用并导致航班大量取消。
在本次“蓝屏事件”中,我们发现那些美国航司并没有(或者说没做到)灾难恢复计划,也没有实现关键系统故障后自动切换到备份。当然有一种可能是他们确实有备份,但是备份同样遭遇了蓝屏(例如同样基于Windows系统运行且被错误更新影响),这就给人一种“为了避免鸡蛋放在一个篮子里,于是买了多个P2P理财防止暴雷”的感觉,并没有应急措施的技术预警及修复。
这次影响全球的“蓝屏事件”对中国几乎没有造成影响,中国民航运作完全正常,仅有一些外航航班(如美国航空、美联航)受国外影响导致了延误,其原因也并不复杂。
国际应急中心认为可以通过这起事件,要更加意识到,在关键信息系统已经成为重要基础设施的当下,实现完全的自主可控是极为重要的。而这不仅仅包括信息系统,也包括操作系统。在网络安全形势越发严峻的当下,其必要性已经无需质疑了,这不仅仅是技术层面的选择,更是国家安全与产业发展的战略需要。