Faceboo遭遇有史以来最严重宕机事件,与DNS故障有关

发布时间:2021-10-13 00:00:00

当地时间10月4日,Facebook 及其旗下 Instagram 和 WhatsApp 等应用全网宕机,停机时间近 7 小时 ,浏览器在尝试打开时显示 DNS 错误。

宕机期间,Facebook 在欧洲、美洲、大洋洲几乎完全下线,在亚洲的日本、韩国、印度等国也无法访问。除了让数十亿用户陷入困境之外, Facebook 服务中断还使得其员工无法使用内部工具相互交流。Facebook 首席技术官 Mike Schroepfer 只能通过推特向用户道歉。

这对于月活和日活高达 35.1 亿和 27.6 亿的 Facebook 而言,可谓损失惨重。据投资机构估计,7 小时宕机直接产生超过 9.68 亿美元的影响成本,并使 Facebook 市值损失 643 亿美元,其创始人马克·扎克伯格净资产蒸发 70 亿美元。

1.宕机故障原因

Facebook 表示,这次故障的根本原因是例行维护工作时发出的一条指令导致其 DNS 服务器不可使用,从而切断了 Facebook 整个骨干网络与数据中心之间的连接,这实质上就是断开了 Facebook 全球数据中心之间的连接。

由于 Facebook 的架构设计是根据服务器可用性来扩展或缩减 DNS 服务,当服务器可用性因网络故障而降至零时,就会停用所有 DNS 服务器。这种停用通过 Facebook 的 DNS 名称服务器向互联网边界网关协议(BGP) 路由器发送消息来完成的,这些路由器存储用来抵达特定 IP 地址的路由方面的信息。这些路由通常被公告给路由器,让路由器了解如何适当地引导流量。

在此次宕机事件中,由于整个骨干网都已陷入瘫痪,因此各 DNS 服务器位置均上报连接状态问题并撤回边界网关协议(BGP)通告。最终结果是,Facebook 的 DNS 服务器虽然仍在运行但却无法正常访问,导致其他互联网用户也无法正常接入其服务器。

在此过程中,我们可以看出DNS在其中扮演了很重要的角色,DNS的故障是导致Facebook宕机的主要原因。

2.什么是DNS?

DNS是Domain Name System的缩写,翻译成中文就是“域名系统”。DNS是互联网中的一项核心服务,是用于实现域名和IP地址相互映射的一个分布式数据库,它将简单明了的域名翻译成可由计算机识别的IP地址,使用户可以更快速便捷地访问互联。

简单来讲DNS就是翻译官,把baidu.com这样简单易记的域名翻译成220.181.111.188的IP地址让机器理解,从而实现域名和IP之间的相互转化。

由此可见,DNS是网络上一种非常重要和基础的功能,DNS故障会对整个网络的正常访问和运行造成严重影响,从此次Facebook宕机事件中就可见一斑。

除此之外,DNS系统也是网络攻击的重点对象,DNS劫持、DNS污染等针对DNS的攻击手段层出不穷,给各行各业都带来了严重危害。因此加强DNS安全防护能力,在网络攻击日趋频繁的今天已是刻不容缓。

3.云解析——DNS解析新趋势

中科三方DNS云解析系统,采用分布式云架构体系,在国内和海外各地部署多个解析服务节点,与传统解析技术相比,中科三方DNS云解析系统具备以下几点优势:

(1)采用分布式云架构体系,可有效分摊超大流量访问和恶意DDoS攻击,提升域名解析系统承载能力和系统容灾能力,保障域名系统的安全性和稳定性。

(2)支持智能解析和负载均衡,可根据访客地址和IP智能划分解析节点和线路,实现用户的就近选择和低延迟接入,有效提升域名解析和网站访问速度,保障用户的访问和使用体验。

(3)采用高防DNS集群技术,支持更高的DDoS攻击和QPS查询防护,全面提升网站域名的抗攻击和防劫持能力。

(4)分布式监测节点,实时监测网站域名状态,24小时轮询监测,发现异常情况及时作出响应,实现快速容灾切换,保障网站服务的连续性。

与传统单节点解析相比,云解析系统无论是在解析速度、解析稳定、安全防护等多方面均有了显著提升,可有效提升域名管理能力、解析能力、抗攻击/防劫持能力以及故障恢复能力,为广大政企客户的域名及网站安全保驾护航。






相关推荐: 

新发现DNS安全漏洞影响巨大,政企如何做好DNS安全防护?

干货分享 | 一文读懂DNS原理及解析过程
什么是DNS?DNS解析的原理是怎样的?
中科三方DNS云解析产品常见问答

ICANN:新冠防疫期间确保DNS安全



上一篇:2021上半年全球网络安全事件盘点 下一篇:中国IPv6网络“高速公路”全面建成,正式迈入流量提升阶段