河南暴雨,致使數據機房停電,多家網站癱瘓,災備到底有多重要?

2021.07.22

對大型信息系統來說,災難不僅僅指自然災害,還包括各種人為的因素。為了抵​​禦這些風險,災備這個概念應運而生。

河南汛情,牽動著全國人民的心。

暴雨,使全省人民付出了巨額的財產損失,甚至威脅到生命安全。


虛擬世界這頭,也並不平靜。

強降雨致使很多機房、數據中心停電,多家網站因此陷入癱瘓。

20日晚,晉江文學發文稱,晉江文學城主要網站業務所在的異地骨乾機房在鄭州市,機房因暴雨停電,導致部分線路出現不穩定,甚至打不開網頁的情況。


360竞价发布公告,因河南暴雨导致机房故障,部分报表无法查询。


西部數碼、景安網絡等服務商鄭州區域均機房停電,被迫啟用柴油發動機供電。

暴雨重創了河南互聯網基礎設施。

說到自然災害和數據中心,就不得不提災備系統。

對大型信息系統來說,災難不僅僅指自然災害,還包括各種人為的因素。為了抵​​禦這些風險,災備這個概念應運而生。


災備一詞起源於上世紀70年代的美國,著名的軟件和IT服務企業SunGard建起了全世界第一個災備中心。這家公司的主席曾經說過一句名言:“任何計算機事故發生後的4小時內,我們的備份都能讓你的服務再次上線,並且平穩運行210天。”

儘管出現了第一個吃螃蟹的人,但容災系統的發展仍然十分緩慢,它的快速發展,得益於美國“911恐怖襲擊。”

2001年,美國發生911恐怖襲擊事件,近3000名美國人在此次恐怖襲擊中喪生,與其同時,世貿中心的公司也並不好過。

世貿中心幾乎所有的中小型企業破產倒閉。紐約銀行因缺乏災備系統和有力的應急措施,數據中心全毀,通訊線路中斷,數月後不得不破產清算。

相比之下,具備完善災備系統的德意志銀行和摩根士丹利,在極短的時間內,便恢復了全部業務。

災難發生後,德意志銀行調動4000多名員工以及全球分行的資源,在極短的時間內恢復了業務的運行。

摩根士丹利在世貿中心25層的辦公室全毀,但半小時內就在災備中心建立了第二辦公室,第二天業務全部恢復。

911事件發生,讓所有企業了解了災備的重要性。

隨著信息時代的到來,網絡攻擊、硬件損壞、系統癱瘓、內部員工刪庫事件頻頻發生,因為洪澇、地震等自然災害,而致使數據中心癱瘓,甚至數據丟失的事情也時有發生。


 

·         2000年,美國八大網站遭遇DDoS攻擊,部分網站癱瘓長達3天,造成約12億美元的經濟損失。

·         2009年,因為機場EMC系統硬盤損壞,台北桃園機場宕機36小時。

·         2013年,倫敦交易所因為電腦系統癱瘓,停盤將近7個小時。

災備,成為衡量一個公司從技術層面上抗擊風險的水平。如今大大小小的互聯網公司,都或多或少地有一套自己的災備系統,或者災備方案。

災備系統有三個等級劃分:

數據級災備

數據級災備主要關注數據,在災難發生時,如何保護數據不被破壞?最早期的數據級災備,是通過卡車運輸硬盤來完成。現在則主要通過數據中心之間,超大容量光纖數據同步來完成。

應用級災備

應用級災備主要關注應用是否可以被延續,通常會在異地災備中心備份一套完整的支撐系統,以保證主生產中心出現問題時,可以立即切換生產中心,縮短系統的停機時間。

業務級災備

業務級災備一般被認為是最高級別的災備方案,不僅僅要對所有代碼進行備份,還包括線下規章制度以及人員組成。

河南洪災導致多家網站癱瘓,但在很短的時間內,大部分網站均恢復了運行,顯然是災備系統的功勞。

不過由於此次受影響的網站,並不承接金融業務,數據中心等級可能比較低,受到洪災的影響較大。像承接金融業務的數據中心,都能抗住一般的自然災害,影響可能不會那麼大。