歐洲頂級云數(shù)據(jù)中心著火,損失慘重!筑牢數(shù)據(jù)中心“防火墻”,可靠才是王道!
發(fā)布日期:
2021-03-24

瀏覽次數(shù):

514

近日,歐洲云計算巨頭OVH位于法國萊茵省首府特拉斯堡的數(shù)據(jù)中心發(fā)生嚴重火災(zāi)。這場熊熊大火給OVH數(shù)據(jù)中心造成了巨大的損失,也給整個數(shù)據(jù)中心行業(yè)敲響了警鐘。事實上,風(fēng)險一直存在,我們能做的就是最大程度地避免悲劇再次發(fā)生。水火無情,可靠先行,如何保障數(shù)據(jù)中心的可靠運行至關(guān)重要。


文章轉(zhuǎn)自網(wǎng)絡(luò)

如有侵權(quán),請聯(lián)系刪除


  近日,歐洲云計算巨頭OVH位于法國萊茵省首府特拉斯堡的數(shù)據(jù)中心發(fā)生嚴重火災(zāi)。其中最先起火的SGB2數(shù)據(jù)中心被完全燒毀,摧毀了所有服務(wù)器和數(shù)據(jù);SBG1建筑物部分受損,三分之一的服務(wù)器受到損毀;SBG3因受到消防保護暫未受到影響,以及SBG4確認沒有受到波及。目前,該區(qū)域4個數(shù)據(jù)中心均暫時關(guān)閉了服務(wù)。


歐洲頂級云數(shù)據(jù)中心著火,損失慘重!筑牢數(shù)據(jù)中心“防火墻”,可靠才是王道!


  據(jù)報道,該數(shù)據(jù)中心起火后,導(dǎo)致約360萬個網(wǎng)站癱瘓,1.2到1.5萬名客戶的資料可能受到影響。OVH一家游戲公司客戶表示,大量玩家數(shù)據(jù)已經(jīng)因火災(zāi)丟失,且無法恢復(fù)。


歐洲頂級云數(shù)據(jù)中心著火,損失慘重!筑牢數(shù)據(jù)中心“防火墻”,可靠才是王道!


  這場熊熊大火給OVH數(shù)據(jù)中心造成了巨大的損失,也給整個數(shù)據(jù)中心行業(yè)敲響了警鐘。事實上,風(fēng)險一直存在,我們能做的就是最大程度地避免悲劇再次發(fā)生。水火無情,可靠先行,如何保障數(shù)據(jù)中心的可靠運行至關(guān)重要。


智能供電實現(xiàn)故障可視可管


  據(jù)數(shù)據(jù)統(tǒng)計,數(shù)據(jù)中心基礎(chǔ)設(shè)施中斷有39%是由供配電引起,而供配電系統(tǒng)一旦中斷,損失將非常慘重。傳統(tǒng)供電系統(tǒng)采用分散部件集成的方式,不同廠家、不同品牌設(shè)備無法統(tǒng)一可視化管理,大部分設(shè)備為啞設(shè)備,發(fā)生故障無預(yù)警,難以迅速定位,導(dǎo)致數(shù)據(jù)中心可靠性低,易引發(fā)火災(zāi)隱患。


  通過融合數(shù)字化技術(shù),實現(xiàn)全鏈路可視可管,可大大增強數(shù)據(jù)中心的可靠性。如采用IOT技術(shù),可實時監(jiān)測電壓、電流、開關(guān)狀態(tài)和關(guān)鍵節(jié)點溫度等參數(shù),可直觀展示異常狀態(tài),便于定位故障。同時通過大數(shù)據(jù)分析對關(guān)鍵器件壽命預(yù)測,防患于未然。此外,備電系統(tǒng)作為關(guān)鍵子系統(tǒng),對數(shù)據(jù)中心可靠性的影響毋庸置疑。傳統(tǒng)鉛酸電池頻繁充放電會造成活性物質(zhì)軟化等反應(yīng),易膨脹爆炸引發(fā)火災(zāi)。而采用磷酸鐵鋰的智能鋰電系統(tǒng)可免去日常巡檢,在熱失控的情況下不產(chǎn)生氧氣,不起火,可靠性更高。


數(shù)字運維實現(xiàn)風(fēng)險可防可控


  傳統(tǒng)大型數(shù)據(jù)中心運維依賴于人工運維,對運維工程師技能要求高,而現(xiàn)實中高達38%的數(shù)據(jù)中心招不到合格的運維工程師。同時人工運維效率低下,巡檢多為被動響應(yīng),質(zhì)量不可控。數(shù)據(jù)顯示,2019年數(shù)據(jù)中心基礎(chǔ)設(shè)施失效故障率比2018年上升6%,其中80%為可預(yù)防性故障。由此可見,傳統(tǒng)運維模式在故障巡查、檢測、隔離均存在極大風(fēng)險。


  隨著數(shù)字化變革不斷深入,數(shù)據(jù)中心基礎(chǔ)設(shè)施將逐步實現(xiàn)運維的自動駕駛。目前,通過數(shù)字孿生技術(shù),可實現(xiàn)部件級、設(shè)備級、系統(tǒng)級、鏈路級、機房級、多DC全局可視,分鐘級告警根因智能定位,可顯著縮短故障修復(fù)時間。同時融合人工智能技術(shù)、大數(shù)據(jù)分析對關(guān)鍵器件(風(fēng)扇、電容、電池等)壽命預(yù)測,通過溫度、圖像、聲音識別進行全鏈路預(yù)測性維護,實現(xiàn)從被動告警到主動預(yù)防,極大提升系統(tǒng)的可靠性。


預(yù)制化架構(gòu)實現(xiàn)數(shù)據(jù)中心高可靠性


  傳統(tǒng)數(shù)據(jù)中心建設(shè)采用攢機模式,建設(shè)周期不僅長達20個月以上,而且各個子系統(tǒng)之間孤立,規(guī)劃和建設(shè)分離,拼湊式建設(shè)模式給后續(xù)運維管理帶來了極大的難度,風(fēng)險不可控,影響整個數(shù)據(jù)中心的可靠性。


  而采用預(yù)制模塊化的建設(shè)模式,將各個子系統(tǒng)預(yù)集成在模塊內(nèi),在工廠進行預(yù)制組裝,標(biāo)準(zhǔn)化生產(chǎn)流程,各個模塊品質(zhì)如一,多系統(tǒng)協(xié)同設(shè)計,并且在出廠前完成全系統(tǒng)調(diào)試和測試,確保高質(zhì)量和高可靠性。同時現(xiàn)場只需完成極簡施工,可大大降低現(xiàn)場管理難度及施工風(fēng)險,有效提升數(shù)據(jù)中心可靠性。


  本次歐洲頂級云數(shù)據(jù)中心著火事件敲響的警鐘,也進一步印證了打造高可靠的數(shù)據(jù)中心,需要從部件、設(shè)備、子系統(tǒng)上升至整體來考慮。作為數(shù)據(jù)中心領(lǐng)域的創(chuàng)新領(lǐng)導(dǎo)者,華為從全局視角出發(fā),緊緊圍繞數(shù)據(jù)中心的整體可靠性,創(chuàng)新打造預(yù)制模塊化數(shù)據(jù)中心解決方案。該方案融合AI、預(yù)制模塊化建筑、數(shù)字化全生命周期管理等多重創(chuàng)新技術(shù),將智能IT模塊、智能電力模塊、智能溫控模塊、智能管理平臺等核心子系統(tǒng)全部預(yù)集成預(yù)測試,所“見”即所得,顯著降低施工和交付風(fēng)險。樂高式搭建,現(xiàn)場土建與工廠生產(chǎn)同時進行,可縮短50%以上建設(shè)周期。同時將人工智能和數(shù)字化融入數(shù)據(jù)中心的規(guī)劃、建設(shè)、運營、運維、優(yōu)化迭代全過程,貫穿全生命周期,實現(xiàn)全鏈路可視,AI預(yù)測性維護,防患未然,筑牢數(shù)據(jù)中心的堅實“防火墻”。