2024年12月,為了周期性驗證多套核心業(yè)務(wù)系統(tǒng)的容災系統(tǒng)的可用性,確保生產(chǎn)端與災備端兩端數(shù)據(jù)一致、災備數(shù)據(jù)可用,該央企協(xié)同美創(chuàng)專家團隊成立了演練領(lǐng)導和執(zhí)行小組,計劃通過模擬相關(guān)核心業(yè)務(wù)系統(tǒng)故障,分階段對多套系統(tǒng)進行異地桌面演練及容災演練,以驗證生產(chǎn)系統(tǒng)可向災備中心的備用系統(tǒng)進行有效切換,要求RPO=0,RTO≤30分鐘。
以智能生產(chǎn)運維系統(tǒng)從上海到異地災備節(jié)點的容災切換為例。演練于12月26日22:01:30開始,首先采用美創(chuàng)新一代 災備一體化平臺(DRCC)(點擊了解)進行快速自動化預案評估,演練執(zhí)行小組執(zhí)行一鍵啟動智能生產(chǎn)運維系統(tǒng)的主備切換,在充分保障備份任務(wù)完成和人工節(jié)點驗證通過情況下,包括數(shù)據(jù)庫、應用、NAS、中間件等各類資產(chǎn)節(jié)點均按照既定的演練預案完成切換,總耗時2分54秒。備端業(yè)務(wù)系統(tǒng)經(jīng)過近1個小時的試運行后,成功驗證備節(jié)點數(shù)據(jù)零丟失,容災效果滿足業(yè)務(wù)運行需求。
備節(jié)點驗證切換有效后,演練執(zhí)行小組利用DRCC自動生成的回切鏈路,一鍵完成異地災備機房的智能生產(chǎn)運維業(yè)務(wù)回遷至上海本地數(shù)據(jù)中心,業(yè)務(wù)正常運行,共耗時2分56秒,完全滿足RPO和RTO預期。
此次容災演練全面檢驗了容災備份系統(tǒng)的有效性。同時,美創(chuàng)還協(xié)助該央企對演練中出現(xiàn)的問題進行了深入的總結(jié)與復盤分析,并針對性地提出了優(yōu)化措施。通過這一過程,該央企的災難應對能力和數(shù)據(jù)保護機制得到了實質(zhì)性的增強,為未來可能面臨的突發(fā)情況打下了堅實的基礎(chǔ)。