A disaster recovery – röviden DR – azt írja le, hogyan áll helyre a vállalat informatikai működése egy súlyos esemény után. Nem csak technológia, hanem előre egyeztetett prioritások, felelősök és lépések rendszere.
Milyen eseményre készülünk?
A terv kezelhet hardverhibát, zsarolóvírust, szolgáltatói kiesést, emberi hibát vagy akár a teljes iroda elérhetetlenségét.
- Mely rendszerek üzletkritikusak?
- Mennyi adatvesztés fogadható el (RPO)?
- Mennyi idő alatt kell helyreállni (RTO)?
- Ki hozza meg a szükséges döntéseket?
Backup és DR nem ugyanaz
A backup biztosítja a visszaállítható adatot. A DR megmondja, milyen sorrendben, hová, ki és mennyi idő alatt állítja vissza a teljes működést.
A tervet próbálni kell
Egy nem tesztelt forgatókönyv csak feltételezés. Az időszakos DR próba feltárja a hiányzó hozzáféréseket, függőségeket és dokumentációs hibákat, mielőtt valódi vészhelyzetben okoznának késedelmet.
RPO és RTO közérthetően
Az RPO azt mondja meg, mennyi friss adat elvesztése fér bele. Ha az RPO négy óra, legalább négyóránként konzisztens mentési pont kell. Az RTO azt jelzi, mennyi idő alatt kell újra használhatóvá tenni a szolgáltatást.
A rövidebb célidő több automatizmust, tartalék kapacitást és gyakoribb tesztelést igényel, ezért közvetlenül hat a költségre.
Mi történik az első 60 percben?
Először az eseményt kell elkülöníteni, megóvni a mentéseket és kijelölni az incidensvezetőt. Ezután üzleti prioritás alapján választjuk ki a helyreállítási sorrendet, miközben rögzített időközönként státuszt kapnak az érintettek.
- 0–15 perc: incidens azonosítása és izolálás
- 15–30 perc: döntéshozók, szerepkörök és kommunikáció aktiválása
- 30–45 perc: restore pont és célkörnyezet kiválasztása
- 45–60 perc: kontrollált helyreállítás megkezdése
A jó DR-terv konkrét, mérhető és kipróbált. Egy incidens során nem improvizálni kell, hanem végrehajtani az előre ellenőrzött lépéseket.