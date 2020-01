Von: Sascha Oehl

1. Festlegen von RTOs und RPOs

Anforderungen an die Wiederherstellungszeiten sind je nach Unternehmen verschieden. In der Praxis sollten unternehmenskritische Dienste – also Anwendungen, ohne die ein Unternehmen nicht funktionieren könnte – nicht länger als 15 Minuten ausfallen. Die Recovery Time Objective (RTO) definiert, wie viel Zeit vergehen darf, bis alle Elemente einer Anwendung wieder betriebsbereit sind. Das Recovery Point Objective (RPO) gibt an, wie hoch der Datenverlust während der Ausfallzeit höchstens sein darf. Eine Wiederherstellungsstrategie muss die festgelegten RTOs und RPOs unbedingt erreichen wollen.

2. Unabdingbar: Automatisierung

Automatisierung hilft Unternehmen ungemein, um den Disaster-Recovery-Prozess erfolgreich abzuschließen. Denn werden Wiederherstellungsprozesse händisch ausgeführt, erhöht sich das Fehlerrisiko signifikant. Firmen sollten beispielsweise auf selbstständig ablaufende Failover- und Failback-Prozesse achten. Failover sind für die Business Continuity besonders wichtig. Sollte eine missionskritische Anwendung ausfallen, sorgt ein automatisiertes Failover im besten Fall dafür, dass der Nutzer den Systemausfall gar nicht bemerkt. Denn mithilfe von Failover erfolgt ein Umschalten auf ein System, das für das ausgefallene einspringt. Ist das Ursprungssystem wiederhergestellt, geht es beim Failback darum, den Service in die Ausgangssituation automatisch zurückzuschalten. Das primäre System wird sozusagen mit den Workloads aktualisiert, die in der Zwischenzeit im sekundären System produziert wurden. All das geschieht im Idealfall vollautomatisch und innerhalb weniger Sekunden, so dass die Störung für die externe Welt unsichtbar bleibt.

3. Gewappnet sein für verschiedene Ausfallszenarien

Unternehmen müssen je nach Situation entscheiden, welche Anwendungen und Systeme wiederhergestellt werden sollen. Es kann sich um virtuelle Maschinen, eine große Anzahl komplexer Anwendungen oder ein gesamtes Rechenzentrum handeln. Die Wiederherstellungsstrategie des Unternehmens muss so anpassungsfähig sein, dass sie verschiedene Szenarien schnell und flexibel bewältigt. Je detaillierter und umfassender ein Notfallplan ist, desto höher ist die Wahrscheinlichkeit, dass der Arbeitsbetrieb nach einem Ausfall der IT wieder aufgenommen werden kann.

4. Multi-Cloud-Umgebungen zentral managen

Sollen bei einem Ausfall verschiedene Cloud-Umgebungen jeweils einzeln wiederhergestellt werden, steigen die Betriebskosten und die Downzeiten sind länger. Denn in diesem Szenario sind verschiedene Mitarbeiter nötig, die sich mit den Cloud-Prozessen auskennen. Das Prozedere nimmt verstärkt Zeit in Anspruch und die Wahrscheinlichkeit von Datenverlusten steigt. Bei der Multi-Cloud ist es ratsam, die gesamte Cloud-Umgebung von einer Stelle aus zu überblicken und die nötigen Disaster-Recovery-Prozesse zentral zu steuern. Dabei helfen Snapshot-basierte Cloud-Backup-Lösungen, die speziell für dynamische Multi-Cloud-Workloads entwickelt wurden. Mit einer geeigneten Snapshot-Lösung können Unternehmen einheitliche Policies für eine nahtlose Sicherung unterschiedlicher Clouds anwenden.

5. Tests durchführen

Der letzte Schritt leuchtet zwar unmittelbar ein, wird in der Praxis allerdings oft vernachlässigt und ist mühselig: Unternehmen müssen testen, ob ein Disaster-Recovery-Prozess funktioniert und wie lange er dauert. Da jeden Tag neue Daten in Unternehmen fließen, sollten die Tests regelmäßig durchgeführt werden. Sie laufen im Hintergrund ab und stören den laufenden Betrieb nicht. Die Veritas Resiliency Platform vereinfacht die Durchführung der Testabläufe und Kunden sind imstande, den gesamten Disaster-Recovery-Prozess per „Drag & Drop“ einzurichten. Ein integriertes Dashboard liefert Messergebnisse in Echtzeit. Außerdem erkennen Unternehmen, ob die zeitlichen Zielvorgaben eingehalten werden. Per Mausklick lassen sich belastbare Werte aus der Praxis ermitteln, wie lange der gesamte Umschaltprozess dauert und wie viele Produktivdaten verloren gehen. IT-Leiter können dadurch mit Werten, die unter realen Bedingungen ermittelt wurden, den Ernstfall beschreiben und Krisensituationen werden berechenbar sowie kalkulierbar.



