Xelon Blog | Xelon AG

Disaster-Recovery in virtualisierten Umgebungen | Blog | Xelon AG

Geschrieben von Matias Meier | Apr 29, 2020 8:20:00 AM

 

Reputationsschäden, Vertrauensverluste und Einbussen in Millionenhöhe: Bei IT-Disastern geht die ganze Arbeit der letzten Monate verloren. Es kann Unternehmen jeder Grösse passieren, dass die Server plötzlich nicht mehr funktionieren und User keine Dienstleistungen mehr beziehen können. Je nach Tageszeit und Branche erleidet die betroffene Firma Schäden von mehreren Tausend bis zu Millionen Franken pro Downtime-Tag.

Ohne verlässlichen Notfallplan steht das Unternehmen im Falle von Naturkatastrophen oder ungeplanten System-Stilllegungen vor dem Untergang. Im Durchschnitt müssen 7 von 10 Betrieben innerhalb von zwei Jahren nach einem schwerwiegenden IT-Problem dichtmachen. Rundum-Schutz ist teuer und viele Unternehmen entschliessen sich dazu, im Bereich IT-Security zu sparen oder Abstriche zu machen. Einige haben bloss für die wichtigsten Applikationen und Prozesse einen IT-Notfallplan. Diese Kosteneinsparung reduziert die Zuverlässigkeit und kann die Recovery-Qualität nicht garantieren. Eine virtuelle Infrastruktur vermag das Security-Problem zu lösen und spart euch letzten Endes Geld.

Inwiefern vereinfacht eine Virtualisierung den Disaster-Recovery-Prozess?

Virtualisierung vereinfacht den Wiederherstellungsprozess stark, indem diese Technologie die Workstation, sämtliche Server-Kapazitäten und andere Systeme in einem virtuellen Apparat verbindet. Daher müssen für die Wiederherstellung keine physischen Server umgebaut werden. Ihr transferiert virtuelle Maschinen in ein anderes System mithilfe der Rechenleistung. Virtualisierung  ermöglicht die Unabhängigkeit von physischen Einrichtungen, sodass ihr euch nach einer IT-Katastrophe bald wieder an die Arbeit setzen können – ganz so, als ob nichts passiert wäre. Die einzigen Voraussetzungen dafür sind eine stabile Internetverbindung sowie Remote-Zugriff.

 

Disaster-Recovery-Szenarien

Szenario 1: Bare-Metal-Server

Fällt der physische Server aus, dauert die Wiederherstellung lange und läuft nicht immer reibungslos ab. Falls ihr beispielsweise physische Server habt und alle Backups gemacht habt, müsst ihr die gleiche Anzahl Server kaufen, um alle verlorenen Daten wiederherzustellen. Hier wird es problematisch: Ihr werdet oftmals keine identischen Server finden, da die verwendeten Modelle womöglich vor längerer Zeit gekauft wurden und mit hoher Wahrscheinlichkeit bereits überholt sind. Falls die Software der neuen Ausstattung sich von der vorherigen unterscheidet, funktioniert die Wiederherstellung nicht. Zudem müsst ihr euch in jedem Fall um die passenden Driver kümmern, was nicht einfach ist und sorgfältige Überwachung von jedem Schritt der Systemwiederherstellung nötig macht.

3d rendering of modern datacenter with lots of server

 

Szenario 2: On-Premise-Server betreiben virtuelle Rechner  (Private Cloud)

Stellt euch vor, ihr habt – genauso wie im ersten Szenario – vier Server. Anstelle von physischen Apparaten sind es jedoch ein Server und vier virtuelle Rechner. Ihr erstellt Kopien der virtuellen Maschinen und speichern diese extern. Falls in dieser Situation der Server ausfällt, müsst ihr eine neue Ausstattung kaufen, Backups wiederherstellen, die virtuellen Maschinen starten sowie die Backup-Konfigurationen aufsetzen, damit euer System richtig funktioniert. Dieser Ansatz sorgt für mehr Zuverlässigkeit, bringt jedoch einen hohen Zeitaufwand mit sich und kann für einige Geschäftsbereiche heikel sein.

Szenario 3: Öffentliche Cloud

Dieses Szenario sieht ähnlich aus wie das vorhin beschriebene –  mit dem Unterschied, dass der ESX-Server sich nun ausserhalb des Bürogebäudes befindet und ihr ihn extern managed.

Vorteile einer Virtualisierung für die Geschäftskontinuität

Kontinuierliche Verfügbarkeit

Server-Verfügbarkeit ist geschäftskritisch. Wenn ein virtueller Server taucht, startet automatisch eine neue VM mithilfe der zur Verfügung stehenden IaaS Ressourcen. So erhaltet ihr maximale Verfügbarkeit, wodurch ihr weder einen dedizierten Backup-Server, noch eine zusätzliche Ausstattung oder Software benötigt.

Falls ihr das Funktionieren der Server ohne Stopp der Applikationen garantieren müsst, benötigt ihr für ein Clustering zwischen virtuellen Rechnern deutlich weniger Server als bei einem herkömmlichen Failover-Cluster.

Unabhängigkeit von Hardware

Einer der grössten Vorteile von Virtualisierungen ist die Unabhängigkeit der Recovery-Ausstattung vom Wiederherstellungsprozess selbst. Virtuelle Rechner kondensieren alle notwendigen Informationen: Applikationen, Daten, Betriebssystem oder BIOS. Dadurch könnt ihr den Server auf sämtlichen Bestandteilen der virtuellen Infrastruktur wiederherstellen und benötigt keine 100-prozentig identische Recovery-Plattform.

Hardware-Konsolidierung

Es ist extrem unwahrscheinlich, dass alle Workloads gleichzeitig versagen und es ist vielfach akzeptabel, in der Failover-Einrichtung vorübergehend eine etwas geringere Anwendungsleistung bereitzustellen. Die Konsolidierungsrate der Failover-Einrichtungen ist oftmals doppelt so hoch wie diejenige des primären Datenzentrums. Das unerwartete Resultat dieser Workload-Beweglichkeit und der hohen Hardware-Konsolidierung ist, dass Unternehmen Hardware ohne grosse Performance-Einschränkungen mehreren Workloads zuschreiben können. Dies macht In-Sourcing eines Disaster Recovery-Modells wirtschaftlich deutlich attraktiver.

Die beste Vorgehensweise für Disaster-Recovery in virtualisierten Umgebungen

Disaster-Recovery bedeutet den Neustart aller Komponenten eurer IT-Infrastruktur nach einer Störung. Zudem müssen die negativen Folgen des Systemversagens minimiert werden und es gilt sicherzustellen, dass geschäftskritische Prozesse kontinuierlich funktionieren. Wer stets für den Ernstfall gerüstet sein möchte, sollte über einen Wiederherstellungsplan verfügen.

Entwurf eines Disaster-Recovery-Plans

Beschreibt den Disaster-Recovery-Prozess, indem ihr einen eindeutigen Handlungsplan für jeden Mitarbeitenden erstellt, der im Falle eines Systemversagens in den Wiederherstellungsprozess involviert ist.

Als erstes solltet ihr festlegen, welche Systeme für euer Unternehmen am wichtigsten sind und diese priorisieren. Bestimmt, wie lange eure Systeme höchstens abgeschaltet und der Kundendienst nicht verfügbar sein dürfen. Danach solltet ihr den maximal tolerierbaren Datenverlust (Recovery Point Objectives) sowie die Sollzeit für die Wiederaufnahme des Betriebs (Recovery Time Objectives) eruieren. Haltet fest, was nötig ist, damit die für euer Unternehmen zentralen Systeme laufen. 

Unterteilt den Plan in folgende Abschnitte: 

  1. Wiederherstellung des Netzwerkes
  2. Wiederherstellung des Rechenzentrums 
  3. Wiederherstellung von virtuellen Rechnern

Haltet diesen Plan im Falle von Disaster-Recovery ein. 

Denkt daran, dass die Umsetzung eines IT-Notfallplans externen Faktoren unterliegen kann, auf die ihr keinen Einfluss nehmen könnt. Dies umfasst sowohl durch höhere Gewalten verursachte als auch menschengemachte Umstände. Daher sollte der Notfallplan Lösungen für verschiedene Szenarien wie Naturkatastrophen, Stromausfälle, durch Cyber-Kriminelle verursachte Schäden oder Hardware-Probleme umfassen. 

Vorbereitung der Disaster-Recovery-Site 

Einige Unternehmen verwenden eine Disaster-Recovery-Site als zusätzliches Tool im Falle eines Systemausfalls. Diese Site hilft euch dabei, die wichtigste Internet-Ressource des Unternehmens bei Ausfällen zu ersetzen und Kunden Zugriff auf Applikationen oder Unternehmensdienstleistungen zu ermöglichen. Solches Sites können unterschiedliche Formen annehmen: archivierte Kopien, zum Launch bereite Projekte; hot, warm oder cold Sites.

Automatische Backups und Replica

Bei erfolgreichen Wiederherstellungsprozessen haben Backups und das Replizieren von virtuellen Maschinen erste Priorität. Backups enthalten alle Daten der virtuellen Maschinen und müssen richtig geschützt werden. Beachtet, dass Backup-Prozesse eine Weile dauern können. Replicas sind 100-prozentige Kopien euer virtuellen Maschine und bereit für den sofortigen Launch bei Systemausfällen. Dank einer Spezial-Software werden Daten automatisch geschützt. Im Gegensatz dazu führen manuelle Backups vielfach dazu, dass gewisse Daten oder Änderungen verloren gehen.

Die richtige VM-Netzwerk-Konfigurationen

Die Production-Site und die Disaster-Recovery-Site können in unterschiedlichen virtuellen Netzwerken betrieben werden. Falls dies so gehandhabt wird, sollten die Netzwerk-Konfigurationseinstellungen der virtuellen Rechner bei der Wiederherstellung auf der Disaster-Recovery-Site geändert werden.

Bereitstellung des VM-Speichers

Für einen erfolgreichen Wiederherstellungsprozess benötigt ihr genügend freien Speicherplatz. Dies ist die wichtigste Anforderung, da dadurch ausreichend Performance ermöglicht wird. Der Speicher sollte von anderen Netzwerken getrennt werden.

Regelmässiges Testen des Notfallplans

Falls ihr den System-Wiederherstellungsprozess nicht testet, bringt unter Umständen der ganze Plan nichts. Geht den IT-Notfallplan daher regelmässig durch und nehmt, falls nötig, Anpassungen vor. Bei Tests stellt sich heraus, ob Vorgaben wie der maximal tolerierbare Datenverlust (Recovery Point Objectives) sowie die Sollzeit für die Wiederaufnahme des Betriebs (Recovery Time Objectives) eingehalten werden. Selbst kleinste Veränderungen in der IT-Infrastruktur erfordern sofortige Tests, da sie den Algorithmus und den Wiederherstellungsprozess beeinträchtigen können.

 

Schlussfolgerung

Hackerangriffe, Systemversagen oder Naturkatastrophen: IT-Disaster können Unternehmen jeder Grösse betreffen und sorgen oftmals für immense Schäden. Daher sollten Firmen über einen soliden IT-Notfallplan verfügen. Der erste Schritt bei der Festlegung einer Disaster-Recovery-Strategie besteht darin, die Anforderungen an die Wiederherstellung zu verstehen. Bestimmt, wie lange eure Systeme höchstens abgeschaltet und der Kundendienst nicht verfügbar sein dürfen. Was ist der maximal tolerierbare Datenverlust (Recovery Point Objectives)? Wie sieht es mit der Sollzeit für die Wiederaufnahme des Betriebs (Recovery Time Objectives) aus? Bei der Evaluation von Technologieoptionen sollte der Faktor der Skalierbarkeit berücksichtigt werden. Der Umfang der Umgebung sowie die Anzahl und Art der zu unterstützenden Anwendungen spielen bei der Lösungsfindung ebenfalls eine zentrale Rolle und definieren Service-Levels. 

Unsere Infrastruktur steht in zwei zertifizierten Schweizer Rechenzentren. Eure Daten unterstehen somit komplett dem Schweizer Datenschutzgesetz.

Die Planung von System-Wiederherstellungen mag vielfach unerfreuliche Erinnerungen an frühere Vorhaben zutage bingen. In den letzten Jahren sind die Disaster-Recovery-Optionen jedoch deutlich besser geworden – nicht zuletzt dank Virtualisierungen. Zu den grössten Vorteilen einer Virtualisierung gehören kontinuierliche Verfügbarkeit, Unabhängigkeit von physischer Hardware sowie Hardware-Konsolidierung. Virtualisierung vereinfacht den Wiederherstellungsprozess massiv, indem Workstation, sämtliche Server-Kapazitäten und andere Systeme in einem virtuellen Apparat vereint werden.