Dieses führende Unternehmen für das Management alternativer Investmentfonds (AIFM) verfolgt eine strenge Politik im Umgang mit einer potenziellen Großkatastrophe: Sollte der Hauptsitz einem Ereignis ausgesetzt sein, bei dem möglicherweise das Gebäude (oder die gesamte Stadt) zerstört wird, muss der Betrieb innerhalb von drei Tagen wieder von externen Standorten wieder aufgenommen werden können. Regelmäßige Überprüfungen von SLAs und Tests ergaben, dass für den vorhandenen Disaster Recovery-Standort eine Hardwareaktualisierung erforderlich war. Außerdem lief für die Colocation der Mietvertrag ab. Darüber hinaus war die aktuelle Bandsicherungslösung umständlich und fehleranfällig.

English PDF Version
German PDF Version


Während des ersten Meetings mit den Infrastruktur- und Enduser-Computing-Managern, erfuhren comdivision’s Yves Sandfort und Philip Kriener, dass die aktuelle Disaster Recovery-Lösung aus 8 Knoten plus dediziertem Legacy-Speicher in einem Colocation-Bereich bei einem lokalen Dienstanbieter bestand. Diese ist erfahrungsgemäß nicht einfach auf dem neuesten Stand zu halten.  Die Computerinfrastruktur wurde über zwei Standleitungen mit dem lokalen Rechenzentrum verbunden. Die Replikation kritischer Anwendungen erfolgte mit Veeam. 

Die Herausforderung

Die aktuelle Backup- und Disaster Recovery-Plattform war sowohl komplex als auch teuer. Eine Hardwareaktualisierung war bald fällig, und im Falle einer Katastrophe, wo die Sicherungslösung zur Aufrechterhaltung des Betriebs ausgebaut werden müsste, wäre eine Skalierung des Systems schwierig geworden.   

Sollte es zu einer größeren Katastrophe kommen, bei der die gesamte Infrastruktur der Stadt gefährdet sein würde, wäre der Betrieb in externen Büros nicht mehr möglich gewesen. Dies galt auch für die Veeam-Sicherungen, die in einer Bandbibliothek am Backup-Standort gespeichert waren.

Nachdem Yves Sandfort, leitender Architekt von comdivision, und der Vertriebsspezialist Philip Kriener in einem Workshop mit dem Kunden daran gearbeitet hatten, ein gemeinsames Verständnis der Kundenbedürfnisse zu erlangen, legten sie fest, dass sie im Wesentlichen drei Optionen hatten:

  1. Ein Kaltstart, bei dem der größte Teil der Infrastruktur im Katastrophenfall neu ausgerollt wird.
  2. Ein Warmstart, bei der die Grundkonfiguration repliziert wird und nur Rechenressourcen hinzugefügt werden müsse
  3. Eine Failover-Lösung, bei der alle Gold-Systeme repliziert und kontinuierlich aktualisiert werden, um ein sofortiges Failover zu ermöglichen

Die Lösung

Es stellte sich heraus, dass die Vertreter des Kunden sehr zweifelhaft waren, wie sie ihre Geschäftsleitung davon überzeugen konnten, eine Lösung zu verwenden, die auf den ersten Blick recht teuer wäre. "... bis wir während des Workshops einige überzeugende Argumente zusammen identifiziert haben" erklärte Kriener: „wir haben die aktuelle Situation mit dem neuen Konzept verglichen, bei dem wir zeigen konnten, dass die neue Lösung tatsächlich viel wirtschaftlicher ist als die aktuelle.“   Sandfort fügte hinzu: „Die Hardware-Aktualisierung wäre teurer geworden  selbst wenn man, um das Failover mithilfe von VMware Cloud on AWS zu realisieren erstmal mehr Aufwand hätte.“ Sandfort zeigte außerdem auf, dass der Wartungsaufwand mit VMware Cloud on AWS auch viel geringer wäre, als wenn das SDDC am externen Standort gewartet werden müsste.” 

Das Schlüsselelement des Konzepts war das Veeam-Backup für Amazon S3", erklärte Sandfort. "Im Katastrophenfall in der Unternehmenszentrale konnten die Backups das SDDC in der VMware Cloud on AWS-Umgebung schnell wiedergestellt werden!"

Das Ergebnis

Der Kunde entschied sich für die Lösung mit dem besten Kosten-Nutzen-Verhältnis: die Warmstart-Lösung. Das AWS-Rechenzentrum der Wahl war Frankfurt, und comdivision half beim Einrichten der SDDC-Plattform, einschließlich VPN-Tunnel, 2-Faktor-Authentifizierung und Migration der VMs vom alten Disaster Recovery-Standort. Es wurden Witness Server installiert sowie eine RDSH-Farm mit Windows 10-Desktops implementiert, die als Emergency Jump Hosts verwendet werden sollen. Schließlich wurden die Veeam-Backups erstellt (und mit AWS Snowball gefüllt). Der direkte Zugriff auf die S3-Buckets wurde vorbereitet. "Wir sind jetzt in der Lage, die Produktion innerhalb von Stunden wiederherzustellen, indem wir dem SDDC lediglich neue Hosts hinzufügen, um den Rechenbedarf zu decken", sagte der Infrastrukturadministrator und fuhr fort: "Wir haben die Infrastruktur so vorbereitet, dass wir nach der Übernahme der VMware Cloud on AWS, unseren Mitarbeitern 90% der 640 Desktops innerhalb von 2-3 Tagen wieder zur Verfügung stellen können!“.

Lightboard Video

Für den, der sehen möchte wie wir das technisch umgesetzt haben, hat unser Cloud Architekt Matthias Eisner ein Lightboard Video aufgenommen:


Video: www.comdivision.com/dr-vmc-on-aws