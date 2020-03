Von: Robert Meiners

Es existieren diverse Konzepte und Technologien in der Informationstechnologie, um den fortlaufenden Geschäftsbetrieb zu garantieren. Dazu gehören Business Continuity, Data Safety oder Security. Nun etabliert sich seit neuestem ein Prinzip, das weit über die bisherigen Mechanismen und Konzepte hinausgeht und den sicheren Geschäftsablauf und die Ausfallsicherheit der IT in einem wesentlich größeren Umfang zusammenfasst: Resilienz. Was es damit auf sich hat und welche Unternehmen für das Konzept prädestiniert sind, wird im Folgenden beschrieben.

Welches Unternehmen kann sich heute noch einen Stillstand in der Informationstechnologie leisten? Inzwischen sind die IT-Systeme für alle automatisierten Geschäftsprozesse kritisch. Grund dafür sind die konsequente Nutzung neuer Technologien, eine wesentlich stärkere Vernetzung, integrierte und voneinander abhängige Systeme, der hohe Automatisierungsgrad und vor allem die kontinuierliche Veränderung der Systemlandschaft. Theoretische Ausfallszenarien und auch reale Beispiele aus der Wirtschaft beschreiben deutlich, wie hoch die Relevanz von IT-Systemen ist.

Das Konzept hilft, solche Szenarien und Katastrophen zu vermeiden. Denn zusammengefasst beschreibt es die Fähigkeit eines Systems, in zeitlich vertretbarer und effizienter Art und Weise Gefahren widerstehen und absorbieren zu können, sich an Änderungen in der Gefahrenlage anzupassen und sich von deren Auswirkungen zu erholen.

Die vier Stufen des Resilienz-Prinzips

Unterbrechungen im IT-Betrieb kommen aus vielen Gründen vor. Diese können bis zu einer gewissen Systemgrenze gut gemanaged werden. Ist die IT jedoch sehr komplex und erfolgt der Betrieb bis an die Systemgrenzen, können leicht Kaskadeneffekte eintreten, bei denen ein ausgefallenes System viele weitere Systemausfälle nach sich zieht. Ist dieses Potenzial in einem Unternehmen gegeben, können derartige Katastrophen verhindert oder zumindest deutlich abgeschwächt werden. Dazu ist das Konzept in vier sich ergänzende Stufen definiert:

In der ersten Stufe geht es darum, dass sich IT-Systeme von einem Ausfall erholen und zwar so weit wie möglich selbstständig. An einem konkreten Beispiel erklärt heißt das, dass sich beispielsweise eine sehr große Datenbank – etwa Oracle oder SAP – nach einem Störfall eines Servers selbstständig erholt. Nach dem Austausch des fehlerhaften Servers werden die Ressourcen wieder auf alle verfügbaren Server sinnvoll verteilt und die volle Performance wird wiederhergestellt. In der zweiten Stufe geht es um die Fähigkeit, Störfälle zu absorbieren. Fällt beispielsweise in klassischen Architekturen ein Hochleistungsserver aus, kann eine sehr große Datenbank prinzipiell auch von einem redundanten Server weiterhin ohne Performanceeinbußen bereitgestellt werden. Allerdings ist dann mit funktionalen Einschränkungen zu rechnen, etwa dem Verlust der Redundanz oder dem Ausfall der Entwicklungsumgebung. Mit dem Prinzip der Resilienz werden Systeme jedoch derart elastisch, flexibel und adaptiv strukturiert, dass Störeinflüsse wie Serverausfälle absorbiert werden, also möglichst im Geschäftsablauf nicht auffallen. Gerade bei großen In-Memory-Datenbanken kann dies eine Herausforderung sein, die oftmals besondere Lösungen erfordern. Die Fähigkeit, auch am Rande der Systemgrenzen zu funktionieren, beschreibt die dritte Stufe. Die Skalierung und adaptiven Kapazitäten innerhalb resilienter Umgebungen haben höchste Priorität. Es geht darum, auch am Limit der Systemgrenzen einen sicheren Geschäftsablauf zu gewährleisten. In einer Grenzbelastung beispielsweise durch einen weitreichenden IT-Ausfall schaltet das System irrelevante Systeme automatisiert ab oder fährt diese auf ein Minimum herunter, um automatisch nach Prioritäten die wichtigsten Systeme des Kernbetriebs zu gewährleisten. Die vierte Stufe beschreibt die nachhaltige Anpassungsfähigkeit von Systemen. Dies kann beispielsweise mithilfe von Künstlicher Intelligenz (KI) erfolgen. Dabei werden Fehler und Ausfallszenarien erlernt, womit diese nachfolgend nur noch einmal vorkommen können. Sollte das gleiche oder ein ähnliches Szenario wiederholt eintreten, weiß die KI genau, wie sie bereits vor Eintreten einer Katastrophe zu reagieren hat. Das ideale Resultat aus der nachhaltigen Anpassung ist, dass das System im Anschluss sogar noch leistungsfähiger und stabiler ist als vor einem nächsten Ausfallszenario – selbst erlernt oder manuell adaptiert.

Wer braucht Resilienz?

Heute existieren nur wenige Lösungen, welche die oben genannten Stufen beinhalten, und äußerst wenige, die das komplette Prinzip widerspiegeln. Die Einführung und Umsetzung von Resilienz ist im heutigen Stadium sicherlich nichts für kleine und mittelgroße Unternehmen. Es ist eine Disziplin zur Absicherung der Geschäftsabläufe für Konzerne und für große Organisationen, die extrem kritische Systeme wie etwa Enterprise-Datenbanken betreiben. Unternehmen, die heute Systemumstellungen entwickeln, sollten dieses Konzept von Anfang an mit einplanen. Denn im Nachhinein lassen sich die vier wesentlichen Stufen nur schwer in einer existierenden Umgebung umsetzen.

Fazit

Schon allein wegen der Komplexität und auch der budgetären Anforderungen ist Resilienz keine Modeerscheinung in der Informationstechnologie. Nur wenige hochspezialisierte Hersteller und noch weniger IT-Dienstleister haben sich darauf spezialisiert. Nach eigenen Angaben ist MTI Technology der erste Dienstleister, der dies in Europa anbietet. Auch ist der Markt zum heutigen Zeitpunkt und mit dem gegenwärtigen Stand der Technologie noch übersichtlich. Denn nur große Unternehmen und Konzerne werden messbare Vorteile aus einer solchen Umstellung ziehen – sowohl technologisch als auch budgetär. Resilienz hat allerdings mittelfristig das Potenzial zu einem Standard auf Unternehmensseite zu werden. Erste Schritte sind getan, indem Experten und spezialisierte Unternehmen komplette Lösungen anbieten.

Bildquelle: MTI Technology