Worst Case Checkliste für IT-Verantwortliche bei Ausfällen in der kritischen Infrastruktur

30. Mai 2022 | Blog

Diesen Monat hatten wir das Thema der Risiken bei Ausfall oder Störung von kritischer Infrastruktur, für die IT sicherlich mit Fokus auf Internet, Telefon, Cloud und Strom, aufgegriffen und uns damit intensiv beschäftigt.*

Als Ergebnis ist eine Checkliste mit Fragen aus unterschiedlichen Bereichen entstanden, welche wir Ihnen zur Verfügung stellen und als Orientierung dienen soll, um Risiken in Ihrem Unternehmen zu identifizieren und mitigierende Maßnahmen zu planen und umzusetzen. Natürlich hat die Checkliste keinen Anspruch auf Vollständigkeit. Jedes Unternehmen und jede Branche funktioniert anders. Nutzen Sie die Checkliste als Denkanstoß und Anregung, um auf Notfallszenarien vorbereitet zu sein. Sie können diese für Ihre eigene Verwendung natürlich beliebig ergänzen.

Aus unserer Sicht ist die Eintrittswahrscheinlichkeit eines flächendeckenden und längeren Ausfalls im Bereich Strom, Internet, Telefon und Cloud Services eher unwahrscheinlich, jedoch wären die Auswirkungen so hoch, dass wir empfehlen, sich mit einer Risikobetrachtung zu beschäftigen.

On-premises Betrieb

Betreiben Sie Systeme On-Premises?
Betreiben sie Systeme lokal an Ihren Standorten? Dies kann entweder in einem richtigen Rechenzentrum oder einem Serverraum sein. Nicht zu vergessen sind auch Steuerungssysteme von beispielsweise Industrie- und Produktionsanlagen, welche meistens eher in den Werken, als in separaten Rechenzentren verortet sind.

Haben Sie eine Notstromversorgung und wie lange hält diese?
Ist für Ihre wichtigsten und kritischsten IT-Systeme eine Notstromversorgung vorhanden? Stellen Sie sicher, dass diese regelmäßig (am besten einmal im Quartal) getestet wird. Ebenfalls sollten Sie überprüfen, wie lange die Notstromversorgung reicht. Meistens beschränkt sich das Notstromkonzept auf USV-Anlagen, die meistens nur Kapazitäten für eine Überbrückung von einigen Minuten oder im besten Fall wenigen Stunden haben. Ebenfalls sollten Sie prüfen, ob die Notstromleistung noch ausreichend ist. Besonders bei IT-Systemen ist das Wachstum schnell und mittlerweile unkompliziert. Die Notstromkapazitäten werden daher häufig dem IT-Wachstum später oder gar nicht angepasst.

Haben Sie aktuelle Verträge mit Energielieferanten (z.B. Diesel), die auch am Wochenende liefern, um die Notstromversorgung unterbrechungsfrei aufrecht zu erhalten?
Sollten Sie Notstromkonzepte mit beispielsweise Dieselmotoren implementiert haben, ist es wichtig dafür zu sorgen, dass zu jeder Zeit Nachschub an Energieträgern verfügbar ist.

Welche IT-Komponenten sind für die Aufrechterhaltung des Geschäftsbetriebs absolut notwendig und welche könnten ggf. abgeschaltet werden (z.B. Test und Schulung abschalten), um Energie zu sparen?
Im Falle eines länger anhaltenden Stromausfalls sollten Sie den Energieverbrauch auf das absolut Notwendige reduzieren. Erstellen Sie eine Liste von Systemen, welche im Falle eines Falles nicht für Ihr Business kritisch sind und abgeschaltet werden können. Ebenfalls sollten Sie eine Liste von Systemen vorhalten, welche auf gar keinem Fall abgeschaltet werden dürfen. Hinterlegen Sie die Listen mit Abschaltplänen. In den Abschaltplänen sollte enthalten sein, was bei der Abschaltung zu berücksichtigen ist (z.B. Reihenfolge, um Prozessketten nicht zu stören) und Checklisten, welche Prozesse nach Abschaltung auf Funktionalität überprüft werden müssen. Lassen Sie ebenfalls eine Personalplanung einfließen. Für einen solchen Fall ist es sehr wahrscheinlich, dass Sie mehr Personal benötigen, als im normalen Betrieb. Berücksichtigen Sie ebenfalls, wie an arbeitsfreien Tagen und in der Nacht zu verfahren ist.

Ist es möglich, dass alle Mitarbeiter Ihres Unternehmens Remote arbeiten?
Im Falle eines längeren Stromausfalls sollten Sie alle Mitarbeiter, wenn möglich, im HomeOffice arbeiten lassen, sofern dort Strom vorhanden ist. Sorgen Sie im Vorfeld dafür, dass zum Einen die Technik für Remote-Arbeit vorhanden und funktional ist und Remote-Arbeit für die Mitarbeiter „nichts neues ist“.

Welche Teile Ihrer IT funktionieren auch bei einem längeren Internetausfall?
Überprüfen Sie Ihre Geschäftsprozesse auf Abhängigkeit zum Internet. Was würde auch ohne verfügbares Internet funktionieren und was nicht? Haben Sie genug Bürokapazitäten, um die wichtigsten Mitarbeiter dort arbeiten zu lassen? Wer sitzt mit wem in einem Raum, um die internen Kommunikationswege effizient zu halten? Wer muss im Büro seine Arbeit fortführen und auf wen kann kurzfristig verzichtet werden?

Ist im Falle eines Strom-/Internetausfalls oder Ausfall des Cloud-Providers sichergestellt, dass die Produktions-IT weiterhin funktional ist?
Welche IT-Systeme steuert Maschinen, Hochregallager, Logistikketten, Pipelines, …? Ist sichergestellt, dass diese IT-Systeme auch autark, ohne Internet und einem Cloud-Provider funktionieren, sowie im ausreichend Notstrom versorgt werden?

Gibt es Systeme, die Daten über das Telefonnetz empfangen oder senden (z.B. Fax)?
Trotz der in die Jahre gekommenen Technologien findet man relativ häufig IT-Systeme, die Daten über das Telefonnetz, vor allem Fax, austauschen. Überprüfen Sie Ihre Geschäftsprozesse, an welchen Stellen diese Art der Datenkommunikation absolut notwendig ist und sorgen sie für einen alternativen Weg, sollte es zu längeren Störungen im Telefonnetz kommen.

Haben Sie Wiederanlaufpläne erstellt, um vom Notbetrieb zurück in den Normalbetrieb zurückzukehren (für Technik und Prozesse!)?
Ähnlich wie die Abschaltpläne (siehe oben), sind auch Wiederanlaufpläne absolut notwendig. Das Schema bleibt das Selbe. Welche Systeme, werden in welcher Reihenfolge, von wem hochgefahren und was muss direkt im Anschluss geprüft werden, um den reibungslosen Weiterbetrieb sichergestellt zu haben.

Cloud Services

Welche Geschäftsprozesse sind im Falle eines Ausfalls der Cloud betroffen?
Hosten Sie Systeme bei einem oder mehreren Cloud-Providern? Unabhängig davon, ob Sie Server bei einem Cloud-Provider hosten oder einen Cloud-Service nutzen, was passiert bei einer größeren und längeren Störung bei Ihrem Cloud-Provider? Welche Geschäftsprozesse sind betroffen und welche Maßnahmen für die Fortführung Ihres Geschäftes sind umzusetzen?

Haben Sie lokale Backups der Daten und Konfigurationen, welche in der Cloud liegen?
Sollte es sich um eine lange Störung bzw. einen langen Ausfall bei Ihrem Cloud-Provider handeln (>1 Tag), sind Sie in der Lage, die betroffenen Systeme entweder lokal oder bei einen anderen Cloud-Provider wiederherzustellen, um den Geschäftsbetrieb fortzusetzten?

Haben Sie eine redundante Internetanbindung von unterschiedlichen Providern?
Das Konzept der Cloud bedingt immer eine Anbindung an das Internet. Sollte es hier zu einer größeren und längeren Störung kommen, können Sie nicht mehr auf die Cloud-Systeme/-Daten zugreifen. Daher ist es empfehlenswert, die Internetanbindung redundant auszulegen und hierfür mindestens zwei unterschiedliche Internetprovider zu nutzen. Ebenfalls ist zu beachten, dass die Leitungskapazitäten so ausgelegt sind, dass eine Internetleitung ausfallen kann, ohne Performanceprobleme hervorzurufen.

Ist Ihre Internetanbindung an einer Notstromversorgung angeschlossen?
Auch die beste Internetleitung hilft nicht, ohne Strom.

Notfallarbeitsplätze

Sind Notfallarbeitsplätze vorgesehen?
Bezugnehmend auf die oben ausgeführten Punkte, sollten Sie sich die Frage stellen, ob es notwendig ist, Notfallarbeitsplötze für einen ausgewählten Kreis von Mitarbeitern bereitzustellen. Insbesondere Mitarbeiter, die beispielsweise Produktionsanlagen steuern, Handel betreiben oder auch ausgewählte Teile des Managements können hier die Zielgruppe sein. Ist das einrichten von Notfallarbeitsplätzen aus Ihrer Sicht sinnvoll, sollten diese an einem anderen Standort verortet werden. Ebenfalls sollten Sie sich fragen, wie die Plätze ausgestattet sein müssen, welche Software installiert sein muss und welche Anbindungen (Standortkopplung, o.ä.) vorgehalten werden müssen. Auch hier empfiehlt es sich, die Notfallarbeitsplätze mindestens einmal im halben Jahr zu testen und sicherzustellen, dass diese im Falle eines Falles funktional sind. Auch die Anbindung an eine Notstromversorgung mit langer Haltbarkeit ist hier unabdingbar.

Wie kommunizieren die Mitarbeiter untereinander und mit Dritten im Falle eines längeren Internetausfalls?
Viel Kommunikation findet heute über das Internet statt. Egal ob Telefonie (Voice-over-IP), diverse Chatdienste, oder E-Mail. Moderne Kommunikation ist ohne das Internet kaum möglich. Daher sollten Sie sich die Frage stellen, wie Ihre Mitarbeiter untereinander, als auch mit Dritten (z.B. Kunden, Lieferanten) kommunizieren, sollte das Internet für längere Zeit gestört sein. Das Thema wird darüber hinaus noch brisanter, je mehr Mitarbeiter permanent Remote arbeiten.

Wie kommunizieren die Mitarbeiter untereinander und mit Dritten im Falle eines längeren Telefonnetzausfalls?
Im Zusammenhang mit der Frage davor, ist ebenfalls zu überlegen, was getan werden muss, sollte es längere Ausfälle im Telefonnetz geben.

Sind die Mitarbeiter in der Lage bei einem Blackout oder Internetausfall die Arbeitsstelle und die Notfallarbeitsplätze aufzusuchen?
Auch Rahmenbedingungen, außerhalb Ihres Einflusses sind zu berücksichtigen. Die vorgehaltenen Notfallarbeitsplätze müssen natürlich für alle ausgewählten Mitarbeiter auch zeitnah zu erreichen sein. Gegebenenfalls fallen öffentliche Verkehrsmittel aus. Erstellen Sie daher ein Konzept, wie die Mitarbeiter im Falle eines größeren Ausfalls in einem Bereich der kritischen Infrastruktur sicher und zeitnah zu den Notfallarbeitsplätzen gelangen.

* Blog-Beitrag: https://mh-it.consulting/2022/05/20/was-bedeutet-das-fuer-ihre-it-innenministerin-warnt-vor-angriffen-auf-kritische-infrastrukturen/