Essential Guide

Notfall-Management mit Business Continuity und Disaster Recovery

Eine umfassende Auswahl von Artikeln, Videos und mehr, die von unseren Redakteuren gewählt wurden.

Checkliste: Betrieb und Wartung unternehmenskritischer Data Center

Das Design unternehmenskritischer Data Center ist nicht nur eine Definition der Aufgabe der Einrichtung. Sie müssen auch O&M-Mitarbeiter involvieren.

Der Betrieb und die Wartung (O&M) von unternehmenskritischen Betriebsanlagen werden in der heutigen Zeit als genauso wichtig angesehen, wie das für die Entwicklungs- und Designphasen der Fall ist. Die Robustheit und die damit verbundene Komplexität von entscheidenden Einrichtungen haben sich erhöht. Das erlaubt verbesserte Fehlertoleranz (Fault Tolerance) und die Möglichkeit simultaner Wartungsarbeiten. Die Wichtigkeit der Etablierung von ebenso robusten O&M-Praktiken für das Management dieser Betriebsanlagen ist somit offensichtlich. Untersuchungen haben ergeben, dass bei mindestens 60 Prozent der „Ereignisse mit Auswirkung“ auf entscheidende Bereiche Menschen beteiligt waren. Zu diesen Aktivitäten gehören Routinearbeiten, Umkonfiguration von wichtigen Systemen, Wartungsaufgaben und natürlich menschliche Fehler.

Erforderliche Mitarbeiter und entsprechende Prozesse für einen reibungslosen Ablauf müssen daher vom ersten Tag an vorhanden sein, an dem der Standort in Betrieb genommen wird. Außerdem müssen sie bis zum letzten Tag verfügbar sein und eingehalten werden. Natürlich muss man mit der Entwicklung dieser Prozesse lange vor Inbetriebnahme des Data Centers anfangen. Im Idealfall hält man sich bereits während der Stufen Programmierung und Definition der Mindestanforderungen daran.

1. Überlegungen hinsichtlich des Data-Center-Designs

Hochverfügbarkeit für unternehmenswichtige Einrichtungen erfordert in der Regel komplexe Redundanz-Modelle wie Konfigurationen 2N, 2(N+1) oder sogar 2(N+1)/3. Auch bei Ausfällen wichtiger Systeme wird erwartet, dass ausreichend Redundanz für einen reibungslosen Betrieb zur Verfügung steht und es keine Unterbrechungen gibt.

Gibt es aber hinsichtlich der betroffenen Infrastruktur keine adäquaten Maßnahmen, die ausgefallene Ausrüstung zu isolieren, dann sind Ausfälle unvermeidbar. Sie haben in diesem Fall keinen Zugriff auf das Equipment und können es somit nicht reparieren oder ersetzen. Deshalb müssen Sie solche Szenarien bereits in das Design aufnehmen und Maßnahmen für die Aufrechterhaltung des Betriebs implementieren, bevor die Anlage produktiv eingesetzt wird. Man nennt das auch Design im Hinblick auf Wartbarkeit (Design for Maintainability).

2. Aufbau, Inbetriebnahme und Abnahmetest

Das am besten designte Data Center ist nur so gut, wie die entsprechenden Pläne während der Aufbauphase umgesetzt werden. Strenge Aufsicht und Qualitäts-Kontrollen sind während des Aufbaus notwendig. Deswegen gehören regelmäßige Inspektionen zum Pflichtprogramm. Umfassende Tests durch qualifizierte Techniker sind ebenfalls nötig, damit die Einrichtung für den Einsatz wichtiger Unternehmens-Operationen zertifiziert werden kann. Diesen Prozess nennt man Abnahmetest (Commissioning). Hierzu gehört auch die Prüfung, ob ausreichend Personal für das Projekt zur Verfügung steht. Diese Mitarbeiter müssen selbstverständlich für diesen Standort geschult sein. Außerdem müssen ihnen von Tag Eins komplette und aussagekräftige Dokumentationen vorliegen.

Eine formale Abnahme fängt bereits während der Designphase an, wenn nicht sogar schon früher. Somit lassen sich Bebaubarkeit und Wartbarkeit besprechen. Weiterhin können Sie frühzeitig klären, ob das Design den Erwartungen hinsichtlich Performance der Einrichtung gerecht wird. Eine Abnahme beinhaltet auch verschiedene Stufen an Tests und Verifikationen. Dazu gehören Werksabnahmen, Auslieferung und Erhalt von Ausrüstung, Kontrollbesuche, zweckmäßige Performance-Tests und auch integrierte Systemtests.

Die O&M-Mitarbeiter sollten im Abnahme-Prozess während der Konstruktionsphase, der Inbetriebnahme und der Test-Prozeduren immer involviert sein. Somit bekommen die O&M-Mitarbeiter wertvolle und manchmal einzigartige Einblicke in diese Aktivitäten. Sie können hier mit Sicherheit etwas lernen. Diese Erkenntnisse lassen sich wiederum verwerten, wenn die Mitarbeiter später mit der Verantwortlichkeit des operativen Ablaufes vertraut sind. Es gibt keine bessere Möglichkeit für praktische Übungen als während dieser Phase. Ebenso bekommen die Mitarbeiter zu dieser Zeit tiefe Einblicke bezüglich der speziellen Nuancen des jeweiligen Standorts.

3. Betrieb und Wartung: Mitarbeiter und Organisation

Die unternehmenskritische Einrichtung wird von Menschen betrieben und gewartet. Diesem Bereich muss man im Vorfeld genauso viel Aufmerksamkeit und Überlegungen spendieren, wie das für alle anderen Aspekte des gesamten Prozesses gilt. Die O&M-Mitarbeiter sollten vor dem offiziellen Start des Data Centers festgelegt, organisiert und dementsprechend geschult sein. Ein sehr wichtiger Gesichtspunkt sind die Fertigkeiten, die zum Betrieb und Wartung des Standorts notwendig sind.

  • An welche Abteilung erstatten die Mitarbeiter die Berichte?
  • Für welche Aufgaben sind die fest angestellten Leute verantwortlich und was erledigt man via Outsourcing, inklusive SLA (Service Level Agreements)?

Eine der ersten Fragen sollte sein:

  • „Wird die O&M-Organisation zwischen Mitarbeitern differenzieren, die O&M-Services für die kritische Infrastruktur anbieten, oder wird eine Organisation alle O&M-Aktivitäten erledigen – kritisch und nicht-kritisch?“.

Im Idealfall gibt es dedizierte Mitarbeiter, die nur für die kritische Infrastruktur verantwortlich sind. Eine separate Gruppe übernimmt die nicht-kritischen Bereiche. Ein fortlaufender Betrieb bedeutet kontinuierliche Wachsamkeit und Fokus hinsichtlich der kritischen Systeme (7/24/dauerhaft). So wichtig ein undichtes Fenster auch sein mag, vor allen Dingen wenn es sich an einer exponierten Stelle befindet, könnte das die Mitarbeiter vom Fokus auf die unternehmenskritischen Operationen ablenken. Weiterhin sollten die Budgets für kritische O&M-Ausgaben nicht mit anderen Ressourcen in Konflikt stehen. Dazu gehören Möbel, Landschaftsgestaltung und andere notwendige Ausgaben.

4. Prozesse für den Betrieb und die Wartung

Betrieb und Wartung von unternehmenskritischen Einrichtungen bestehen nicht nur aus einer Ansammlung von Prozeduren. Es ist eine Strategie, die ganz klare Ziele und Grundsätze verfolgen muss. Weiterhin gehören dazu gut definierte Rollen und Verantwortlichkeiten. Ebenso ist eine Abteilung notwendig, die sich nur auf den dauerhaften Betrieb fokussiert. Natürlich brauchen Sie ausreichend Ressourcen, um diese Ziele erfüllen zu können.

  • Zu welchem Zeitpunkt ist der Standort am gefährdetsten und benötigt somit eine Bestbesetzung?
  • Wie sieht es während der Nacht und an Wochenenden aus, wenn Vertragspartner, Lieferanten und Ersatzteile nicht einfach verfügbar sind?
  • Was passiert während der Geschäftszeiten, wenn ein Ausfall den meisten Schaden anrichtet?

Ganz offensichtlich hängt die Antwort auf diese Fragen mit der Aufgabe des Standorts ab. Sollte er Business-Aktivitäten unterstützen und somit am wertvollsten während der Geschäftszeiten sein, haben Sie bereits eine mögliche Antwort. Muss der Standort aber immer laufen und ist 7/24/immerzu wichtig, wenn es zwischen Montagmorgen und Samstagnacht keinen Unterschied gibt, wird die Antwort anders ausfallen.

Allerdings können Antworten auf diese Fragen weitere nach sich ziehen.

  • Wo lagern Sie zum Beispiel wichtige Ersatzteile?
  • Brauchen diese Klimatisierung und ebenfalls regelmäßige Wartung?

Denken Sie zum Beispiel an rotierendes Equipment und Sie wollen die Ölung erhalten oder Wölbungen verhindern.

  • Brauchen Sie betriebsinterne Expertise in Sachen Administration von komplexen Monitoring- und Kontroll-Systemen? Das gilt auch für die Voraussetzungen, um die Systeme zu betreiben.
  • Welche Ersatzteile sind als unternehmenskritisch eingestuft und werden deswegen direkt vor Ort gewartet?
  • Welche Tools, Ausrüstung und Inventar brauchen Sie dafür?
  • Werden Sie dafür ein computerbasiertes Wartungs-Management-System (Computerized Maintenance Manangement System) einsetzen?
  • Wenn ja, wer wird das aufbauen und konfigurieren?

Bezüglich der Wartungsprogramme für Standorte gibt es signifikante Unterschiede. Bei unternehmenskritischen Einrichtungen tendiert man eher zu High-End-Produkten. Für die meisten Anlagen gibt es in der Regel geplante Wartungsfenster. Routine-Aufgaben, die auf Zeitintervallen oder Frequenz basieren, werden als vorsorgliche Wartung referenziert. Zum Beispiel wird man bestimmte Ausrüstung monatlich inspizieren. Riemen prüfen und justieren Sie möglicherweise nur einmal im Vierteljahr. Filter ersetzen Sie vielleicht alle sechs Monate und interne Säuberungen sowie Sensor-Kalibrierung finden jährlich statt. Das Manko an dieser Stelle ist, dass diese Aufgaben so oder so anfallen. Sie hängen nicht vom aktuellen Betriebszustand ab. Diese Umstände lassen sich verbessern, wenn sie auf der tatsächlichen Laufzeit der Ausrüstung basieren. Aber auch das berücksichtigt den aktuellen Betriebszustand nicht.

Eine Verbesserung in diesem Bereich lässt sich mit dem Einsatz von zustandsbasierter Monitoring-Technologie realisieren. Damit können Sie die Ausrüstung nach tatsächlichem Betriebszustand warten. Ein einfaches Beispiel ist der Einsatz eines Differenzdrucksensors, um den Zustand bei Filtern zu überwachen. Sobald sich der Filter füllt, steigt das Delta-P. Nun können Sie den Filter dann ersetzen, wenn die Notwendigkeit besteht.

Setzen Sie diese Zustands-Monitoring-Technologien ein und erhalten dementsprechend Daten, können Sie eine notwendige Wartung sogar voraussagen. Man nennt das auch vorausschauende Wartung (Predictive Maintenance). Sie können sogar Schwellwerte festlegen, wann Sie das System benachrichtigen soll. Analysieren Sie die Entwicklung, lässt sich das Erreichen der Grenzen voraussagen und somit Ausfällen vorbeugen.

Zum Beispiel beinhalten diese Zustands-Monitoring-Technologien Vibrations-Analyse, Reibungslehre (Ölungs-Analysen) und thermische Infrarot-Scans. Diese Technologien können Ihnen unglaubliche Erkenntnisse liefern, in welchem Zustand das Equipment ist. Das gilt selbst dann, wenn es sich im laufenden Betrieb befindet. Ein Abschalten oder Wartungsausfälle sind somit nicht notwendig.

Fazit

Es ist absolut notwendig, dass Sie alle Aspekte hinsichtlich Betrieb und Wartung sehr früh in den Entwicklungsprozess der Standortansprüche einfließen lassen. Andernfalls lassen Sie die Gelegenheit aus, die O&M-Voraussetzungen in das Design und den Aufbau einzubeziehen. Für das Design, den Aufbau und die Inbetriebnahme von unternehmenskritischen Einrichtungen fallen beträchtliche Investitionen an. Sie sollten den Themen Mitarbeiter, Programme und Ressourcen genauso viel Zeit bei den Überlegungen zukommen lassen, wie Sie das für die Aufgaben der Anlage praktizieren. Schließlich wachen die Angestellten über die Einrichtung und sorgen für einen reibungslosen Ablauf.

Über die Autoren:

John B. Collins, Geschäftspartner bei Syska Hennessy Group, bringt über 30 Jahre Erfahrung in Sachen unternehmenskritischer Einrichtung und deren Management mit sich. John war als Consultant für Betrieb und Wartung in den Bereichen mechanischer und elektrischer Systeme tätig. Er ist ein technischer Spezialist im Bereich Entwicklung von Betriebs- und Wartungs-Dokumentation durch Untersuchungen vor Ort, CAD-Schemata und computerbasierten Datenbank-Konfigurationen. John hat weiterhin als Projekt-Manager in vielen Data-Center Power-Downs gearbeitet und bringt sehr viel Erfahrung mit Betrieb und Wartung unternehmenskritischer Anlagen mit sich. Vor Syska war John für den Data-Center-Betrieb im Finanz-Sektor angestellt. Bei Syska Hennessy arbeitet John in den Gruppen Critical Facilities und Facility Management.

Terry L. Rodgers, CPE und Geschäftspartner bei Syska Hennessy Group, hat über 25 Jahre Erfahrung mit unternehmenskritischer Einrichtung und deren Management. Terry erwarb ein BSME von Virginia Tech im Jahre 1981. Bei Syska arbeitet er derzeit in den Gruppen Critical Facilities und National Commissioning. Außerdem ist er seit 2004 ein aktives Mitglied des ASHRAE Technical Committee 9.9. Er ist weiterhin Mitglied des Syska Critical Facilities Technical Leadership Committee und Vorsitzender des Syska Green Critical Facilities Commitee. Terry hat an mehreren Büchern, Whitepapern und Präsentationen zu unternehmenskritischen Einrichtungen mitgeschrieben.

Artikel wurde zuletzt im Januar 2014 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Essential Guide

Notfall-Management mit Business Continuity und Disaster Recovery

0 Kommentare

Älteste Beiträge 

Passwort vergessen?

Kein Problem! Tragen Sie Ihre E-Mail-Adresse unten ein. Wir werden Ihnen eine E-Mail mit Ihrem Passwort schicken.

Ihr Passwort wurde an die folgende E-Mail-Adresse gesendet::

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchStorage.de

SearchNetworking.de

SearchEnterpriseSoftware.de

Close