Scanrail - Fotolia

Best Practices zur Erhöhung der Mainframe-Verfügbarkeit

Mainframes bilden in vielen Unternehmen noch immer das Rückgrat der IT-Abteilung. Diese Best-Practice-Tipps zeigen, wie sich die Verfügbarkeit von Mainframes erhöhen lässt.

Operations- und Anwendungs-Teams haben unterschiedliche Ziele. IT-Mitarbeiter im Operations-Bereich sind an effizienten und hochperformanten Systemen interessiert, Anwendungsentwickler dagegen an schnellen und günstigen Business-Funktionen. In den meisten Fällen sind diese Ziele schwer miteinander zu vereinen und in unserer hochkompetitiven Zeit hat meist die Anwendungsperspektive die Nase vorne.

Aus diesem Grund müssen Operations-Teams widerstandsfähige und fehlertolerante Systeme bereitstellen, die mit jeder beliebigen Anwendung zurechtkommen. Zu diesen Systemen zählen auch heute noch Mainframe-Umgebungen.

Parallelität, Redundanz und darüber hinaus

Schon seit den 1990ern drängt IBM mit der Einführung von Parallel Sysplex auf Parallelität und Redundanz. Die ideale Parallel-Sysplex-Konfiguration sieht identische System-Instanzen vor, die Daten miteinander teilen und ihre Aktivitäten durch eine Kopplungskomponente koordinieren. Der einkommende Traffic wird dabei über einen Workload- oder Verbindungs-Balancer geleitet, etwa einen Sysplex Distributor.

Diese Konfiguration bietet über Parallelität und Redundanz eine hohe Widerstandsfähigkeit gegenüber Ausfällen und Fehlern. Statt das System an der Belastungsgrenze zu nutzen, sollte die Ressourcenauslastung lediglich bei maximal 60 Prozent liegen. Auf diese Weise können bei einem Ausfall einer logischen Partition (LPAR) selbst bei Maximallast die übrigen Prozessoren die zusätzlichen Workloads übernehmen. Dabei können IT-Abteilungen natürlich auch die übrigen Hardwareressourcen wie etwa Memory und I/O-Infrastruktur überprovisionieren.

Zusätzlich hierzu sollte man zwei CPCs (Central Processor Complex) verwenden, wenn alle Workloads von einem abgearbeitet werden können. Eine weitere Möglichkeit, die Widerstandsfähigkeit und Redundanz zu erhöhen, besteht darin, DAS-Geräte (Direct-attached Storage) zu doppeln, um von automatischen Wiederherstellungsfunktionen etwa in IBM HyperSwap oder EMC AutoSwap profitieren zu können.

Um Workloads gegenüber fehlerhaften Anwendungs-Code oder plötzliche Lastspitzen aufgrund eines LPAR-Ausfalls abzusichern, können auch mehr CICS-Instanzen (Customer Information Control System) eingesetzt werden, als an sich nötig wären. Das Betriebssystem inklusive Subsysteme muss so konfiguriert sein, dass es plötzlichen Anstiegen der Workload-Anforderungen standhält. Wenn das Betriebssystem keine virtuellen Speicherressourcen mehr zur Verfügung hat oder das CICS das maximale Task-Limit erreicht, dann spielt es keine Rolle, ob die verbleibende LPAR alle CPU-Ressourcen zur Verfügung hat, die sie benötigt.

Automatisierung und Monitoring in Mainframe-Umgebungen

Wenn Monitoring-Systeme für Mainframes Probleme entdecken, sollte die IT-Abteilung auch eine automatische Alarmbenachrichtigung erhalten. Auf IBM-Systemen ist hierfür IBM Health Checker in das Betriebssystem integriert, über den Mainframe-Administratoren Best-Practices-Empfehlungen für eine bessere Leistungsfähigkeit und Verfügbarkeit erhalten.

Eine schlecht geschriebene oder unzureichend getestete Anwendung kann Geschäftsabläufe unterbrechen und Endlosschleifen, Datenbankblockaden oder auch Memory-Probleme verursachen. Früher hatten Entwickler noch den Luxus, ausreichend Diagnosedaten für das Beheben der Probleme sammeln zu können, heute müssen Programmierer aber vor allem Funktionalität liefern und sind meist schon bei der nächsten Aufgabe, bevor der schlecht programmierte Code überhaupt erst auf die Produktivumgebung trifft.

Best Practices für die Mainframe-Entwicklung

Auch um zu verhindern, dass geteilte Ressourcen Sysplex blockieren, gibt es bestimmte Best Practices. So sollten Anwendungen beispielsweise Ressourcen immer in der gleichen Weise in eine serielle Reihenfolge bringen. Um Workloads in der richtigen Reihenfolge abzuarbeiten und Ressourcenprobleme zu verhindern, sollten zudem diskrete Policies verwendet werden. Auf diese Weise stehen auch dann noch ausreichend Ressourcen zur Verfügung, wenn tatsächlich an einer bestimmten Stelle Ressourcen blockiert werden.

In Zeiten höherer Auslastung können geteilte Ressourcen durch Benutzerkataloge und Daten-Hostspots getrennt werden. Auch eine in kleine Bereiche portionierte Datenbank kann hierbei hilfreich sein. Wer zur Reduzierung der Softwarekosten nur eine kleine LPAR unterhält, der sollte hierfür auch ein Backup erstellen.

Bei der geringen Aufmerksamkeit, die IT-Teams noch auf Bugfixing und Wartung von Mainframes aufwenden können, müssen fehlerhafte Anwendungen automatisch vom System ferngehalten werden. Dabei ist es schwer, den richtigen Schwellenwert zu finden, wodurch meist einfach nach Bauchgefühl entschieden wird, wenn Workloads mehr Zeit als „normal“ in Anspruch nehmen. Trotzdem ist natürlich auch das automatische Lösen von Problemen keine langfristig erfolgreiche Strategie – irgendwann wird jemand einen Blick auf die vorhandenen Bugs werfen müssen.

Die automatische Wiederherstellung fehlerhafter Komponenten betrifft dabei aber auch die Systeminfrastruktur. So wäre etwa eine CICS-Region ohne gesicherten Storage durch Anwendungs-Overlays angreifbar. Im schlimmsten Fall liegt ein Overlay vor, das die CICS-Funktionalität einschränkt, das Customer Information Control System aber nicht vollständig zum Erliegen bringt. Im Ergebnis könnte eine Art Zombie-Region entstehen, die Workloads übernimmt, die aber sofort ausfallen oder zumindest viel zu lange dauern. Als Schutz vor diesem Szenario empfiehlt sich erneut ein Automatisierungsmechanismus, der entsprechend beschädigte Regionen entdeckt und vorm System entfernt.

Folgen Sie SearchDataCenter.de auch auf Twitter, Google+, Xing und Facebook!

Nächste Schritte

Mainframe-Leistung mit vertikaler Polarisierung verbessern

Kapazitätsplanung: CPU-Stunden in MIPS umrechnen

Mainframes und die Compliance nach PCI DSS

 

Artikel wurde zuletzt im September 2017 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Mainframes

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchStorage.de

SearchNetworking.de

SearchEnterpriseSoftware.de

Close