Direkt zum Inhalt
IT-Sicherheit

Strom und Klimatechnik im Rechenzentrum

Datenverarbeitung und Notstrom im Rechenzentrum, das gehört irgendwie untrennbar zusammen. In engem Zusammenhang steht jedoch auch die Klimatechnik. 

Strom und Klimatechnik stehen im Rechenzentrum in direktem Zusammenhang.
Strom und Klimatechnik stehen im Rechenzentrum in direktem Zusammenhang.

Egal ob sich Rechner in Serverräumen, Rechenzentren, Data Centern oder wo auch immer befinden – Strom und Klimatechnik stehen in direktem Zusammenhang.  Oft sind es wichtige oder gar „missionskritische“ Prozesse, die durch die Rechnertechnik ermöglicht, unterstützt oder ganz übernommen werden. Dies setzt eine gewisse Robustheit oder auch zu neudeutsch Resilienz der unterstützenden Technologien gegen Störungen voraus – und dazu zählen vorrangig und insbesondere die Versorgung mit elektrischer Energie und das Abführen der anfallenden Verlustwärme. Der Ausfall von Ersterem führt zum unmittelbaren Stillstand der Verarbeitung und somit zum Ausfall des Prozesses – ganz schlecht. Bleibt Zweiteres aus, gibt es in vielen Systemen zwar eine gewisse Trägheit, das Überhitzen eines Rechners geht je nach Technologie nicht ganz so abrupt vor sich. Das sichere Ende der Datenverarbeitung passiert somit zwar zeitverzögert, aber trotzdem sehr zweifellos.

Unterbrechungsfreie Stromversorgung ist unerlässlich

Diese Sachverhalte sind hinreichend bekannt und werden von Fachleuten durch das Einplanen von Notsystemen gewürdigt. Hierzu gehören insbesondere die USV (unterbrechungsfreie Stromversorgung) und die NEA (Netzersatzanlage). Letztere wird in der Regel mit fossilem Brennstoff befeuert und treibt einen Generator an. Die Versorgung kann bei entsprechender Kraftstoffbevorratung beziehungsweise entsprechendem Nachschub quasi ewig dafür sorgen, dass die Rechner Strom bekommen.

Die Rechner sind jedoch nur die halbe Miete, genauso ist die Klimatisierung gefragt. Konkrete Analysen in bestehenden Anlagen zeigen jedoch, dass ein ganzheitliches Umsetzen einer funktionierenden Notstromversorgung eine Herausforderung zu sein scheint. Dabei lässt sich ganz abstrakt betrachtet der Notstrombedarf auf drei wesentliche Funktionsgruppen beschränken:

  • die Rechner selbst,
  • die Klimatisierung der Rechner,
  • die Klimatisierung der technischen Infrastruktur.
Anzeige

Als wichtigste Funktionsgruppe ist die Notversorgung der Rechner den allermeisten Planern und Betreibern bewusst. Entsprechend werden USVen eingesetzt, die die sensible Rechentechnik so lange mit Strom versorgen, bis die NEA angelaufen und einsatzbereit ist – ein Prozess, der binnen 15 Sekunden abgeschlossen sein sollte.

Klimatisierung nicht vergessen

Die Klimatisierung hingegen ist offenbar nicht mehr ganz so trivial. Immer wieder zeigen Schwachstellenanalysen auf, dass es, je weiter man sich (entweder räumlich oder organisatorisch) vom Rechenzentrum wegbewegt, immer dünner wird mit dem Thema Notstrom. Umluftkühlgeräte (ULK) in oder neben Rechnerräumen werden meist noch NEA-versorgt, schließlich ist der direkte Zusammenhang zwischen IT-Betrieb und Klimatechnik noch den meisten bewusst. Doch leider brauchen solche Geräte noch weitere Funktionsgruppen, um zu funktionieren. Denn ULK übertragen die anfallende Wärme nur auf ein anderes zumeist flüssiges Medium, das seinerseits ebenso die Wärme irgendwohin „abliefern“ muss, um nicht selbst zu überhitzen.

Dazu dienen je nach Technologie entweder zentrale Kälteerzeuger mit nachgeschalteten Rückkühlwerken irgendwo draußen oder direkte Rückkühler im Außenbereich. Und auf dem Weg dorthin verblasst das Bewusstsein, dass diese Komponenten existenziell wichtig für den IT-Betrieb sind. Oft sieht man, dass solche Elemente entweder gar nicht oder nicht mit hinreichenden Redundanzen notstromversorgt sind. Dann kann das Gesamtsystem die Wärme nicht mehr „loswerden“, überhitzt an irgendeiner Stelle und fällt aus. So ist dann kein gesicherter IT-Betrieb mehr möglich – die Prozesse geraten ins Stocken.

Und natürlich muss das flüssige Medium, das die Wärme vom Rechnerraum zum Rückkühler bringen soll, auch umgewälzt werden. Die erforderlichen Pumpen gehören in ihrer Gesamtheit ebenso auf die Liste mit existenziell notwendigen notstromrelevanten Baugruppen.

Noch weiter weg vom Bewusstsein liegt oft der Klimatisierungsbedarf der technischen Infrastruktur, wie beispielsweise zentraler USV-Systeme. Da diese Geräte permanent Wechselstrom in Gleichstrom wandeln und umgekehrt, erzeugen sie ebenso wie IT-Systeme Verlustwärme, die abgeführt werden muss. Unterlässt man dies, überhitzt ein USV-System und schaltet sich in den Bypass-Betrieb. Dies ist eine Betriebsart, die die unmittelbare Versorgung der Rechner noch nicht einschränkt, kleinste Netzunregelmäßigkeiten hingegen kommen in diesem Modus ungefiltert bei der dann ungeschützten Rechentechnik an. Wer nun angibt, dies bewusst so herbeizuführen, um beispielsweise übermäßige Notstromkapazitäten zu vermeiden, übersieht, dass das Rückschalten in den Normalbetrieb so unter bestimmen Voraussetzungen nicht zu bewältigen ist.

Denn nehmen wir an, der Betrieb hat sich nach einem Netzausfall wie folgt stabilisiert: Server und die gesamte IT laufen im NEA-Betrieb, die Klimatisierung der IT-Räume ebenfalls. Nur die USV-Kühlung ist ausgefallen, da sie nicht notstromberechtigt ist. Folglich werden die USV-Räume immer wärmer, und die Anlagen schalten irgendwann auf Bypass. Nun kommt der Strom zurück, und die Versorgung soll von der NEA wieder auf die reguläre Speisung durch Transformatoren geleitet werden. Im Idealfall erfolgt diese „Rückübergabe“ unterbrechungsfrei – wenn alles funktioniert.

Moderne NEAs verfügen dazu über die Funktion der „Rückübergabe-Synchronisation“. Doch längst nicht jede bestehende Anlage hat diesen Komfort eingebaut. Dann erfolgt das Rückschalten mit einer kurzen Unterbrechung – so wie sie eine USV abfangen würde. Nur leider ist unsere USV durch Hitzeschock gerade im Bypass und somit unpässlich. Was passiert? Die Rechner bleiben beim Rückschalten auf das reguläre Netz stehen, und das, nachdem die NEA lange Zeit funktioniert hat! Das kann nicht befriedigend sein.

Die Wirksamkeit einer Schutzmaßnahme testen

Nun könnte man an dieser Stelle abschließen mit dem Hinweis auf ganzheitliche gewerkeübergreifende Konzipierung und Planung. Jedoch darf hier einmal mehr der Hinweis auf die unbedingte Notwendigkeit auf Funktions- und Resilienztests nicht fehlen. Denn die Wirksamkeit einer Schutzmaßnahme weist man nicht durch Beschreibungen, Schaltschemen und Pläne nach, sondern durch konkrete Tests. Bei diesen Tests wird nichts simuliert, sondern real abgeschaltet. Also Strom aus! Und erst dann sieht man, was ausgeht und was anbleibt. Jedes Mal gibt es Überraschungen und Erstaunen bei den Beteiligten.

So banal also der Zusammenhang zwischen Stromversorgung und Klimatisierung zu sein scheint, so komplex ist er bei vielen Beteiligten und vielen Fachrichtungen. Gut beraten ist hier, wer eine qualitätssichernde Instanz zur Seite hat, die die vorab verabschiedeten Verfügbarkeitsanforderungen auf dem Schirm hat und konsequent deren Umsetzung überwacht und einfordert und die Umsetzung nach der Realisierung oder auch als wiederkehrenden Prozess prüfen kann.

Artikel erschienen im Sicherheits-Berater 8/2020

Jörg Schulz, Bachelor of Business Administration Business Security (BBA),  Sicherheitsberater der von zur Mühlen'sche (VZM) GmbH, Spezialgebiet Hochverfügbarkeit von RZ-Infrastrukturen
Jörg Schulz, Bachelor of Business Administration Business Security (BBA),  Sicherheitsberater der von zur Mühlen'sche (VZM) GmbH, Spezialgebiet Hochverfügbarkeit von RZ-Infrastrukturen

Passend zu diesem Artikel