Als das IT-System von Alunorf, dem größten Aluminiumwalz- und -gießwerk der Welt, vor einigen Jahren abgekündigt wurde, machte sich die Organisation auf die Suche nach einem Ersatzsystem. Die Verwaltung und Steuerung sowohl der Schacht- als auch der Stoßöfen war davon abhängig. Nachdem ein Clustersystem in Betracht gezogen wurde, entschied sich Alunorf schließlich für ein System, das auf fehlertoleranten Servern von Stratus Technologies aufbaut. Diese Fallstudie erklärt, warum.
Unterstützt den Produktionsbetrieb von Alunorf, dem weltgrößten Aluminiumwalz- und -gießwerk
Gewährleistet die ständige Verfügbarkeit des Bereichskontrollsystems zur Erfüllung der Gesundheits- und Sicherheitsanforderungen im Warmwalzwerk
Eliminiert den Bedarf an komplexen, kostspieligen Clustering-Lösungen
Ermöglicht eine unterbrechungsfreie Systemwartung und -reparatur, um einen 24/7/365-Betrieb mit null Ausfallzeiten in sechs Jahren zu gewährleisten
Lösung
Stratus ftServer für die Verwaltung und Steuerung von kritischen Schacht- und Stoßöfen
Geschäftsziele
Alunorf in Neuss in Deutschland ist das weltweit größte Aluminiumwalz- und -gießwerk. Mit einer Jahresproduktion von 1,5 Millionen Tonnen Aluminiumwalzen pro Jahr muss dieses teure, stark ausgelastete und komplexe Werk viele ernsthafte Gesundheits- und Sicherheitsanforderungen erfüllen, weshalb eine hohe Verfügbarkeit bei den Kaufkriterien für ein Ersatzsystem an erster Stelle stand.
Alunorf produziert extrem schwere Aluminiumbarren, die beim Ausglühen in den Gruben- und Stoßöfen und auf einer Warmbreitbandstraße heiß sind - etwa 500 Grad Celsius. Diese Barren werden dann zu riesigen Bändern von fast 200 Metern Länge ausgewalzt. Das Aluminium wird auf Raumtemperatur abgekühlt, in den Kaltwalzwerken weiterverarbeitet und dann auf eine Dicke von nur 0,2 mm gewalzt, bevor es zur Weiterverarbeitung z.B. an die Automobil- oder Verpackungsindustrie verkauft wird.
Alle technischen Anlagen von Alunorf befinden sich im Bereich des Warmwalzwerks: Kräne, Fräsmaschinen, Öfen, Walzen und Schneidemaschinen, alles genau aneinandergereiht. Sollte ein Glied in der Verarbeitungskette ausfallen, würde die gesamte Produktionslinie zum Stillstand kommen. Angesichts der hohen Investitionen in die Anlage und ihrer vollen Auslastung würde dies erhebliche Kosten verursachen. Entsprechend hoch sind die Anforderungen an die Verfügbarkeit der Anlage.
"Das Entscheidende war, dass ftServer nicht eine einzige Minute lang ausfiel. Jede andere Lösung hätte uns ein paar Tage Arbeit gekostet ..." Markus Haastert Linienleiter, Alunorf
Die Gruben- und Stoßöfen verfügen über Systeme, die die Anlage steuern, und diese werden von einem Bereichskontrollsystem überwacht, das den gesamten Prozess überwacht. Das Bereichskontrollsystem verfolgt die Aluminiumbarren von der Anlieferung über den Produktionsprozess bis hin zu den fertigen Aluminiumrollen. Dank der Rückmeldungen von den Steuerungssystemen in der Anlage weiß die Bereichssteuerung jederzeit genau, wo sich jedes Aluminiumprodukt im Produktionsprozess befindet. Die Daten von den Steuerungssystemen im Werk werden über ein separates System im Kontrollraum visualisiert. Die hier eingesetzte Software stellt die Schacht- und Stoßöfen des Warmwalzwerks grafisch dar und ermöglicht es den Bedienern, die Spezifika, wie z.B. die Temperatur oder das Gewicht, zu überwachen. Die Software erlaubt auch manuelle Eingriffe in den Produktionsprozess, zum Beispiel zum Anhalten der Produktionslinie bei einer Störung.
Da sowohl das Bereichskontrollsystem als auch das Visualisierungssystem den zentralen Betrieb verwalten und steuern, müssen die Server ausfallsicher sein. Es wurde ein hochverfügbarer Server benötigt, auf dem sie gehostet werden können.
Business-Lösung
"Es ist kein großes Problem, wenn ein System für einige Augenblicke stillsteht", erklärt Markus Haastert, Linienleiter der Schacht- und Stoßöfen im Warmwalzwerk bei Alunorf in Neuss. "Die Anlage arbeitet weiter. Bei kurzen Serverausfällen können die Bediener fehlende Informationen manuell eingeben. Doch in der Regel müssen die Server, genau wie die Produktion, täglich rund um die Uhr arbeiten. Unterbrechungen in der Nacht oder am Wochenende, wenn kein IT-Personal vor Ort ist, müssen schnell und weitgehend automatisch behoben werden.
Ursprünglich hatte Alunorf ein Clustersystem in Erwägung gezogen, das aber für die Abläufe im Warmwalzwerk zu komplex war. Stratus' Fehlertolerante Server (ftServer) waren es nicht. Das System Stratus ermöglicht den Dauerbetrieb. Alle Komponenten - CPU, RAM, IO-Einheit und Platten - sind komplett redundant ausgelegt, es gibt von allem ein Duplikat, so dass bei Ausfall einer Komponente das System ohne Unterbrechung weiterläuft. Aus diesem Grund bieten die Systeme von Stratus eine branchenführende Verfügbarkeit und garantieren eine Betriebszeit von 99,9999 %.
Der Stratus Server arbeitet als eine einzige Maschine, so dass die Benutzersoftware nicht angepasst werden muss. Auch die Administration des Servers ist sehr einfach. Darüber hinaus verfügen die fehlertoleranten Serversysteme über ein umfassendes Wartungs- und Instandhaltungskonzept. Über die Funktion Call Home melden die Server defekte Komponenten direkt an den Hersteller, so dass Ersatzteile ohne Verzögerung verschickt werden. Sie erreichen den Systembenutzer oft schon, bevor dieser überhaupt bemerkt hat, dass ein Teil ausgefallen ist.
"Unterbrechungen in der Nacht oder am Wochenende, wenn kein IT-Personal vor Ort ist, müssen schnell und weitgehend automatisch behoben werden". Markus Haastert Abteilungsleiter, Alunorf
Auswirkungen auf das Geschäft
ftServer hält, was es verspricht - hohe Verfügbarkeit und einfache Implementierung und Nutzung. Es gab auch keine versteckten Kosten:
"Die Software, die wir in den Systemen zur Steuerung der Anlage und im Visualisierungssystem installiert haben, ist äußerst komplex", erklärt Haastert.
"Dies für die Arbeit an einem anderen Hochverfügbarkeitssystem anzupassen, wäre sehr schwierig und teuer gewesen. Außerdem hätte es uns von allen aktuellen Entwicklungen der Programme isoliert". ftServer garantieren aber nicht nur den Weiterbetrieb im Fehlerfall, sondern ermöglichen auch den Austausch der ausgefallenen Komponente bei laufendem Betrieb. Für Wartungsarbeiten müssen die Server nicht heruntergefahren werden, wie Alunorf erfahren hat:
"Ein System meldete einmal einen Fehler in einer IO-Einheit", berichtet Haastert.
"Wir tauschten das betreffende Teil aus, während der Server noch in Betrieb war, wobei nicht mehr zu tun war, als Schrauben zu lösen, die alte Komponente zu entfernen und die neue einzubauen. Unterm Strich war der Server Stratus keine einzige Minute lang außer Betrieb, weder wegen des vorangegangenen Fehlers noch während des Austauschs. Wir mussten auch das System oder die Anwendungen nicht neu starten und haben nichts aus der Datenbank verloren. Jede andere Lösung hätte uns ein paar Tage Arbeit gekostet."
Aufgrund der durchweg positiven Erfahrungen hat Alunorf den Einsatz der fehlertoleranten Server Stratus sukzessive ausgebaut. Heute gibt es im Warmwalzwerk vier fehlertolerante Server für die Schacht- und Stoßöfen, die an 365 Tagen im Jahr rund um die Uhr laufen. Diese Systeme laufen seit sechs Jahren ohne eine einzige Sekunde Ausfallzeit. Sie haben eine geplante Lebenserwartung von zehn Jahren, bevor sie routinemäßig ausgetauscht und durch neuere Modelle ersetzt werden.
"Ich bin sicher, dass wir die erwartete Gesamtlaufzeit ohne einen einzigen Ausfall erreichen werden", so Haastert abschließend.
"Unterbrechungen in der Nacht oder am Wochenende, wenn kein IT-Personal vor Ort ist, müssen schnell und weitgehend automatisch behoben werden". Markus Haastert Abteilungsleiter, Alunorf
Über Alunorf
Die Aluminium Norf GmbH in Neuss ist das größte Aluminiumwalz- und Gießwerk der Welt. Es ist ein Joint Venture zwischen Novelis und Hydro Aluminium und stellt rund 1,5 Millionen Tonnen Aluminiumwalzen für unterschiedlichste Anwendungen her. Der Vertrieb der Produkte erfolgt ausschließlich durch die beiden Gesellschafter.
Das Gelände der Aluminium Norf GmbH erstreckt sich über 575.000 Quadratmeter, was in etwa der Größe von 60 Fußballfeldern entspricht. 268.000 Quadratmeter sind überbaut, 162.000 Quadratmeter werden für Straßen und Lagerflächen genutzt. Die Produktion in Alunorf gliedert sich in drei Bereiche: Aluminiumschmelzen, Warmwalzen und Kaltwalzen. Sie beschäftigt über 2.100 Mitarbeiter. Die Produktion ist in einem Schichtsystem organisiert, um einen Betrieb rund um die Uhr an 7 Tagen in der Woche zu ermöglichen.
Aluminium
Aluminium (Symbol Al-Atomzahl 13) spielt in der modernen Industrie eine wichtige Rolle und wird in Computergehäusen, Getränkedosen, Karosserien des Inter-City-Express (ICE) und Flugzeugrümpfen verwendet. Aufgrund seines häufigen Vorkommens und seiner physikalischen Eigenschaften, insbesondere seines geringen Gewichts - es ist nur etwa ein Drittel so schwer wie Stahl - und seiner Verformbarkeit ist Aluminium ein bevorzugtes Material in der industriellen Produktion. Aluminium ist auch das einzige Metall, das zu 100% ohne Qualitätsverlust wiederverwertbar ist - die Menge an Aluminium, die aus recycelten Produkten verwendet wird, hat in den letzten Jahren stark zugenommen. Mit rund 50 Millionen Tonnen, die jedes Jahr weltweit produziert werden, ist Aluminium heute nach Eisen das am häufigsten verwendete Metall, und die Aluminiumindustrie hat sich zu einer Industrie der Zukunft entwickelt.
Über Stratus Technologien
In der heutigen, ständig aktiven Welt laufen Anwendungen unter immer anspruchsvolleren Bedingungen. Mit diesen steigenden Anforderungen wächst der Druck, selbst kleinste Ausfallzeiten von Anwendungen zu verhindern. Unternehmen reagieren auf diesen Bedarf an Always-on-Lösungen, indem sie nach Technologien suchen, die entweder mit ihren aktuellen IT-Infrastrukturen übereinstimmen oder diese verbessern.
Die Lösungen vonStratus Technologies ermöglichen den schnellen Einsatz von Always-on-Infrastrukturen, von Unternehmensservern bis hin zu Clouds, ohne dass Ihre Anwendungen geändert werden müssen. Stratus Produkte (Software und Server) in Kombination mit Stratus Mitarbeitern ermöglichen es den Kunden, Ausfallzeiten zu verhindern, bevor sie entstehen, und so eine unterbrechungsfreie 24/7/365-Performance der wesentlichen Geschäftsabläufe zu gewährleisten.