Netzwerkstörung

Art
Betriebsunterbruch
Status
geschlossen
Datum/Zeit
05.02.2025, 04:21
Betroffen
Von der Störung betroffen waren folgende Dienste: METAhost-, METApress- und Reseller-Systeme, sämtliche E-Mail-Dienste, Managed und Root Cloud Server, Virtual Data Center Systeme, Website-Builder, METANET-Statusseite sowie die DNS-Cloud Server (dns.sui-inter.net)
Kurzbeschrieb

Am 5. Februar 2025 kam es zwischen 04:21 Uhr und 13:20 Uhr zu einer unerwarteten Störung, die zum Ausfall unserer Services führte.

Ursache
Technische Probleme an der Kühlanlage unseres Datacenter-Partners.
Updates
  1. 05.02.2025, 15:05 Auch Website Builder-Webseiten sind nun wieder erreichbar.
  2. 05.02.2025, 14:06 Es werden derzeit noch Probleme mit dem Website Builder und den damit erstellten Websites geprüft.
  3. 05.02.2025, 11:56 Nach dem Austausch mehrerer Hardware-Komponenten (Switches) sind nun weitere Server wieder erreichbar. Unsere Techniker arbeiten weiterhin daran, auch die verbleibenden Störungen zu beheben. Vielen Dank für Ihre Geduld.
  4. 05.02.2025, 10:52 Alle Shared Hosting Systeme (METAhost, METApress und Reseller-Abonnemente) sind wieder online. Eine Störung der Website-Builder-Server wird derzeit noch untersucht. Ebenso dauern die Netzwerkarbeiten für mehrere Managed und Root Cloud Server und Virtual Data Centers noch an. Unsere Techniker arbeiten weiterhin unter Hochdruck daran, die Erreichbarkeit und Stabilität der Systeme wiederherzustellen.
  5. 05.02.2025, 08:54 Erste Server sind wieder online. Unsere Techniker arbeiten weiterhin unter Hochdruck an der Behebung der Störung.
Ursachenanalyse

Technische Probleme bei den Kühlanlagen unseres Datacenter-Partners führten in der Nacht zu einem plötzlichen, drastischen und anhaltenden Temperaturanstieg, woraufhin ein Teil unserer Systeme automatisch heruntergefahren wurde. Beim anschliessenden Neustart zeigte sich, dass mehrere zentrale Komponenten (Switches) nicht mehr einwandfrei funktionierten. Um die Systeme stabil und sicher wiederherzustellen, war der Ersatz dieser Hardware notwendig, was die (Wieder-) Inbetriebnahme leider verzögerte.

Massnahmen

Neben der technischen Analyse in Zusammenarbeit mit dem Rechenzentrumsbetreiber evaluieren wir Massnahmen, um vergleichbare Vorfälle künftig zu vermeiden. Zusätzlich optimieren wir unsere Kommunikationsprozesse – insbesondere für Szenarien, in denen auch unsere Statusseite betroffen ist. Eine Option ist, diese unabhängig vom restlichen System zu hosten, um künftig auch in solchen aussergewöhnlichen Fällen schneller und zuverlässiger informieren zu können.

Alle Systeme sind mittlerweile wieder vollständig verfügbar.

Für die entstandenen Unannehmlichkeiten bitten wir um Entschuldigung.