Direkt zum Inhalt Direkt zur Suche Direkt zur Navigation

Humboldt-Universität zu Berlin - Mathematisch-Naturwissenschaftliche Fakultät I - Institut für Physik

Ausfälle im Mailsystem

Umzug der INBOXen am 11.06.2009 ca. 21:00 bis 22:30 Uhr
In der letzten Zeit kam es zu vermehrten Störungen u.a. im Mailsystem des Instituts für Physik.
Dafür ist eine Reihe von Ursachen verantwortlich.

Kurzfassung der Ursachen: Extremstress durch zu große Mailboxen auf bis zu 6 Jahre alter Speichertechnik.

mehr ...
Als Workarround, um dem entgegen zu wirken, musste zeitweise die Annahme von neuen Verbindungswünschen von Mailclienten zwangsweise blockiert werden, um laufenden Prozessen deren Beendigung zu ermöglichen, das führte zu wechselnden Eindrücken über die Verfügbarkeit des Maildienstes.

Wir nutzen zur Speicherung fast aller Daten, u.a. aller Mailboxen den Service des CMS.
Diese Technik stammt aus der Zeit des Umzugs nach Adlershof und hatte Standzeiten von über 700 Tagen ohne Unterbrechung - lediglich planmäßige Wartungsunterbrechungen.
Auf diesem Weg, konnte sichergestellt werden, dass einmal vorhandene Daten zuverlässig auf Speichermedien lagern.

Seit ca. 3 Monaten werden umfangreiche Mittel investiert, diese Technik durch neue zu ersetzen, dieser Prozess ist noch nicht abgeschlossen, erfolgte am 11.06.2009 ca. 21:00 - 22:30 Uhr aber bereits für die INBOXEN, in dieser Zeit war jeder Mailverkehr unterbrochen.

Gleichzeitig ist das Mailvolumen um ein vielfaches angestiegen und hat in den letzten Tagen/Wochen derartig viel Stress auf unseren Servern, insbesondere im Filesystem verursacht, dass die "alten" Maschinen schneller an ihre Grenzen gestoßen sind als die neuen einsatzbereit waren.

Der Hauptstress auf dem Mailsystem entsteht aber durch eine ungeeignete Struktur der Mailboxen der Nutzer. Unser Mailsystem ist weitgehend ohne Beschränkungen ausgelegt, was aber im Gegenzug die Verantwortung der Nutzer erhöht.

Es gilt nach wie vor die Empfehlung, das IMAP-Protokoll  zum lesen der Emails zu verwenden. Das hat den entscheidenden Vorteil, dass nur so von verschiedensten Internetpositionen aus jeder Nutzer dieselbe Mailstruktur sieht und die Emails auf hochredundanten Speichermedien, geschützt vor allem gegen Festplattenausfall als häufigste Hardwareursache für Datenverlust, lagern.

Das Mailsystem verlangt eine Struktur von überschaubaren Mailboxen, insbesondere der INBOX. Emails mit großen Attachments, alte Emails in großer Zahl, als SPAM markierte Emails müssen so schnell wie möglich aus den INBOXEN entfernt werden. "Normal" ist max. 1000 Emails je max. 10 KB, d.h. ca. 10 MB INBOX-Volumen. Die Durchschnittliche INBOX-Größe bei ca. 1300 Nutzern beträgt z.Zt. etwa 80 MB, Spitzenwerte sind 800 MB!

Hinweis: Ordnen Sie ihre Emails in eine geeignete Ordnerstruktur, verkleinern Sie insbesondere ihre INBOX. Nur so kann vermieden werden, dass serverseitige Beschränkungen, die auch einen extrem hohen Verwaltungsaufwand hätten, eingeführt werden müssen.

Nutzen Sie das Webinterface , um serverseitig SPAM-Mail löschen zu lassen:  Optionen -> SpamAssassin Configuration -> Ihre aktuelle Strategie.

In diesem Zusammenhang wird an der Einführung alternativer Serversysteme gearbeitet, die einerseits einen nahtlos Übergang gewährleisten und andererseits seit ca. ein bis zwei Jahren an anderen Stellen erfolgreich eingesetzt werden und sich nicht mehr im Experimentierstadium befinden.

Hohe Performance und höchste Datensicherheit stehen eher im Widerspruch zueinander, denn im Einklang. Alle Maßnahmen werden vorrangig unter dem Aspekt der Datensicherheit durchgeführt.

PS: Daneben gibt es andere Begleitumstände, wie eine Grunderneurung des HU-Netzwerkes, Probleme durch "verseuchte Rechner", Stromausfälle trotz USV-Technik, Hardwareausfälle an Stellen, die nicht/noch nicht redundant ausgelegt sind, natürlich auch Konfigurationsirrtümer und ...

letzte Ausfallzeiten: (Stress: meist verbunden mit Zwangserholung)
28.4.
          8:27    unbekannt
        16:04    4 min          Stress
8.5.
        12:46    13 min        Stress
        13:28    31 min        Stress
        14:53    12 min        Stress
        15:20    19 min        Stress
        16:37    25 min        Stress
20.5.
        23:17    1 h 17 min  Filesystemwartung
21.5.
        21:14    4 min          Stress
2.6.   
        15:18    11 min        Stress
10.6.
        13:26    18 min        Stress
        14:19    39 min        Stress
        16:14    34 min        Stress
        17:11    23 min        Stress
        18:20    45 min        Stress
        21:19    1 h 1 min    Stress
11.6.
        12:08    46 min        Stress
        13:09    11 min        Stress
        14:56    23 min        Stress
        16:17    26 min        Stress
        17:02    23 min        Stress
        18:19    53 min        Stress
        19:43    19 min        Stress
        21:00    1 h 30 min  Umzug INBOXen