root vs I-node Diebe

Eigentlich war geplant heute weiter zu machen wo ich gestern aufgehört habe.

Ein Anruf der erst nicht für Panik sorgte, schließlich passiert es manchmal, dass ein Server nach dem Reboot, etwas zickt.

Aber in einer virtueller Server der im fsck Ärger macht, ist schon etwas ungewöhnlich. Das er auch noch meint, dass eine inode zu groß wäre und er dann beginnt alle inodes under lost+found zu sammeln, lässt böses erahnen.

Nach einem Restore gleicher Fehler. Na gut also beginnen wir vom Clusterpartner zu „clonen“ und stellen fest, dass der Netzwerk Durchsatz einbricht, sobald er versucht ein Verzeichnis zu kopieren. Die Lösung brachte ein „df -i“ der zeigte im nachhinein, dass dem Filesystem normal nur ~14.000 inodes benötigt, aber in unserem Fall auf beiden Knoten alle 1,3 Mio aufgebraucht hat.

Wikipedia meint ab 15.000 Dateien wären Operationen sehr lahm. Wie zur Hölle löscht man 1,3 Mio. Dateien? Ein find . -name „2007*“ -exec rm {} \; löschte so ca. 5 Dateien in 2 Sekunden. Der Dieb legte aber 2/s neu an. Da blieb nur der Kahlschlag: Dienste beenden und dann rm -rf events der schaffte es ca. 25.000 inodes/s vom Dieb zurück zu erobern. Kaum war der Dienst wieder gestartet pegelte es sich bei ca. 20.000 inodes ein (99% frei).


Comments are closed.