Inhaltsverzeichnis
Analyse der System Performance High Load Average, Low CPU
Auf einem Linux System steigt urplötzlich die Load Average ohne das aber geleichzeitig die CPU Last ansteigt.
Auch ist ein signifikanter Anstieg von I/O Zeiten nicht zu beobachten.
Analyse:
Top Kommando:
top ... load average: 124.63, 99.59, 107.64 Tasks: 2886 total, 6 running, 2880 sleeping, 0 stopped, 0 zombie Cpu(s): 1.5%us, 1.2%sy, 0.0%ni, 97.2%id, 0.1%wa, 0.0%hi, 0.0%si, 0.0%st ...
Load Historie mit Sar auswerten:
sar -q .. 02:20:01 PM 8 4179 117.76 116.14 108.70 02:30:01 PM 4 4229 124.02 122.32 115.39 ..
Status D (Uninterruptible sleep (usually IO)) der wartenden Prozesse untersuchen:
ps auxf | awk '{if($8=="D") print $0;}'
Ein Prozess im Status „D“ kann nicht abgebrochen werden.
Zitat: … Frequently the most effective manner to do this without hitting the power switch is to pull the power chord. ..
Über lsof püfen, was für Dateien von diesen Prozessen geöffnet sind:
lsof <pid von oben>
Kontrolle von /var/log/messages auf Fehler bzgl. dem obigen Verzeichnis Pfad oder ähnlichen I/O Meldungen:
cat /var/log/messages
Eine mögliche Ursache kann in einem „defekten“ NFS Mounts liegen, die Prozesse wollen auf den NFS Mount zugreifen und die Prozesse warten lange auf eine Antwort.