Skip to content

Ubuntu rebootet wegen Überhitzung

Ich erwähnte es gerade erst: Seit meinem Update auf Ubuntu 10.10 habe ich das Problem, dass mein Rechner sich ab und an einfach herunter fährt. Meine erste Idee, die Grafiktreiber zu erneuern, brachte keinen Erfolg.

Nach einem Reboot konnte ich noch eben einen Hinweis auf einen "THERMAL_EMERGENCY" erblicken. Der Rechner war also offenbar zu heiß geworden und hatte sich deshalb herunter gefahren. Dieses Problem hatte ich mit der vorherigen Hardy Installation nicht, somit macht meine aktuelle Distribution offenbar etwas falsch. Ein wenig Suche ergab, dass Ubuntu offenbar die Temperatur Sensoren nicht immer korrekt ausliest, Überhitzung vermutet und deshalb den Rechner herunter fährt.

Eine mögliche (und einfache) Lösung ist, dem Kernel die Temperatur Überwachung zu verbieten. Aber Achtung! Dies sollte man natürlich nur tun, wenn man sicher ist, dass die Hardware das selbst erledigen kann, sonst läuft man Gefahr, dass der Rechner ungeregelt den Hitzetod stirbt.

Ausschalten der Kernel Überwachung

Bei meinem Thinkpad ist das der Fall. Es hat eine eigene Überwachung, die den Lüfter je nach Temperatur regelt. Ich vollzog also folgende Änderung an den Boot Parametern meines Systems:

cd /etc/default
sudo gedit grub

Dies öffnet die Einstellungen des grub Bootloaders. Hier sucht man die Zeile mit dem Parameter GRUB_CMDLINE_LINUX_DEFAULT. In der Standard Konfiguration sieht diese wie folgt aus:

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash" 

Diese ändert man in 

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash thermal.off=1" 

und speichert die Datei. Nun muss man diese Änderungen noch in den Bootloader übertragen, was man mit folgender Eingabe erledigt:

sudo update-grub

Danach kann man das System neu booten.

Überprüfung der Sensoren

Um das ein wenig zu beobachten, habe ich mir noch das GNOME Sensors Applet installiert, dass alle möglichen Sensoren in der Menüleiste grafisch darstellen kann.

sudo apt-get install sensors-applet

Nach der Installation muss das Applet noch in die Menüleiste eingefügt werden: Rechter Mausklick auf der Menüleiste, "Zum Panel hinzufügen", im Dialog "Hardware Sensor Monitor" suchen und anklicken. Konfiguriert man das Applet nicht, so werden alle verfügbaren Sensoren dargestellt, was deutlich zu viel ist. Also noch einmal Rechtsklick auf dem Applet und die Einstellungen anwählen. Im Reiter Sensoren kann man dann die nicht relevanten Sensoren ausschalten. Ich habe mir unter acpi die beiden CPU Sensoren, unter nvidia den GCPU Sensor und unter libsensors den fan1 eingeschaltet. So kann ich nun gut beobachten, wie sich z.B. der Lüfter in Bezug auf die Temperaturen verhält.

Besonders schick ist, dass das Applet auch warnen kann, wenn bestimmte Werte unter- bzw. überschritten werden. Durch Doppelklick auf einen der Sensoren im Einstellungsmenü öffnet sich ein Dialog zum einstellen der entsprechenden Temperaturen. Für die beiden CPU Sensoren habe ich die minimale Temperatur auf 68°C eingestellt und die maximale auf 98°C.

Das hat zum einen zur Folge, dass eine Warnung erscheint, wenn die Temperatur sich außerhalb dieses Bereiches befindet, zum anderen wird auch die grafische Darstellung der Sensoren davon beeinflusst. Nur wenn hier Werte eingetragen sind, bewegt sich der Balken im Icon und nimmt eine Farbe an, die darstellt, in welchem Bereich wir uns befinden. Dabei sollte man die Werte weise wählen. Wenn der Minimalwert z.B. zu klein gewählt ist, so wird das Icon nie "kalt" (blau) darstellen, weil der Abstand zur Mindesttemperatur immer zu weit weg ist.

Bei mir sieht das nun wie folgt aus:

 

Wenn ich Filme transcodiere, gehen die CPU Temperaturen dann locker über 90°C, teilweise erreichen sie 97°C (deshalb meine Maximaleinstellung von 98°C, da sie das nicht geschafft haben). Man kann dann allerdings auch schön beobachten, dass die Lüfterdrehzahl steigt und in Folge dessen dann die CPU Temperaturen wieder runter gehen.

Meine Hardware scheint das also problemlos selbst in den Griff zu bekommen und ich sollte problemlos mit obigem Boot Parameter fahren können. Ich habe nun die Hoffnung, dass das sporadische selbstständige Herunterfahren meines Systems Geschichte ist.

Man kann nebenbei natürlich auch weitere Bootparameter angeben neben dem thermal.off=1. Mein System legt z.B. beim Booten immer mal wieder eine recht lange "Denkpause" ein, in der der Bootvorgang zu hängen scheint. Ich hoffe das mit dem weiteren Parameter acpi=noirq zu beheben. Hier sind allerdings noch viele weitere Optimierungen möglich.

Trackbacks

Grischa

Grischa am : CPU schaltet Takt nicht mehr hoch (Lösung)

"CPU schaltet Takt nicht mehr hoch (Lösung)" vollständig lesen
Nach meinem CPU Überhitzungsproblem ist mir nun noch ein anderes extrem lästiges CPU Problem aufgefallen, das erst nach dem Ubuntu Upgrade bei mir aufgetreten ist: Das Speedstepping funktionierte nicht, nach einer bestimmten Zeit blieb die CPU a

Kommentare

Ansicht der Kommentare: Linear | Verschachtelt

Noch keine Kommentare

Kommentar schreiben

Die angegebene E-Mail-Adresse wird nicht dargestellt, sondern nur für eventuelle Benachrichtigungen verwendet.
Dieses Blog erlaubt Dir, Audio Kommentare über audioboo.fm hinzuzufügen. Erstelle einen neuen Boo und gib hier den Link auf die Seite Deines Boos ein.
record
Wenn Du Deinen Twitter Namen eingibst wird Deine Timeline in Deinem Kommentar verlinkt.
Bewirb einen Deiner letzten Artikel
Dieses Blog erlaubt Dir mit Deinem Kommentar einen Deiner letzten Artikel zu bewerben. Bitte gib Deine Blog URL als Homepage ein, dann wird eine Auswahl erscheinen, in der Du einen Artikel auswählen kannst. (Javascript erforderlich)
(Bedingung: 1 Kommentare geschrieben)
Standard-Text Smilies wie :-) und ;-) werden zu Bildern konvertiert.
tweetbackcheck