Home Assistant startet zufällig neu – keine Log‑Einträge vor dem Neustart erkennbar

Sicher das du damit noch den selben Kernel wie vorher hattest? Oder doch schon eine neuere für dich und deine Hardware “bessere Version”!?

Wenn dein HA mehrfach am Tag abstürzt, muss man zum debuggen ja nicht besonders geduldig sein. Das ist gut!

Auch wenn du Hardware sicher ausschließt, schadet es ja nicht das Ganze mit einem Kreuztest zu bestätigen. Bei der von dir beschriebenen Fehlerhäufigkeit ware meine Motivation jedenfalls hoch genug dafür. Backup erstellen und HA auf einem NAS, MiniPC, VM oder was auch immer einem zur Verfügung steht, laufen lassen. Zeigt es dort auch mehrfach Abstürze am Tag, untermauert das deine These das es sich um ein Software Problem handelt. Läuft es stabil, könnte die Kombination der Hardware doch die Ursache sein.

Rein Subjektiv, hatte ich bei meinem Pi das Gefühl, dass USB Zubehör (HmIP Stick und Sonoff ZigBee) waren bei mir nicht ganz unschuldig. Jedenfalls konnte ich die Intervalle von Instabilitäten durch Kabel/Steckplatz Tausch verändern.

Ich habe sowohl den PI als auch die SSD ‘gestresst’, die vier Cores des PIs mit einer Load von 100% an den Anschlag gefahren und I/O auf/von M2-SSD über USB ebenfalls. HA lief trotzdem mit einer akzeptablen Reaktionszeit …
Ich habe auch nichts anderes erwartet - an der HW liegt es nicht.
ABER: Ich habe meine Reserve-SSD (baugleich) plattgemacht und HA komplett neu installiert, wie es auch @Andreas77 geschrieben hat. Ich werde das ganze auf die originale SSD spiegeln, dann werde ich sehen, ob es ein HW-Problem mit der SSD sein könnte.
Da mein HA jede Nacht Backups unter anderem auf meinen NAS schreibt und dieser sich mit einem Backup-NAS synchronisiert, war der Aufwand, das halbwegs aktuelle System zu restaurieren nicht sehr groß - hat nur Zeit gekostet.

@Dr.Big ich habe mich auch für eine Neuinstallation entschieden. Da mein System eh immer auf dem neusten Stand halte, habe ich den gleichen Kernel, wie den in der ursprüngliche Installation.
Wie schon mehrfach ausgeführt, ich glaube nicht, dass es an der HW oder dem eingesetzten Kernel liegt.
Ich möchte gerne wissen, wo ich die alten Logs zwecks ‘Trace-Back’ finde. die Logs, die ich sehe zeigen nur die Ereignisse nach dem Neustart …

Warum rückst du mit solchen Infos erst jetzt raus!? :woman_shrugging:

Üblicherweise sind die Logs beim Raspi nicht „persistent“! Sie werden also in den Ram zur vermeidung „unnötiger Schreibzyklen“ (Flash/SD-Card!) abgelegt, überleben also den Neustart nicht, das kann und sollte man zum Debuggen umstellen. Logs kann man problemlos auf „nicht flüchtigen“ Speicher wie zum Bsp.deine SSD umleiten/schreiben lassen, Dann überleben die auch einen Neustart!
Im HAOS wird das ganze noch restriktiver gehandhabt, ow es dort so einfach umzustellen geht , weiß ich nicht! Dazu sollten sich aber Informationen im Netz finden lassen!?

Leider keine Lösung von mir, nur ein Hinweis:

Auch ich habe bei diversen Fehlfunktionen schon mehrfach geglaubt: „Daran kann es eigentlich nicht liegen.“
Durch Ausschlussverfahren, wenn auch zunächst widerwillig, bin ich aber manchmal eines Besseren belehrt worden. :thinking:

2 „Gefällt mir“

Um nochmal zu der Ursprungsfrage zurück zu kommen:
Versuche es mal damit:
ha core logs -n 999 > /config/logs_logs_logs.log
So kannst du dir bspw die letzten 999 Einträge in eine Datei schreiben lassen. Da müssten auch Logs vor dem Neustart dabei sein.

Alternativ könntest du probieren:

ha core options --duplicate-log-file=true
ha core rebuild
ha core restart

Das aktiviert die Log-Files im Config Verzeichnis. Evtl findest du dann die home-assistant.log.1 file Datei.
Quelle: Bring back home-assistant.log for supervised users · home-assistant · Discussion #1527 · GitHub

1 „Gefällt mir“

Vielen Dank, ich habe alles mir bekannte und basierend auf dem, was ich in Foren gelesen habe ausprobiert. Und ja, ich habe Netzteil und den PI4 - eher den PI - mit einfachen Scripts (CPU-Loat, Memory, SSD-IO über USB3) an die Grenzen ‘gefahren’. Weder Netzteil, PI4 noch mittels USB3 angeschlossene SSD zeigten Probleme.
Ja, ich habe die Tests in Schleifen mehrere Stunden laufen lassen.
Homeassistant blieb halbwegs ‘elastisch’ obwohl die Prozessoren n-mal überlastet waren …
Mein Problem liegt doch darin, dass ich sehen wiil, was vor dem Restart von HomeAssistant passiert ist und welche Integration bzw. welches AddOn Probleme gemacht haben, bzw. ob und wie sie fehlerhaft konfiguriert waren.
Ein Hardwareproblem kann ich inzwischen definitiv ausschließen.

Hast du denn mal die Optionen zum Auslesen der Logs, die ich vorgeschlagen habe, ausprobiert??

1 „Gefällt mir“

Wie @Andreas77 geschrieben hat, es hat nur eine komplette Neuinstallation von HomeAssistant geholfen. Einfach nur alte Backups neu einspielen hat das Problem nicht gelöst, die ‘Kiste’ hat trotzdem mehrmals eine Re-Start durchlaufen.
Einfach ins ‘kalte Wasser gesprungen’ und System neu aufgesetzt → es lebe das Backup, das ich täglich auf den NAS ziehe.
Das Problem, das zum mehrfachen täglichen Neustart geführt hat ist whol weg. Ich traue dem aber nicht, weil ich die Logs vor dem Neustart nicht sehe.
@MarzyHA, ja ich habe die Kommandos, die Du empfohlen hast ausgeführt. Nun gibt es zwar eine Datei ‘home-assistant.log.1’

@MarzyHA Ja, ich habe die von Dir vorgeschlagenen Kommandos ausgeführt - Vielen Dank für die Hinweise. Letztenendes wird eine Art einfaches ‘Log-Rotate’ mit dem vorhergehenem Log gemacht, wenn das System regulär runterfährt. Nun sehe ich auch home-assistant.log.1 - also das vorherige Logfile wird nach ‘Home-assistant.log.1’ kopiert. Das scheint aber nur zu funktionieren, wenn HA ‘regulär’ runtergefahren wird. Wenn er einfach nur ‘abstürtzt’ oder Strom abgeschaltet wird, habe ich keine Indizien, die auf die Ursache schließen lassen.
@Andreas77 ich habe mich auch dazu entschieden, HA komplett neu aufzusetzen. Weil ich tägliche und mauelle Backups 30 Tage lang auf meinem NAS speichere, hat sich der Aufwand in Grenzen gehalten.
Das ‘Resart-Poblem’ ist weg. Dumm nur, dass ich die Ursache dafür nicht mehr sehen kann :thinking:.
Auch kann ich einen Neustart nicht provozieren, indem ich einfache Scripts verwende, die CPU- und Speicherlast an die Grenze fahren. Wenn RAM und Swap am Anschlag sind, haut Linux den Prozess raus, was heute auch funktioniert. Das war am Anfang von Linux vor 30 Jahren noch nicht so :wink:.
Ich habe alle 60 Sekunden nacheinander 4 Prozesse gestartet, die Speicher allozieren solange bis RAM + SWAP am Anschlag sind. 4 Prozesse, um alle vier Kerne auszulasten. Wenn RAM+SWAP am Anschlag sind, wirft Linux einen der Prozesse raus und gibt die Ressourcen frei bis der Speicher wieder am Anschlag ist. Dann wird der nächste Prozeß rausgeworfen und so weiter …
Den Homeassistant selbst konnte ich damit nicht in die Knie zwingen.
Das Problem, warum HA mehrmals pro Tag zufällig neu gestarte hatte, konnte ich nicht auflösen :neutral_face:.

Ich habe keine Alternative mehr gefunden.
Lösung: HomeAssistant neu installieren und Backup vom NAS (oder einem “externen” Speichermedium, wenn kein NAS) wieder einspielen.
Bin etwas irritiert, weil einfach nur ein ‘Restore’ des Backups nicht ausgereicht hat. Ich habe HA ‘from scratch’ neu installiert und dann das gleiche Backup wieder eingespielt :thinking: → geht wieder …
Mir wäre es lieber, wenn ich das Problem in den Logs gesehen hätte, aber ‘Holzhammer’ hat am Ende geholfen. Es lebe das regelmäßige Backup auf einem externem Speichermedium !!!

1 „Gefällt mir“