Hallo Welt,
ich weiß nicht genau ob ich mir das Problem bei einem Update oder durch eine neue Integration eingetreten habe. Der Zustand ist jedenfalls unbefriedigend.
Ich kann in unregelmäßigen Zeitabständen auf die Weboberfläche (mit Port 8123) nicht mehr zugreifen. Der Browser meldet einen Verbindungsfehler. Das passiert momentan so ca. aller 2 Tage.
Manchmal aber nur manchmal, komme ich noch per SSH drauf und kann die Kiste zumindest geordnet neu starten. Manchmal ist das Netzwerk auch komplett tot.
Alle Automationen laufen im Hintergrund weiter, Licht geht an und aus, Heizung, alles prima.
Mein HA läuft in einer VM mit KVM, dafür habe ich so installiert, wie das in Install Home Assistant OS with KVM on Ubuntu headless (CLI only) - Community Guides - Home Assistant Community beschrieben ist, nur das bei mir auf dem Host Debian arbytet. Das lief auch ungefähr 2 Jahre völlig fehlerfrei, weshalb ich halt vermute: Ein Update, eine neue Integration. Momentan „beseitige“ ich den Absturz, indem ich über den Host, auf dem die VM läuft, an der Shell mit virsh das Ding reboote.
Wie debuggt man sowas? Ich würde ungern jetzt tagelang mal diese, mal jene Integration deaktivieren, zumal ich immer so 3 Tage warten müsste um ein Ergebnis zu erhalten. Ich habe >30 Integrationen, das würde dauern. In einem vollständigen Linux würde ich jetzt nach /var/log/syslog oder den entsprechenden systemd-Zeug gucken, aber nichts davon sehe ich, wenn ich mich via SSH einlogge?
Das Logfile der Weboberfläche ist unauffällig.
Ich habe zur Diagnose die Integration „System Monitor“ installiert. Festplattenplatz und RAM sind ausreichend vorhanden, die CPU idelt so vor sich hin. Auffällig ist, bei jedem Neustart des Systems werden schlagartig 500 MByte Speicher frei. Das erscheint mir für bissel /tmp relativ… viel? Oder sind das normale Größen?
Also, wie debugge ich das? Danke fürs Lesen.
VG Jörg