Mein HA stürzt, Mal mehr Mal weniger häufig ab. Aber wenn, dann um kurz nach vier Uhr morgens. Im Webinterface erscheint die Meldung ‚Error while loading page system‘. Mir fehlt ehrlich gesagt der Ansatz zur Lösung des Problems. Was passiert in HA gegen 04:14 Uhr und wie muss ich vorgehen um das Problem zu lösen? Warum bekomme ich die Meldung „Mehrere Laufwerke erkannt“ und warum finde ich in den Protokollen dazu absolut nichts?
Das kam mir auch gerade so in den Sinn. HA macht zu diesem Zeitpunkt eventuell auch ein BackUp, wenn das automatische, mit Systemoptimum aktiviert wurde.
Es würde mich wundern, wenn HA abschmiert, wenn die Internetverbindung getrennt ist. Mein backup landet auf einem NAS und neuerdings auch in der nabucasa Cloud. Aber der Fehler ist schon vor der Nabucasa cloud aufgetreten. HA läuft auf einem Pi4 8GB.
Dann schau dir mal das Netzteil an. Wenn das mittlerweile zu wenig Power hat, kann sowas passieren. Je mehr Integrationen und Addons um so mehr Ampere braucht das Netzteil. Wenn dann noch ein Backup gemacht wird, dann kann es das schon gewesen sein. Mindestens 4 Ampere, besser mehr.
HA führt zu diesem Zeitpunkt einige Sachen im System aus, wie Datenbankbereinigung, Backups oder Neustart von bestimmten Integrationen. Könnte doch wirklich damit zusammenhängen. Ich nutze auch einen Pi4 mit 3A Netzteil und hatte damit bisher noch nie Probleme.
Das Backup wird als Automatisation um 02:15 Uhr angestoßen und auf eine Festplatte an meiner Fritzbox gespeichert. Das läuft auch durch. Neu hinzugekommen ist vor kurzem das automatische Backup von HA. Das hat gestern und heute nicht funktioniert, HA hatte sich zu dem Zeitpunkt bereits aufgehängt. In den Einstellungen steht dass das automatische Backup ab 04:45 gestartet werden soll. Aber den Fehler hatte ich schon bevor ich diese Funktion eingerichtet habe.
Das Netzteil ist original, mit 3A. Mit versorgt wird ein Homematic- und ein Zigbee-Stick. Das sollte eigentlich keine Probleme bereiten.
Ja stimmt einen Skyconnect habe ich auch angeschlossen und eine SSD. Läuft aber bisher problemlos. Man weiß es nie, aber denke eigentlich auch die 3A sollten ausreichen. Schon ein merkwürdiges Verhalten. Wenn du mal zu dem Zeitpunkt wach sein solltest, würde ich schauen was dann genau im RAM läuft, geht über das Terminal (cli) mit dem Befehl top oder htop. Vielleicht kommt man so dem Übeltäter auf die Schliche. Letztlich wäre auch eine Hardwareursache vorstellbar, aber wenn der Fehler immer wieder morgens im selben Zeitraum auftritt würde ich eher auf was anderes tippen.
hast du das Syslog vom Pi aktiv? Dann würde ich da einfach mal nach schauen ob in diesem Zeitraum da irgendwas drin steht.
Wenn der verdacht am Backup liegt, mach doch mal jetzt ein manuelles und guck obs wieder abstürtzt.
Aber ich denke das syslog wird da schon irgendwas hergeben.
Sonst außerdem mal per htop gucken wie die Auslastung in der Grundlast ist, wenn er da schon hart an der Grenze läuft könnte es ja auch ein OOM-Kill oder sowas sein.
Wie betreibst du HA? HaOS oder als Docker-Container oder wie? Und stürzt nur HA ab oder der komplette Pi?
Ich habe jetzt Mal einen Shelly als Schätzeisen angeschlossen. Ich bleibe aber an dem Thema Energieversorgung dran und werde auch Netzteile durchtauschen.
Deine sqlite-DB ist inkonsistent. Damit nimmt um 04:13:11 das ganze Elend seinen Lauf. Wenn die DB defekt ist, können die Daten nicht mehr gelesen / geschrieben werden, Insofern dürften alle weiteren Fehler vorraussichtlich Folgefehler des DB-Fehlers sein.
Dem automatischen Renaming der defekten DB-Files würde ich nicht trauen. Da würde ich lieber einen manuellen Reparaturversuch starten. Evtl. hilft das hier weiter.
Grds. irritierend finde ich, als HA-Neuling, dass HA standardmäßig eine filebasierte sqlite-DB verwendet. Da müsste man mal diesen Artikel durchackern. Postgres-DB ist rock solid und nicht tot zu kriegen. Das werde ich bei Gelegenheit Mal ausprobieren / umstellen. Ach nee…das ziehe ich mir heute Abend bei einem 'rein.
UPDATE zur Postgres-DB:
Soderle…ich habe mir das Postgres-Addon nun Mal etwas genauer angesehen:
Für Leute, die viele Langzeitdaten benötigen (Grafana), ist das eine feine Sache.
Der Großteil der HA-Config verbleibt in den yaml-Files.
Das Addon installiert sich, wie bei HA üblich, als Docker Container. Was es für mich ziemlich intransparent macht. YMMV.
Mein Fazit:
Benötige ich nicht. Würde also nur weiteres RAM & CPU-Power der HA-VM verbrauchen.
Wer so etwas nutzen möchte, sollte sich eine Postgres-DB auf einem dedizierten (virtuellem) System installieren, den HA-Server dorthin connecten und in diesem konkreten Fall einen Bogen um Docker machen. Allerdings baut man sich damit auch wieder Abhängigkeiten zwischen HA und dem remote laufenden Postgres-System. Irgendwas ist ja immer …
Für die Leute mit Rasperry und SD-Karte: Die sqlite-DB zerschreibt euch i.l.d. Zeit buchstäblich das Speichermedium. Eine Postgres-DB ist für einen Rasperry zu fett und wird nicht darauf laufen.
Bedeutet zweierlei: HA unterstützt auch mysql und die Maria-DB. Die sind etwas schlanker. Ob man die auf einem Raspberry zum Laufen bringt, weiß ich nicht. Wenn das auch nicht funktioniert, würde ich einen Rasperry max. zum Testen nutzen. Produktive Nutzung von HA macht dann tatsächlich nur auf echter HW oder als VM in Proxmox Sinn.
Moin! Danke für die Antwort. Heute Nacht ist HA erst mal stabil geblieben. Aber absturzfreie Zeiten kommen immer mal wieder vor.
HA läuft auf einer SSD, der Pi steckt in einem Argon One Gehäuse.
Ich habe aktuell Nachtschicht, da finde ich nicht immer die Zeit jeden Hinweis sofort nachzugehen. Aber ich werde es abarbeiten.
Die Files einer sqlite-DB gehen aus immer denselben Gründen kaputt:
„Ermüdetes“ Medium. =>> Könnte / kann man bei einer SSD ausschließen. Es sei denn die SSD ist überhitzt…?
Files der „DB“ werden zu groß.
Die CPU ist überlastet und schreibt irgendwann Müll in die DB.
Stromausfall: Wenn die Daten dann infolgedessen nicht mehr ge-flushed und die DB-Files nicht geschlossen werden können, steht auch wieder Grütze in der DB.
Ganz allgemein: Stromausfall bereitet jeder DB Probleme, weil die die Performance dadurch erreichen, dass die DBs quasi im RAM halten, darin operieren und „zwischendurch“ den geänderten RAM-Inhalt zurück in die DB schreiben.
Allerdings ist sqlite in gewisser Weise ein Sonderfall. Das Ding wurde für experiementelle und Kleinstanwendungen erdacht. Ob das langfristig für ein ausgewachsenes HA-System taugt?
HA lauft auf einer SSD. Das Gehäuse ist ein Argon ONE, man merkt schon das es läuft. Aber es ist jetzt nicht auffällig warm.
Mein Backup ist ca. 1GB groß. keine Ahnung ob das Auswirkungen hat.
Viele Automatisationen habe ich nicht am laufen, die Last dürfte nicht sehr hoch sein.
Stromausfall könnte ein thema sein, schließlich kann ich HA, wenn es abstürzt, nicht mehr regulär herunterfahren. Also ziehe ich den USB-Stecker.
Aber eine Sache habe ich heute im Homematic entdeckt. Samstag gegen 04:00 Uhr soll eine Speicherprüfung stattfinden. Die Abstürze finden zwar nicht nuri am Samstag statt, aber die Uhrzeit passt. Einer der Fehlermeldungen ist ja auch „mehrere Laufwerke gefunden“. Ich versuche mich mal schlau zu machen, was diese Funktion genau macht und ob es zu Problemen führt sie zu deaktivieren.