Regelmäßige HA Abstürze gegen 04:00 Uhr

Moin!

Mein HA stürzt, Mal mehr Mal weniger häufig ab. Aber wenn, dann um kurz nach vier Uhr morgens. Im Webinterface erscheint die Meldung ‚Error while loading page system‘. Mir fehlt ehrlich gesagt der Ansatz zur Lösung des Problems. Was passiert in HA gegen 04:14 Uhr und wie muss ich vorgehen um das Problem zu lösen? Warum bekomme ich die Meldung „Mehrere Laufwerke erkannt“ und warum finde ich in den Protokollen dazu absolut nichts?




1 „Gefällt mir“

Uhrzeit könnte mit Zwangstrennung Internet passen, aber so …

Auf was läuft HA bei dir?

2 „Gefällt mir“

Das kam mir auch gerade so in den Sinn. HA macht zu diesem Zeitpunkt eventuell auch ein BackUp, wenn das automatische, mit Systemoptimum aktiviert wurde.

1 „Gefällt mir“

Es würde mich wundern, wenn HA abschmiert, wenn die Internetverbindung getrennt ist. Mein backup landet auf einem NAS und neuerdings auch in der nabucasa Cloud. Aber der Fehler ist schon vor der Nabucasa cloud aufgetreten. HA läuft auf einem Pi4 8GB.

1 „Gefällt mir“

Dann schau dir mal das Netzteil an. Wenn das mittlerweile zu wenig Power hat, kann sowas passieren. Je mehr Integrationen und Addons um so mehr Ampere braucht das Netzteil. Wenn dann noch ein Backup gemacht wird, dann kann es das schon gewesen sein. Mindestens 4 Ampere, besser mehr.

1 „Gefällt mir“

HA führt zu diesem Zeitpunkt einige Sachen im System aus, wie Datenbankbereinigung, Backups oder Neustart von bestimmten Integrationen. Könnte doch wirklich damit zusammenhängen. Ich nutze auch einen Pi4 mit 3A Netzteil und hatte damit bisher noch nie Probleme.

1 „Gefällt mir“

Das Backup wird als Automatisation um 02:15 Uhr angestoßen und auf eine Festplatte an meiner Fritzbox gespeichert. Das läuft auch durch. Neu hinzugekommen ist vor kurzem das automatische Backup von HA. Das hat gestern und heute nicht funktioniert, HA hatte sich zu dem Zeitpunkt bereits aufgehängt. In den Einstellungen steht dass das automatische Backup ab 04:45 gestartet werden soll. Aber den Fehler hatte ich schon bevor ich diese Funktion eingerichtet habe.
Das Netzteil ist original, mit 3A. Mit versorgt wird ein Homematic- und ein Zigbee-Stick. Das sollte eigentlich keine Probleme bereiten.

2 „Gefällt mir“

Ja stimmt einen Skyconnect habe ich auch angeschlossen und eine SSD. Läuft aber bisher problemlos. Man weiß es nie, aber denke eigentlich auch die 3A sollten ausreichen. Schon ein merkwürdiges Verhalten. Wenn du mal zu dem Zeitpunkt wach sein solltest, würde ich schauen was dann genau im RAM läuft, geht über das Terminal (cli) mit dem Befehl top oder htop. Vielleicht kommt man so dem Übeltäter auf die Schliche. Letztlich wäre auch eine Hardwareursache vorstellbar, aber wenn der Fehler immer wieder morgens im selben Zeitraum auftritt würde ich eher auf was anderes tippen.

1 „Gefällt mir“

Da bin ich anderer Meinung. 3A finde ich grenzwertig wenn noch zwei Sticks mit Strom versorgt werden.

Moin,

hast du das Syslog vom Pi aktiv? Dann würde ich da einfach mal nach schauen ob in diesem Zeitraum da irgendwas drin steht.

Wenn der verdacht am Backup liegt, mach doch mal jetzt ein manuelles und guck obs wieder abstürtzt.

Aber ich denke das syslog wird da schon irgendwas hergeben.

Sonst außerdem mal per htop gucken wie die Auslastung in der Grundlast ist, wenn er da schon hart an der Grenze läuft könnte es ja auch ein OOM-Kill oder sowas sein.

Wie betreibst du HA? HaOS oder als Docker-Container oder wie? Und stürzt nur HA ab oder der komplette Pi?

1 „Gefällt mir“

Ich habe jetzt Mal einen Shelly als Schätzeisen angeschlossen. Ich bleibe aber an dem Thema Energieversorgung dran und werde auch Netzteile durchtauschen.

1 „Gefällt mir“

Moin! Danke für die Antwort. Heute Nacht ist HA erst mal stabil geblieben. Aber absturzfreie Zeiten kommen immer mal wieder vor.
HA läuft auf einer SSD, der Pi steckt in einem Argon One Gehäuse.
Ich habe aktuell Nachtschicht, da finde ich nicht immer die Zeit jeden Hinweis sofort nachzugehen. Aber ich werde es abarbeiten.

Zum Glück ist es kein LiveChat… :stuck_out_tongue:

  • HA lauft auf einer SSD. Das Gehäuse ist ein Argon ONE, man merkt schon das es läuft. Aber es ist jetzt nicht auffällig warm.
  • Mein Backup ist ca. 1GB groß. keine Ahnung ob das Auswirkungen hat.
  • Viele Automatisationen habe ich nicht am laufen, die Last dürfte nicht sehr hoch sein.
  • Stromausfall könnte ein thema sein, schließlich kann ich HA, wenn es abstürzt, nicht mehr regulär herunterfahren. Also ziehe ich den USB-Stecker.

Aber eine Sache habe ich heute im Homematic entdeckt. Samstag gegen 04:00 Uhr soll eine Speicherprüfung stattfinden. Die Abstürze finden zwar nicht nuri am Samstag statt, aber die Uhrzeit passt. Einer der Fehlermeldungen ist ja auch „mehrere Laufwerke gefunden“. Ich versuche mich mal schlau zu machen, was diese Funktion genau macht und ob es zu Problemen führt sie zu deaktivieren.

Die Speicherprüfung ist bei mir auch aktiviert, aber keine Abstürze zu verzeichnen.

1 „Gefällt mir“

Die Speicherprüfung ist bei mir auch aktiviert, aber keine Abstürze zu verzeichnen.

Homematic läuft bei mir auf einem HmIP-RFUSB Stick, bei Dir auch?

RaspberryMatic läuft auf einer externe Hardware.
(Klugscheißermodus an) Homematic läuft nicht auf dem Stick! :grin: (Klugscheißermodus aus)

RaspberryMatic läuft auf einer externe Hardware.

Dann hast du eine andere Kombination. Und ja, der Stick ist nur eine Schnittstelle. Die Erwähnung ist aber so nutzlos wie auf Lasagne zu reiten.

Seit ich dieses Thema aufgemacht habe, ist HA zum Glück nicht mehr abgestürzt. Es kommt mir an der ein oder anderen Stelle zu langsam vor, aber das kann auch subjektiv sein.

Aber durch Zufall bin ich heute über diesen Beitrag,

, auf das hier gestoßen! Die Uhrzeit passt, das Thema auch, ich denke hier liegt die Ursache meiner HA Abstürze.

Die Entwicklerwerkzeuge versuche ich so weit wie möglich zu vermeiden, dafür habe ich zu wenig Ahnung. Das in meiner HA Datenbank unnützes Zeug herumschwirrt, kann ich mir aber gut vorstellen. Die Installation ist jetzt über drei Jahre alt und ich habe viel Ausprobiert…

Wie kann ich meine Datenbank überprüfen und wieder Fit machen? Das ich mir vorher ein Backup erstelle ist klar, aber Fehler möchte ich trotzdem vermeiden.
Screenshotquelle