HA langsam mit Meldung "Verbindung getrennt. Wird erneut verbunden"

Hi zusammen,

seit einer Woche läuft mein HA in allen Bereichen langsam.

  • Wenn ich meine URL aufrufe dauert die „Loading data“ Seite manchmal 2 und manchmal 20 Sekunden.
  • Dashboards bauen sich langsam auf, die davor sofort komplett angezeigt wurden
  • Wenn ich einen Button drücke, dauert es 1-2 Sekunden bis etwas passiert, die zuvor sofort reagiert haben
  • Und ich bekomme recht häufig die Meldung „Verbindung getrennt. Wird erneut verbunden“. Dann dauert es wenige Sekunden und dann geht es wieder.

Mein System zeigt mir aber nur 10-15 % CPU-Load an, weiß aber nicht wie gut man kurzfristige Spitzen darauf erkennen kann.

RAM ist auf ca. 60% (16GB RAM)

Logs müsste ich mal durcharbeiten.

P.S.: Ich habe eine neue 4K Kamera in Frigate. Aber die Last des Frigate Addons ist unauffällig.

Kann man sich eigentlich irgendwie die Last je Addon langfristig anschauen? Aktuelle kenne ich nur die Anzeige direkt unter Addons.

Das sind tatsächlich nur wenige Infos, um dir helfen zu können.

  • Läuft das System bare metal oder auf einem Hypervisor?
  • Aus welchem Tools stammen die Graphen?
  • Was sagt syslog bzw. journald?
  • Poste mal den Output von „dmesg“ (Ja…lang)

Greetz
Stevie

Das HA läuft nativ als HA Os (kein Proxmox) auf einer potenten Kiste (Mini PC АMD Ryzen 7 5700U 4,3 GHz, 16GB DDR4).
Ich habe einige hungrige Add-ons laufen.
Frigate, Immich, Nextcloud,…

Frigate habe ich zum Test Mal ausgeschalten. Gefühlt merke ich keine Verbesserung.

Die Grafiken sind von der HA Integration System Monitor.

Mit syslog meinst du die die normalen HA Protokolle?
Was ist dmesg?

Youp! Die HW kann was!
Wie alt ist das Ding? Macht da irgendeine Komponente schlapp?

HA-OS ist ja ziemlich zugenagelt. Um an weitere Infos zu kommen, musst du wohl den Hack „ssh per Port 22222“ anwenden. Ich fürchte, sonst siehst du nicht viel.

Eine Testinstanz kannst du also nicht hochziehen?
Unter der Annahme, dass deine HW nicht schlapp macht, müsstest du herausfinden, ob und wenn ja, welche Integration, AddOn oder HACS-Komponente da evtl. Amok läuft.

Was sagt denn ein Netzwerktest? Ping-Laufzeiten, iperf3 …?

HW ist erst 6 Monate alt. Die CPU Temperatur ist mit 88 Grad ggf. zu hoch.
Wie kann ich den die Addons besser überwachen?

Ich habe vor kurzem Meinen HA Server Physisch an einen anderen Ort verlegt und dabei zweitweise das Netzwerkkabel getrennt. (Strom war über USV dauerhaft vorhanden) Anschließend hatte ich exakt die von dir beschriebenen Symptome. Ein kompletter Neustart der Hardware war die Lösung. Seitdem läuft wieder alles wie gewohnt.

Den „Stecker“ habe ich leider schon mehrfach gezogen. Aber könnte es etwas mit dem Netzwerk zu tun haben?

Ich habe 2 Fritzboxen. Eine davon, fällt mir gerade ein, habe ich ca. zu Beginn des Problems von 7530 AX auf 7590 AX upgegraded. Jedoch hängt an dieser nicht das HA, sondern dient als WLAN Mesh Master bzw. „Switch“.

Nochmal die Frage an alle:
Kann ich irgendwie den CPU Load per Addon langfristig überwachen?
Und ggf. Load aller Automationen bzw. ein counter wie viele Automationen in Zeit X ausgeführt wurden.
Vielleicht wird versehentlich eine automation ständig ausgeführt.

Danke schon mal für eure Unterstützung.
Klasse Community hier.

Du sagst, du hast vor kurzem deine Fritzbox upgegraded! Du bist aber nicht zufällig bei NetzCologne oder? Da gab es nämlich ein fehlerhaftes FB Update was zu Verbindungsproblemen intern und extern führen kann.

Den Stecker zu ziehen entspricht nicht einem kontrollierten Systemneustart. Dazu gehst du auf Entwicklerwerkzeuge und dann wie im Bild:

1 „Gefällt mir“

Hatte glaub ich bisher nur HA neu gestartet (ohne OS), wobei ich auch mal den Stecker gezogen hatte.
Habe nun mal „System herunterfahren“ gemacht und den ganzen Netzwerkschrank kurz stromlos geschaltet.
Bisher läuft nun wieder alles snappy. Könnte das Problem gelöst haben
:slight_smile:

2 „Gefällt mir“

Lief einen halben Tag gut. Jetzt fängt es schon wieder an.

Puh das finde ich auch zu hoch. Laut deinen Bildern hat die HW zwar zutun aber nicht so das die Temp zu erklären wäre.

Problem war wohl eine doppelte IP Vergabe durch den DHCP. IP von HA hatte noch ein anderes Gerät. Dadurch hat HA ständig die Verbindung verloren und dadurch haben alle möglichen Integrationen sich immer wieder neu verbunden.