Proxmox stürzt nach unbestimmte Zeit ab

Hallo Zusammen,

ich habe vor kurzem nach dem Video vom Simon und Matthias Proxmox auf meinem Intel Nuc installiert. Danach Homebridge und Home Assistant auf dem Proxmox eingerichtet. Lief alles gut, aber nach ca. 10, 12 Stunden war Proxmox nicht mehr zu erreichen.
Kann mir jemand eventuell helfen?

VG Juri

1 „Gefällt mir“

Nicht mehr zu erreiche oder ist er Abgestürzt? Das sind gravierenden Unterschiede um zu Wissen wo man ansetzen kann! Kannst du ihn per SSH erreichen oder auch direkt in der Konsole auf deinem NUC aufrufen?

2 „Gefällt mir“

Danke dir für die schnelle Antwort! Ich kann dir momentan nicht sagen, weil ich den Server neu gestartet habe. Gerade läuft es, aber keine Ahnung wie lange. :thinking:

1 „Gefällt mir“

Wie greifst du per SSH auf den Server zu? Du könntest per SSH mitloggen um zu sehen, was ist wenn er die Verbindung verliert oder abstürzt!

1 „Gefällt mir“

Moin,

das kann von bis so ziemlich alles sein. Da brauchen wir ein paar mehr Details.

Angefangen mit deinem System (welche Version Proxmox, was für ein Nuc etc.)

Weitergehend mit einer detaillierteren Beschreibung. Wie mein Vorredner schon sagte abgestürzt oder nur nicht erreichbar?

Was hast du bereits geprüft/gemacht?

Gibt es Logs? Was steht da drin?

Ist nicht böse gemeint, aber es ist wirklich schwer zu helfen, wenn man nur die Information hat „Proxmox war nicht mehr zu erreichen“

Liebe Grüße

2 „Gefällt mir“

Du hast Recht, das habe ich mir schon gedacht, dass es zu wenig Information zu dem Problem gibt.
Zu Hardware: Intel Nur mit i5 Processor und 8GB Ram
Software Proxmox Environment 8.3.4
Ich bin gerade am das rantasten an Proxmox.
Mein Home Assistant lief die ganze Zeit auf dem Intel Nuc und es gab keine Probleme. Nur wenn man Rentner ist und eigentlich genug Zeit hat, probiert man was neues. :grinning:
Leider kann ich dir nicht sagen ich die Logs auslesen kann. :disappointed:

1 „Gefällt mir“

Ich greife per WebSSH auf den Proxmox.

1 „Gefällt mir“

Ich habe gerade Log ausgelesen, aber ich verstehe da nur Bahnhof. :disappointed:

eb 24 00:00:03 pve systemd[1]: Starting dpkg-db-backup.service - Daily dpkg database backup service…
Feb 24 00:00:03 pve systemd[1]: Starting logrotate.service - Rotate log files…
Feb 24 00:00:03 pve systemd[1]: Reloading pveproxy.service - PVE API Proxy Server…
Feb 24 00:00:03 pve systemd[1]: dpkg-db-backup.service: Deactivated successfully.
Feb 24 00:00:03 pve systemd[1]: Finished dpkg-db-backup.service - Daily dpkg database backup service.
Feb 24 00:00:04 pve pveproxy[236393]: send HUP to 1003
Feb 24 00:00:04 pve pveproxy[1003]: received signal HUP
Feb 24 00:00:04 pve pveproxy[1003]: server closing
Feb 24 00:00:04 pve pveproxy[1003]: server shutdown (restart)
Feb 24 00:00:04 pve systemd[1]: Reloaded pveproxy.service - PVE API Proxy Server.
Feb 24 00:00:04 pve systemd[1]: Reloading spiceproxy.service - PVE SPICE Proxy Server…
Feb 24 00:00:04 pve spiceproxy[236405]: send HUP to 1010
Feb 24 00:00:04 pve spiceproxy[1010]: received signal HUP
Feb 24 00:00:04 pve spiceproxy[1010]: server closing
Feb 24 00:00:04 pve spiceproxy[1010]: server shutdown (restart)
Feb 24 00:00:04 pve systemd[1]: Reloaded spiceproxy.service - PVE SPICE Proxy Server.
Feb 24 00:00:04 pve pvefw-logger[626]: received terminate request (signal)
Feb 24 00:00:04 pve pvefw-logger[626]: stopping pvefw logger
Feb 24 00:00:04 pve systemd[1]: Stopping pvefw-logger.service - Proxmox VE firewall logger…
Feb 24 00:00:05 pve systemd[1]: pvefw-logger.service: Deactivated successfully.
Feb 24 00:00:05 pve systemd[1]: Stopped pvefw-logger.service - Proxmox VE firewall logger.
Feb 24 00:00:05 pve systemd[1]: pvefw-logger.service: Consumed 5.837s CPU time.
Feb 24 00:00:05 pve systemd[1]: Starting pvefw-logger.service - Proxmox VE firewall logger…
Feb 24 00:00:05 pve pvefw-logger[236414]: starting pvefw logger
Feb 24 00:00:05 pve systemd[1]: Started pvefw-logger.service - Proxmox VE firewall logger.
Feb 24 00:00:05 pve systemd[1]: logrotate.service: Deactivated successfully.
Feb 24 00:00:05 pve systemd[1]: Finished logrotate.service - Rotate log files.
Feb 24 00:00:05 pve spiceproxy[1010]: restarting server
Feb 24 00:00:05 pve spiceproxy[1010]: starting 1 worker(s)
Feb 24 00:00:05 pve spiceproxy[1010]: worker 236419 started
Feb 24 00:00:05 pve pveproxy[1003]: restarting server
Feb 24 00:00:05 pve pveproxy[1003]: starting 3 worker(s)
Feb 24 00:00:05 pve pveproxy[1003]: worker 236421 started
Feb 24 00:00:05 pve pveproxy[1003]: worker 236422 started
Feb 24 00:00:05 pve pveproxy[1003]: worker 236423 started
Feb 24 00:00:10 pve spiceproxy[1011]: worker exit
Feb 24 00:00:10 pve spiceproxy[1010]: worker 1011 finished
Feb 24 00:00:10 pve pveproxy[136932]: worker exit
Feb 24 00:00:10 pve pveproxy[55888]: worker exit
Feb 24 00:00:10 pve pveproxy[52809]: worker exit
Feb 24 00:00:10 pve pveproxy[1003]: worker 136932 finished
Feb 24 00:00:10 pve pveproxy[1003]: worker 52809 finished
Feb 24 00:00:10 pve pveproxy[1003]: worker 55888 finished
Feb 24 00:17:01 pve CRON[240122]: pam_unix(cron:session): session opened for user root(uid=0) by (uid=0)
Feb 24 00:17:01 pve CRON[240123]: (root) CMD (cd / && run-parts --report /etc/cron.hourly)
Feb 24 00:17:01 pve CRON[240122]: pam_unix(cron:session): session closed for user root
Feb 24 01:11:03 pve systemd[1]: Starting fstrim.service - Discard unused blocks on filesystems from /etc/fstab…
Feb 24 01:11:05 pve fstrim[251815]: /boot/efi: 1010.3 MiB (1059401728 bytes) trimmed on /dev/sda2
Feb 24 01:11:05 pve fstrim[251815]: /: 89.9 GiB (96513605632 bytes) trimmed on /dev/pve/root
Feb 24 01:11:05 pve systemd[1]: fstrim.service: Deactivated successfully.
Feb 24 01:11:05 pve systemd[1]: Finished fstrim.service - Discard unused blocks on filesystems from /etc/fstab.
Feb 24 01:12:37 pve systemd[1]: Starting pve-daily-update.service - Daily PVE download activities…
Feb 24 01:12:39 pve pveupdate[252161]: root@pam starting task UPID:pve:0003D90E:0065EB28:67BBB977:aptupdate::root@pam:
Feb 24 01:12:40 pve pveupdate[252174]: update new package list: /var/lib/pve-manager/pkgupdates
Feb 24 01:12:42 pve pveupdate[252161]: root@pam end task UPID:pve:0003D90E:0065EB28:67BBB977:aptupdate::root@pam: OK
Feb 24 01:12:42 pve systemd[1]: pve-daily-update.service: Deactivated successfully.
Feb 24 01:12:42 pve systemd[1]: Finished pve-daily-update.service - Daily PVE download activities.
Feb 24 01:12:42 pve systemd[1]: pve-daily-update.service: Consumed 3.452s CPU time.
Feb 24 01:17:01 pve CRON[253605]: pam_unix(cron:session): session opened for user root(uid=0) by (uid=0)
Feb 24 01:17:01 pve CRON[253606]: (root) CMD (cd / && run-parts --report /etc/cron.hourly)
Feb 24 01:17:01 pve CRON[253605]: pam_unix(cron:session): session closed for user root
Feb 24 01:38:37 pve systemd[1]: Starting apt-daily.service - Daily apt download activities…
Feb 24 01:38:38 pve systemd[1]: apt-daily.service: Deactivated successfully.
Feb 24 01:38:38 pve systemd[1]: Finished apt-daily.service - Daily apt download activities.

1 „Gefällt mir“

Ich würde den Ram mit 8GB auf 32GB upgraden, der Proxmox und Home Assistant brauchen viel Ram.

Was kommt bei free -g herraus.

2 „Gefällt mir“

Danke für den Tipp! Ich habe schon vorhin 32GB bestellt. :+1:

1 „Gefällt mir“

Du musst schauen wieviel Ram man am Nuc verbauen kann!!!

1 „Gefällt mir“

Habe ich angeschaut, maximal 32GB.
Was das bedeutet free -g, kann ich dir leider nicht sagen. Ich bin ziemlich neu mit dem Proxmox.

1 „Gefällt mir“

8GB RAM ist tatsächlich N.I.X.! =>> NIX! :joy:
…und wenn du Rentner bist und an HA 'rumexperimentieren möchtest (was ja völlig i.O. ist), solltest du das in einem Testsystem tun, dort austesten und von dort in die Prod-Umgebung ausrollen. Aaaabääärrr: Für die zweite VM des Test-HA-Systems braucht du ja auch wieder RAM. Also bist du da mit 32GB gut beraten! …wenn denn dein Mainboard so viel RAM verfrühstücken kann.

Ich habe aber im Log auch gesehen, dass du den Auto-Update-Service laufen hast. Theoretisch sind jetzt nun zwei Fehlerursachen möglich:

  • Ein Update war buggy und hat den Hypervisor auf’s Kreuz geworfen.
  • Dem Host ist beim durchkurbeln der Updates schlicht das RAM ausgegangen (s.o.)
    Klare Empfehlung: Auto-Update erst Mal deaktivieren und dann schauen, wie sich das System verhält.

Damit wir da ggf. ein bisschen nachschärfen können: War Proxomox und / oder HA nicht mehr zu erreichen?

Greetz
Stevie

2 „Gefällt mir“

Das kannst du per ssh eingeben das zeigt dir wieviel ram du noch frei hast.
Um so länger Home Assistant läuft um so mehr ram braucht es über den Proxmox.

2 „Gefällt mir“

Vielen herzlichen Dank Stevie. Ich werde dein Rat befolgen. Schauen wir mal, ob es klapp. :grinning: :+1:

1 „Gefällt mir“

Kein Ding! Gerne! :+1:t2:

1 „Gefällt mir“

Zusätzlicher RAM schadet natürlich nie, aber ich wage zu bezweifeln das das die Ursache ist. Da müsste Homeassistant schon arg aufgebläht sein, dass er da in die Grenzen kommt.

Erstmal folgende Fragen:

  1. Ist das Verhalten bisher einmalig aufgetreten oder passiert das Mehrfach?
  2. Wenn zweiteres, in bestimmten Abständen bzw. so bestimmten Zeitpunkten oder komplett zufällig?
  3. Schmiert der komplette Proxmox Server ab oder nur eine VM?

Zu 3. Du kannst ja die Uptime sehen (gehe ins Proxmox Webinterface, dann auf deinen Server und Übersicht, da steht die Betriebszeit, bei den VMs genau so)
Wenn die Zeit beim abstürzen auf 0 geht, geht Proxmox definitiv aus, dann wird es mit Sicherheit irgendwas hardwaretechnisches oder Stromversorgung sein.

Dann folgendes kontrollieren:

  1. Grundlast ermitteln - einfach mal htop im normalen Betrieb per SSH eingeben, wie sieht die Auslastung aus? Schon hart an der Grenze oder weit unten?
  2. Syslog von Proxmox aktivieren (wenn nicht schon gesehen) und mal 24h laufen lassen, dann reingucken ob da irgendwas drin steht.
  3. Festplatten prüfen (Sind defekte Festplatten verbaut, das könnte das Verhalten auch erklären)

Syslog solltest du unter /var/log/syslog finden. Guck mal ob da irgendwas auffälliges drin steht.

Prüf das mal alles und gib und eine Rückmeldung mit den daraus resultierenden Erkenntnissen. Ich denke ein blindes RAM Upgrade ist zwar nicht verkehrt, aber vermutlich auch nicht die Lösung der Dinge.

4 „Gefällt mir“

Dankeschön! Ich werde auf jeden Fall berichten, wenn ich aus dem Urlaub zurück komme.
Das passierte schon mehrmals und wie ich das sehe, Proxmox Server verabschiedet sich.

2 „Gefällt mir“

Das HA soviel RAM braucht wird nicht sein, den sonst würde das ganze nicht auf einem RPi laufen mit 2GB RAM! Habe hier 15 LXC und 2 VM laufen und der RAM Verbrauch liegt bei 7% von 32GB

1 „Gefällt mir“

Ja aber so langsam wie eine Schnecke?
Schaue mal auf meinen Bild oben.

1 „Gefällt mir“