Cerbo startet immer mal wieder neu - Ursachen finden?

Ich habe hier ein eigentlich einfaches aber doch etwas komplizierteres System:

MP2-3000, Cerbo, Akku ca. 30kWh, Zusatznetzteil Huawei um schneller aufzuladen

PV-WR alles Hoymiles, PV-Leistung 25kWp - alle WR sind AC-in seitig angebunden bis auf einen einzigen HM-1500 an AC-out

Auf Venus laufen diverse Erweiterungen wie dbus-serialbattery, henne49-dbus-openDTU und paar mehr

Ausserdem in Node Red über OS Large einiges an Scripten die z.B. in Volkszähler loggen, das Zusatznetzteil starten

Mein Problem: Venus startet immer mal wieder neu, anbei ein Screenshot - gelb ist die Uptime

auffällig: die Neustarts passieren meist wenn viel PV-Produktion ist (die paar Neustarts ausserhalb kann auch ich beim rumspielen verursacht haben)

Ich habe - zugegeben mit Hilfe von Chat-GPT - diverse Logfiles angeschaut - das System ist plötzlich weg, keinerlei Anzeichen von Überlast, zu wenig Speicher,… - kein Kernel Panik oder ähnliches

Meine Vermutung war dann irgendwann - irgendwas mit der Spannungsversorgung - also Cerbo an ein Schaltnetzteil geklemmt- Problem ist weiterhin vorhanden

Ich habe erst vor paar Wochen von Raspi auf Cerbo gewechselt, seither habe ich das Problem

Ich habe versucht den Akku schnell zu laden, hohe Entladeströme zu provozieren, ich kann den Fehler nicht reproduzieren

Irgendwelche Ideen oder Ansätze wo ich noch suchen kann?

Im Cerbo gibt es einen Hardware Watchdog welcher bei zu langen Zykluszeiten einen System Reset auslöst.

Wenn du extra NR Skripts am Start hast, solltest du den Wachtdog anpassen. Das steht in /etc/watchdog.conf

Seither läuft der Cerbo ziemlich problemlos.

Last login: Sun Aug 10 08:21:10 2025 from 10.10.20.158
root@einstein:~# uptime
 19:34:16 up 148 days, 11 min,  load average: 1.01, 1.88, 2.11
root@einstein:~# 

NR kackt bei grafischen Oberflächen und größeren Datenmengen (die eigentlich in eine Datenbank gehören) ziemlich schnell ab.

Danke, das werde ich mal versuchen

Problem ist halt - man sollte jeweils nur eine Änderung machen, dann paar Tage beobachten

Die grafische Oberfläche von NR nutze ich nicht, größere Datenmengen sind da auch nicht - mich wundert halt das es auffällig meisst dann passiert wenn viel Sonne kommt - und dann auch mehrfach hintereinander

hallo,

also ich musste auch auf einem system die config der watchdog 2 mal anpassen, weil die avg load teilweise auf ueber 18 auf der ersten stelle hoch ging!

aber du kannst dir unter /var/log die messages*-dateien ansehen, dort steht immer der grund fuer einen neustart drin. meistens ist es wohl die watchdog, aber einmal gab es auch einen out of memory-eintrag!

tschuess

danke, sieht bislang vielversprechend aus

Ich hatte tatsächlich im Log:

watchdog: loadavg 10 8 7 is higher than the given threshold 0 10 6
watchdog: shutting down the system because of error 253 = 'load average too high'

auch round-trip-time ist interessant - ich muss mich jetzt wohl auf die Suche machen warum die tagsüber / bei Sonne so viel höher ist

ich frage mich nur was es sein kann

Ich habe 10 PV-Inverter eingebunden - aber die werden ja bei wenig Sonne nicht anders abgefragt

Liegt es evtl. an der Übermittlung ans VRM-Portal?

Ich beobachte auch seit einiger Zeit (vielleicht seit einem VenusOS Update, kann es aber nicht sicher sagen), dass die D-Bus Round trip time tagsüber auch immer etwas hochgeht. Man sieht also eindeutig den Zusammenhang zum PV Leistung. Ich hab “nur” ein paar Shelly Skripte und SerialBattery auf einem RasPi4.

was bei mir dazu kommt: tagsüber sind 1-2 PC an, GUIV2 ist im Hintergrund offen

Das nimmt auch einige Resourcen

Ja, stimmt, bei mir ist tagsüber VRM auch im Hintergrund immer offen. Aber an dem Tag, den ich oben gezeigt hab, war VRM zu.

VRM macht eigentlich nichts aus, nur das GUI selber

Es werden halt auch ständig alle Werte in VRM exportiert, egal ob sie dort angezeigt werden oder nicht

1 Like

Hi,

bei mir war das genau so - nach dem Umstieg auf Cerbo und aber nur bei Large Version, hat sich das Ding immer wieder durchgestartet.

loadavg 11 8 7 is higher than the given threshold 0 10 6

loadavg 9 8 7 is higher than the given threshold 0 10 6…

Hab dann bei den Keepalive-Telegramms Zeit verlängert und beim seriallBattery die Abfrageinterwalle länger eingestellt.

Kann sein, dass ich die Max-load auch angepast habe (kann ich aber erst am Freitag nachschauen)

Seit dem keine Probleme mehr - alles pipifein!

jarek