16 Oct 2016

Workaround Meshverlust Nodes

Problem

Seit einiger Zeit beobachte ich bei einem TP-Link TL-WR841 v9 mit gluon-v2016.1.5, der als Relais dient, folgende Anomalie:

Der Router steigt aus und wird auf der Karte als offline angezeigt. Andere Nodes bauen keine Verbindung zu ihm auf. Nach ~15 Stunden kommt er wieder online und alles ist OK. Uptime sagt, dass Router die ganze Zeit eingeschaltet war.

Ein Mitfunker gab mir den Tipp, einen Cronjob anzulegen, der den Router ein Mal pro Stunde neu startet. Das erscheint mir ein wenig übers Ziel hinaus zu schießen, also habe ich ein Skript geschrieben, das ein Mal pro Stunde den nächsten Node anpingt und bei dreimaligem Misserfolg das Netzwerkmodul neu startet. Zwischen zwei Versuchen macht das Skript eine Minute Pause.

Ergebnisse werden in /tmp/mesh_check.log gespeichert.

Das Skript ist jetzt im Testbetrieb. Verbesserungsvorschläge implementiere ich gerne :)

Installation

Skript in z.B. /opt/mesh_check.sh einfügen

Skript mit „chmod +x /opt/mesh_check.sh“ ausführbar machen

Cronjob anlegen mit „crontab -e“ und dann „0 0 * * * /opt/mesh_check.sh“ einfügen, damit Skript ein Mal pro Stunde ausgeführt wird.

Skript

https://github.com/GitNorb/mesh_check

EDIT: Skript auf GitHub umgezogen


nhaerig