bluebook
Goto Top

Sporadisch, temporäre nicht erreichbare IPs

Hallo zusammen,

ich habe ein Problem seit mehreren Monaten schon mit meinem Netzwerk. Ich hoffe jemand hat eine Idee oder einen Tipp.

Hin und wieder (leider kann ich es nicht genauer eingrenzen) sind beliebige ips im Netzwerk für 2-3 Minuten nicht erreichbar.
Das Gerät ist über die Ip nicht ansprechbar. Als Fehlermeldung wird allerdings ein Dns fehler im browser angezeigt, aber wenn ich selbst über die ip nicht erreiche, hat es ja nichts mit dem dns zu tun, oder?

Manchmal erwischt es auch ein Tablet, welches dann gar nichts mehr im Netzwerk erreicht.

Es trifft Geräte mit und ohne WLan.

Ich hab keine Idee wie ich dem Fehler auf die schliche kommen soll.

Zum Aufbau:
Ich hab leider noch eine alte Fritzbox, welche den Anschluss per Glasfaser und Dhcp übernimmt.
Normaler Netzwerkbereich mit 192.168.178.0-255
Dadran einen asus router RT-AX88U als acesspoint.
Dazwischen und dahinter noch mehrer switches...
Der DNS Server läuft über ein NAS.


Die örtlichen Gegebenheiten führten zu diesem Aufbau.

Kann man irgendwie das Fehlverhalten eingrenzen?
In den Logs von den Routern steht leider nichts.

Viele Grüße
BB

Content-Key: 666538

Url: https://administrator.de/contentid/666538

Ausgedruckt am: 28.03.2024 um 11:03 Uhr

Mitglied: aqui
aqui 08.05.2021 um 20:04:58 Uhr
Goto Top
Dazwischen und dahinter noch mehrer switches...
Auf denen vermutlich ein Spanning Tree Protokoll rennt und (auch mal vermutet) keinerlei richtige Spanning Tree Konfig.
Das führt dann bei Loop Situationen oder bei nicht kompatiblem Spanning Tree Protokollen (Per VLAN STP zu Single STP usw.) genau zu solchen Aussetzern wenn es zu einem Topology Change kommt.
In den Logs von den Routern steht leider nichts.
Kein Wunder, denn das ist eine Layer 2 Problematik in der die Router gar nicht involviert sind. Dazu kommt das diese (meist) nicht am Spanning Tree teilnehmen.
Da solltest du also mal suchen. Für weitere zielführende Troubleshooting Tips sind deine aktuelle Beschreibung oben einfach zu mager und zu oberflächlich mit viel zu wenigen Infos. face-sad
Switch Logs und vor allem der Wireshark ist hier wie immer dein bester Freund !
Mitglied: 148121
148121 08.05.2021 aktualisiert um 20:34:42 Uhr
Goto Top
Dazwischen und dahinter noch mehrer switches...
Bei dieser mehr als schwammigen Aussage bin ich auch in der Ratestunde bei "da hat sich der TO doch sicherlich irgendwo 'dazwischen' einen Loop gebaut" 🤔
Manchmal frag ich mich echt hier was sich jemand denkt wenn man eine Frage stellt aber dann gleichzeitig keinerlei Detailinfos zum Netz postet ... Liebe Leute wir sind ja schon gut möcht ich mal behaupten, aber nur so gut wie unsere Glaskugeln es erlauben 👎.

Also am besten Schaubild und Detail-Config der Gerätschaften posten dann kann man auch gezielt helfen und muss nicht immer erst was vom Pferd erzählen!

Gruß w.
Mitglied: BlueBook
BlueBook 08.05.2021 um 20:44:27 Uhr
Goto Top
Danke für die Antwort.
Ich brauchte ja erstmal einen Ansatzpunkt.

"Spanning Tree Protokollen" hab ich noch nie gehört.
Und daran das es an den switches liegen könnte, okay....

Ich lese mich mal ein und melde mich dann wieder mit mehr infos bzw fragen ;)

Danke sehr schon einmal soweit.

Gruß
BB
Mitglied: incisor2k
incisor2k 08.05.2021 um 20:52:24 Uhr
Goto Top
Guten Abend, ich rate mal mit.

Ich sage: DHCP Problem, Lease-Time evtl?! Hat zumindest mal mit dem DNS rein gar nix zu tun.

Fix nem Client ne IP hart zu weisen und testen face-smile

Schonen Abend.
Mitglied: wellknown
wellknown 09.05.2021 aktualisiert um 10:20:33 Uhr
Goto Top
Ja, erster Schritt Doku. Zweiter Schritt feste IPs (oder im DHCP-Server IP über MAC-Adresse reserviert, Vorteil, Du musst nichts an den Clients ändern). Dann beobachten.
Mitglied: em-pie
em-pie 09.05.2021 um 10:35:23 Uhr
Goto Top
Moin,

Ich hab leider noch eine alte Fritzbox, welche den Anschluss per Glasfaser und Dhcp übernimmt.
Normaler Netzwerkbereich mit 192.168.178.0-255
Dadran einen asus router RT-AX88U als acesspoint.

Mich stört ja eher das hier.
Ich vermute(!), dass es im Netz zwei DHCP-Server gibt und der Asus gar nicht als AP sondern als (unkonfigurierter) Router mitspielt.

Eigentlich würde das Problem dann länger den die o.g. zwei bis drei Minuten bestehen, aber es soll Leute geben, die haben auch schon Pferde ko**en sehen o.o

Gruß
em-pie
Mitglied: incisor2k
incisor2k 09.05.2021 aktualisiert um 10:57:39 Uhr
Goto Top
Ebenfalls ne gute Vermutung. Nur würden dann aber entweder
a) Clients ausm Fritz-Netz Clients hinterm Asus Router nicht erreichen können und/oder
b) er hätte neben dem klassischem ...178.0 Netz zumindest noch ein weiteres?!

Das wäre aber doch sicher aufgefallen?! face-wink
Mitglied: CyborgWeasel
CyborgWeasel 10.05.2021 um 14:29:13 Uhr
Goto Top
Zitat von @incisor2k:

Ebenfalls ne gute Vermutung. Nur würden dann aber entweder
a) Clients ausm Fritz-Netz Clients hinterm Asus Router nicht erreichen können und/oder
b) er hätte neben dem klassischem ...178.0 Netz zumindest noch ein weiteres?!

Naja oder der 2. DHCP ist ebenfalls auf das 178er Netz konfiguriert, dann hätte man evtl. sogar IP Konflikte, weil 2mal die gleiche IP?! Oder fängt das DHCP Protokoll sowas ab?

Gruß
Mitglied: 148121
148121 10.05.2021 aktualisiert um 17:20:52 Uhr
Goto Top
Zitat von @CyborgWeasel:
Naja oder der 2. DHCP ist ebenfalls auf das 178er Netz konfiguriert, dann hätte man evtl. sogar IP Konflikte, weil 2mal die gleiche IP?!
Nein, der Client prüft nach dem DHCPOFFER des DHCP Servers zur Sicherheit noch per ARP Request ob ein Device auf diese IP antwortet. Bekommt dieser eine Antwort auf den Request lehnt der Client die OFFER des DHCP-Servers ab und fragt eine neue Adresse an.
Oder fängt das DHCP Protokoll sowas ab?
Nicht DHCP sondern ARP regelt solche Konflikek in der Broadcast-Domain.

Man bekommt halt immer von dem DHCP eine Antwort der am schnellsten antwortet, und das muss nicht immer der selbe sein. Wenn also ein DHCP Server mit anderen Subnetzangaben wie GW, DNS Server und falschen IPs im selben Netz wie ein anderer DHCP Server agiert kann es also durchaus zu so einer Nichterreichbarkeit eines Clients kommen, weil er eben Daten für ein falsches Subnetz erhält und so das Routing unterbrochen ist.
Mitglied: BlueBook
BlueBook 10.05.2021 um 20:49:22 Uhr
Goto Top
Vielen Dank erst einmal für die vielen Antworten!
Das macht Hoffnung das Problem zu finden.

Das mit dem SpanningTreeProtokoll und dessen Zusammenhang habe ich jetzt verstanden und auf Grund meines Netzaufbaus direkt wieder ausgeschlossen - jetzt verstehe ich aber, wieso man dafür z.B. mehr Infos braucht.

Um die Antwort auch nicht schuldig zu bleiben versuche ich meinen Aufbau bei mir "runter zu schreiben"
und ergänze die Infos die angesprochen wurden.
Der Aufbau ist historisch gewachsen - wie es meist so ist.
Die untere Ebene sind die daran angeschlossenen Geräte (ohne Endgeräte...)


Internet
-FritzBox6360

FritzBox6360
-8Port Switch Nr1
-DLink DGS-1100-24 Switch L2

DLink DGS-1100-24 Switch L2
- Synology NAS u.a. als DNS-Server
- Synology NAS mit Docker
- Asus RT-AX88U als AP
- Asus RT-AC66U als AI-Mesh-Node
- Asus RT-AC68U als AI-Mesh-Node

Asus RT-AX88U
- 8Port Switch Nr2

8Port Switch Nr2
- 8Port Switch Nr3


Ergänzende Infos
Die FritzBox wird hoffentlich in 3-4 Monaten durch ein neues Modell ersetzt...
WLAN ist deaktiviert.
Z.Z. ist diese auch der DHCP-Server mit überwiegend festenIPs über MAC (teilweise zusätzlich auch im Client)
Leider verschwinden auch die "festen" IPs.

Der Asus ist als AP konfiguriert - ist auch über die Bedienungsoberfläche recht gut zu konfigurieren.
Dort gibt es jetzt keine DHCP Einstellmöglichkeiten mehr und es steht sogar ein Hinweis, dass die IP über DHCP bezogen wird - das sollte also wirklich deaktiviert sein - hab es extra noch mal kontrolliert.
Trotzdem ist der Gedanke mit dem zweiten DHCP-Server eine gute Vermutung, die mich auch nicht so richtig los lässt.
Ich bin gerade einige Geräte, welche DHCP haben könnten, durchgegangen, dort ist aber überall der DHCP deaktiviert.

An den weiteren Asus Routern mit AIMesh-funktion liegt es wohl nicht. Dieses hatte ich offline genommen und der Fehler trat weiter auf.


Was mich gerade noch total irritiert hat, dass ich beim Blick in die Fritzbox zwei Geräte in der Netzwerkübersicht mit der gleichen IP sah, obwohl die IPs auch noch fest vergeben sind. In der Detailansicht, als auch beim Aufruf passte wieder alles - je Gerät unterschiedliche und die festgelegten IPs - irgendwie aber schon merkwürdig. Nach der Aktualisierung wird es jetzt wieder richtig angezeigt.


Ich hab oben bewusst mein "Synology NAS mit Docker" aufgelistet. Dort wird ja "intern" auch viel mit IPs hantiert.
Ich hatte mal über macVLan dem NAS zwei IPs zugewiesen. Das hab ich aber eigentlich wieder raus genommen.
Kann sich dort ein Fehler eingeschlichen haben, der so etwas bewirkt?
Leider kann ich den nicht einfach testweise vom Netz nehmen, da mein ganzen SmartHome darüber läuft.

Bei den 8PortSwitches kann man ja meistens gar nichts konfigurieren. Diese hängen zwar ggf. unschön in Reihe, aber das sollte ja nicht zu solchen Fehlern führen. Erst recht nicht bei festen IPs, oder?

Den L2-Switch habe ich bisher nicht groß konfiguriert, dass sind eher die Standard-Einstellungen.
Ich wollte mal wegen VLAN schauen, fehlende Zeit und der doch hohe Einarbeitungsaufwand für mich, hat mich bisher abgeschreckt ;)


Kann man irgendwie schauen, ob es zwei DHCP-Server im Netz gibt?
Wahrscheinlich auch nicht so leicht, oder?

Wenn es weitere Detailfragen gibt, gerne fragen.
Wenn ich wüsste, welche Logs/Configs hilfreich sind und wo diese sind, würde ich diese posten.


Vielen Dank schon einmal für die Unterstützung!

Viele Grüße
BB
Mitglied: CyborgWeasel
Lösung CyborgWeasel 11.05.2021 um 08:31:11 Uhr
Goto Top
Also einen 2. DHCP ausfindig zu machen sollte ja ganz einfach sein: Einfach den bekannten DHCP in der Fritzbox einmal ausschalten und dann einen PC mit IP-Autoconfig starten. Dann sieht man ja, ob noch eine IP verteilt wird oder nicht. Btw: Die Netzwerkliste der Fritzbox kann schon mal etwas unvollständig oder fehlerhaft sein, speziell wenn man mit IPs rumexperimentiert und unterschiedlichen PCs mal die gleiche IP zuweist. Hatte ich auch schon mal, ich weiß nur gerade nicht mehr wie rum: 2 PCs die gleiche Adresse oder 2 Adressen die gleichen PCs... Da würde ich mir jetzt erst mal keine Gedanken machen.

Aber: ich glaube aktuell nicht, dass es ein 2. DHCP ist. Du hast ja geschrieben, dass das Phänomen immer nur von kurzer Dauer ist. Könnte dies die Dauer eines Neustarts eines deiner Switche / APs sein? Ist es evtl. möglich, dass eins dieser Geräte neustartet und dann alle Geräte dahinter nicht erreichbar sind? Vielleicht sogar ein Wackelkontakt am Kabel oder Netzteil defekt? Autoupdate mit Neustart?

Wie häufig tritt das Problem denn auf, könnte man mal Langzeit-Ping-Tests starten?

Gruß
Mitglied: BlueBook
BlueBook 12.05.2021 um 18:48:17 Uhr
Goto Top
Danke sehr für Deine Ideen!

Einige Dinge können dann doch auch mal ganz einfach sein.
Das mit dem DHCP Server ausschalten war wirklich ganz leicht in der FritzBox, als auch der Test der IP.
Leider (wie man es sehen möchte) hast Du recht - keine IP - kein zweiter DHCP - nun gut.

Der Ping-Test ist auch eine super Idee, um das Problem systematisch anzugehen - perfekt!
Das bekomm ich sogar noch halbwegs unaufwändig hin - ich schau mal und melde mich wieder dazu - das Dauert jetzt aber ein Weilchen.

Ein Hardware-Defekt ist natürlich auch eine Variante.
Ein Wackelkontakt - ggf. - wobei es ja eigentlich nicht so viele bewegliche Teile sind.
Man weiß es nicht.
Ich bin sehr gespannt auf den Ping-Test.

Merkwürdig ist, dass sogar die Tablets im WLAN betroffen sind.
Das würde also auf eine Leitung zwischen Router und AP hindeuten - oder auf eines der Bauteile.
Wir warten es ab - spekulieren bringt nix.

Bisher ist es gefühlt 2-3 mal die Woche der Fall mit unterschiedlichen Geräten - also eher selten - aber man bekommt es ja auch schlecht aktiv mit, wenn irgendein Gerät mal 3-4 Min. nicht erreichbar ist - nur wenn man es gerade aktiv nutzt...
Aufgefallen ist das Problem daher bisher bei Tablets(WLAN), Überwachungskameras(LAN) und Laptops(WLAN/LAN)

Melde mich spätestens denk ich in 1-2 Wochen wieder.

Viele Grüße
BB
Mitglied: BlueBook
BlueBook 22.05.2021 um 18:20:22 Uhr
Goto Top
Hallo zusammen,

ich hab folgendes nun eine Woche ausgewertet:

pingletzte7tage

Ich habe bewusst, keine Wartungstätigkeiten in der letzten Woche gemacht, um die Auswertung nicht zu stören.

Man sieht, dass die Ausfälle doch selten anscheinend sind. (Zumindest laut dem Ping-Log)
Die Werte sind übrigens vollständig - jedes Gerät wird jede Minute einmal angepingt - nur es werden nicht alle Ergebnisse, wenn diese
gleich sind, gespeichert. Unterschiedliche Ergebnisse werden gespeichert.

Ab und zu scheint mein mein NAS1 nicht erreichbar zu sein, welches auch den DNS-Server bereitstellt.
Das wäre natürlich unglücklich und würde Folgefehler nach sich ziehen - die ich teilweise meine ich so schon hatte.
Hier verstehe ich nicht wie es dazu kommt, dass der Ping nicht ankommt - die Geräte (NAS2 hat die Ping-Überwachung durchgeführt) hängen am gleichen Switch...
Selbst bei einer Vollauslastung des NAS1, funktioniert der Ping noch.
Das kann ich mir so nicht erklären.

Die Cam_West war einmal nicht erreichbar. Auch das Verhalten hatte ich ab und zu schon bemerkt.
Den Grund kann ich hier nicht sehen. Laut Log der Cam, sieht es wie ein Neustart aus - warum auch immer... (AutoUpdate ist off)

Spannender ist der hintere Ausfall:

kurzfristigerausfall

Hier waren sogar mehrere Geräte betroffen.

Physikalisch hängen diese aber an verschiedenen Stellen.
Deshalb kann ich so schwer einen Zusammenhang finden.
Es macht aus meiner Sicht keinen Sinn, selbst falls ein Kabel/Link (warum auch immer) DOWN ist (wie gleich weiter unten vermutet), warum dann meine "photovoltaik", welche am Anfang des Netzes(Fritzbox) hängt, davon betroffen ist.


In den Logs zum Ausfall, konnte ich dem Asus etwas abgewinnen:
May 21 18:32:26 kernel: eth1 (Ext switch port: 0) (Logical Port: 8) (phyId: 8) Link DOWN.

Und erst 8 Stunden später!

May 22 02:25:07 kernel: eth1 (Ext switch port: 0) (Logical Port: 8) (phyId: 8) Link UP at 100 mbps full duplex
May 22 02:25:27 kernel: eth1 (Ext switch port: 0) (Logical Port: 8) (phyId: 8) Link DOWN.
May 22 02:25:29 kernel: eth1 (Ext switch port: 0) (Logical Port: 8) (phyId: 8) Link UP at 100 mbps full duplex

Wenn ich nur dem Log glaube, wäre ja der Port vom 21.5 18 Uhr - 22.5 um 2 Uhr down gewesen.
Das fällt mir schwer zu glauben, da dies die Hauptverbindung zwischen dem Asus-AP und dem L2-Switch und dementsprechend auch zum Internet ist.
Wenn 8 Stunden per WLAN kein Internet mehr zur Verfügung gestanden hätte - wäre das hier kritisch vor Ort geworden.
Vielleicht hat das "schlaue" Asus-AI-Mesh dies über WLAN kompensiert - leider kann ich dies nicht in den Logs sehen.
Theoretisch wäre dies möglich gewesen. Wenn dem so wäre, wäre ich beeindruckt vom Asus-AI-Mesh.
Mein Ping zum Asus-Router ist weiterhin durchgegangen, also irgendwie ist dieser durchgekommen.

Ich werden den Ausfall wahrscheinlich die Tage noch einmal manuell nachstellen und "schauen" was dann passiert. So gut man das "einfach" sehen kann.

Zumindest habe ich jetzt einen ersten Verdächtigen.
Ein Kabel, welches leider fest verbaut(Unterputz), 15m lang und quer durch die Wohnung geht.

Ich werde es weiter "tracken" und im Auge behalten.
Ich werden bei Zeit noch einmal alle Steckverbindungen prüfen.

Falls jemand zu anderen Schlüssen/Vermutungen/Ideen kommt, gerne her damit face-smile
Gerade auch zur Erreichbarkeit des NAS1 - da fehlt mir noch jede Idee.

Gruß
BB
Mitglied: CyborgWeasel
CyborgWeasel 25.05.2021 um 12:59:01 Uhr
Goto Top
Kannst du mal ein Schema von deinem Netzwerk posten? Also welcher AP an welchem Switch hinter welchem Router hängt? Ist sonst schwierig was dazu zu sagen...
Mitglied: BlueBook
BlueBook 31.05.2021 um 10:45:54 Uhr
Goto Top
@CyborgWeasel
Danke für Deine Hilfe - du hast vollkommen das richtige Gespür gehabt!

Und ich hätte es nicht vermutet.

Nachdem ich den Fehler zeitlich eingrenzen konnte, hab ich eine Zeugenbefragung durchgeführt.
Der Router steht bei uns im Vorratsschrank und zuerst war ich wohl selbst um ca. 18.30 Uhr daran und gegen 2.20 Uhr nachts noch mal meine Frau.
Nach der Info war irgendwie klar: wirklich ein "Wackelkontakt".

Wobei ich das Gefühl hatte, dass das betroffene Kabel gut sitzt.
Finden konnte ich den Wackelkontakt nicht direkt.
Aber nachdem das Kabel jetzt in einem anderen Port im Router sitzt -
kein einziges Ping-Problem mehr!

Vielen Danke an dieser Stelle noch einmal an alle!
Gruß
BB