Nameserver-Ausfall bei der Denic — .de Zone ist teilweise lahmgelegt [Update]

Da versucht man für ein guten Kunden noch während des Gesprächs eine .de Domain zu registrieren und denkt sich nichts böses. Da kommt überraschend folgende Meldung:
Laufende Wartungsarbeiten für das gewählte Modul bzw. den gewünschten Dienst.
module currently not available [.DE Registry System Outage]

Wartungsarbeiten? Die waren doch für gestern angekündigt. Noch während ich darüber nachdenke was los ist klingelt auch mein Handy und eine SMS trifft ein:

KRITISCH POP3 auf borg.tf-network.de 12.05.2010 14:02:27, POP CRITICAL — Invalid hostname, address or socket: borg.tf-network.de
KRITISCH HTTP auf voyager.tf-network.de 12.05.2010 14:05:39, Name or service not known HTTP CRITICAL — Unable to open TCP socket

Schon spricht mich auch gleich jemand per Chat an, der seine Domain bei mir nicht auflösen konnte.

Ein erster Test zeigte relativ schnell, was passiert ist. Innerhalb weniger Minuten haben sich bei der Denic 4 der 6 für die .de-Zone zuständigen Nameserver zur Zeit nicht mehr korrekt antworten (Antwort: NXDOMAIN). Dies hat zur Folge, dass zur Zeit praktisch alle .de Domains nicht mehr korrekt erreichbar sind. Damit ist praktisch die drittgrößte Domainzone zur Zeit faktisch vom Internet abgeschnitten, was nicht häufig vorkommt. Der Ausfall wurde auch mittlerweile von der Denic in Frankfurt bestätigt.

Ich möchte jetzt echt nicht wissen, was bei den verschiedenen Internetanbietern im Supportbereich los ist — viel Spass an die Support-Agenten. Sonderkündigung!!2213”§”$§!!

Wer möchte, kann sich auch einmal die Twitter-Meldungen zum Ausfall anschauen. Zum Teil wirklich amüsant und ja, Twitter ist erreichbar, da es sich um keine .de Domain handelt ;-)

[Update]

Mittlerweile scheinen laut meinen Tests alle 6 für die .de Zone relevanten Nameserver zu reagieren. Das Problem selber kann sich allerdings noch circa 2h bemerkbar machen. Hintergrund ist, dass die Nameserver zum Teil „NXDOMAIN” zurücklieferten, was bedeutet, dass für den angeforderten Domainnamen kein Eintrag existiert. Das verhängnisvolle ist dabei, dass die Meldung ein Time-to-live von 7200 Sekunden, oder anders formuliert, 2 Stunden hat. Das bedeutet, dass die Nameserver der einzelnen Provider diese falsche Rückmeldungen im Cache haben bis zum Ablauf der 2 Stunden. Das gleiche gilt übrigens auch für Proxy-Server wie Squid. Das einzige Gegenmittel wäre den Cache zu resetten — wobei ich davon ausgehe, dass größere Provider ein reset durchführen.