Suchmaschinenoptimierung (SEO)

Wie geht Google mit Statuscodes 404 und 410 um?

Von Zeit zu Zeit stellt sich die Frage, wie Google mit den Fehlercodes 404 und 410 umgeht. Es ist also gut, die Unterschiede zu verstehen. John Mueller von Google beantwortete eine interessante Frage zu Webseiten, die nicht mehr existieren, und wie ein Web-Publisher damit umgehen sollte.

So verarbeitet Google 404/410 Statuscodes
In einem kürzlich veröffentlichten Webmaster-Hangout erhielt John Mueller von Google die folgende Frage:

Was passiert also, wenn ein Fehler 404 zu einer Seite führt, die nicht vorhanden ist, sollte ich dann eine 410-Fehlermeldung erstellen?

Aus unserer Sicht ist mittelfristig / langfristig eine 404 die gleiche wie eine 410 für uns. In beiden Fällen löschen wir diese URLs aus unserem Index.

Im Allgemeinen reduzieren wir das Crawlen etwas von diesen URLs, sodass wir nicht zu viel Zeit damit verbringen, Dinge zu durchsuchen, von denen wir wissen, dass sie nicht existieren.

Der subtile Unterschied hier ist, dass eine 410 manchmal etwas schneller ausfällt als eine 404. Aber normalerweise reden wir in der Größenordnung von ein paar Tagen.

Wenn Sie also nur Inhalte auf natürliche Weise entfernen, können Sie beide natürlich verwenden. Wenn Sie diesen Inhalt bereits vor langer Zeit entfernt haben, ist er bereits nicht indiziert. Daher ist es für uns nicht wichtig, ob Sie einen 404 oder einen 410 verwenden.

Dies ist eine sehr hilfreiche Antwort darauf, wie Google mit den Statuscodes 404 und 410 umgeht. Von besonderem Interesse ist, dass Sie mit dem Statuscode 410 den Vorgang beschleunigen können, in dem Google die Webseite aus dem Index entfernt.

Das schnellere Entfernen von Seiten kann besonders nach einem Hacking-Ereignis hilfreich sein, bei dem ein Hacker Tausende von Spam-Seiten veröffentlicht hat. Dies sind die Arten von Seiten, die ein Web-Publisher nicht mit seiner Website verknüpfen möchte. John Mueller bestätigte, dass ein Statuscode 410 das Entfernen dieser unerwünschten Seiten aus dem Google-Index beschleunigen kann.

Laut der Anleitung von Matt Cutts, als er früher für Google arbeitete. Matt bot an, dass Google auf einen 404-Statuscode reagiert, indem es 24 Stunden wartet, bevor mit dem Entfernen einer Seite aus dem Index begonnen wird.

Dies dient dazu, den Index von Google gegen einen Fehler oder ein versehentliches Ereignis auf der Website zu prüfen. Beispielsweise können Webserver ausfallen oder eine Standortmigration dauert länger als erwartet. John Mueller von Google äußerte sich nicht, falls dies noch immer der Fall ist. Die Anleitung von Matt Cutts lautete:

Es stellt sich heraus, dass Webmaster sich oft selbst in den Fuß schießen. Seiten verschwinden Die Menschen konfigurieren Websites falsch. Sites gehen unter. Menschen blockieren GoogleBot versehentlich.

Wenn Sie also das gesamte Web betrachten, muss das Crawler-Team robust genug sein. Also mit 404s, ich denke 401s und vielleicht 403s. Wenn wir eine Seite sehen und wir eine 404 bekommen, werden wir diese Seite für 24 Stunden im Crawling-System schützen.

Wir warten also ab und sagen, vielleicht war das ein vorübergehender 404. Vielleicht war es nicht beabsichtigt, dass eine Seite nicht gefunden wurde.

Und so wird es im Crawling-System 24 Stunden lang geschützt.

Wenn wir eine 410 sehen, sagt das Crawling-System: Ok, wir gehen davon aus, dass der Webmaster weiß, was er tut … also wandeln sie diese 410 sofort in einen Fehler um, anstatt sie 24 Stunden lang zu schützen.

Wir werden immer noch zurückgehen und erneut prüfen, ob diese Seiten wirklich verschwunden sind, oder vielleicht sind die Seiten wieder lebendig geworden.

Und ich würde mich nicht auf die Annahme verlassen, dass dieses Verhalten immer genau gleich ist.

Wenn also eine Seite weg ist, ist es in Ordnung, einen 404-Server zu bedienen. Wenn Sie wissen, dass es sich um eine echte Seite handelt, ist es in Ordnung, einen 410-Server zu bedienen

Unser Crawlersystem wird jedoch so ausgelegt, dass es robust ist. Wenn jedoch Ihre Website ausfällt oder Sie gehackt werden, versuchen wir sicherzustellen, dass wir immer den guten Inhalt finden können, wann immer er verfügbar ist.

Hierzu ein kurzes Video in dem Matt erklärt, wie Google damit umgeht

Mehr Infos zu 404-Fehlern und Google

Google: Ungültige URLs sollten 404s zurückgeben, nicht 5XX-Serverfehler

Suchanfragen zum Arikel:

  • 410 Google index

Post Comment

Durch die weitere Nutzung der Seite stimmst du der Verwendung von Cookies zu. Zur Datenschutzerklärung

Die Cookie-Einstellungen auf dieser Website sind auf "Cookies zulassen" eingestellt, um das beste Surferlebnis zu ermöglichen. Wenn du diese Website ohne Änderung der Cookie-Einstellungen verwendest oder auf "Akzeptieren" klickst, erklärst du sich damit einverstanden.

Schließen