Wie erhält man eine Liste der Seiten einer Website, die indiziert sind ?
Obwohl eigentlich nicht dazu gedacht, kann man, wenn man bei Google den Befehl site: eingibt, eine gute Schätzung erhalten.
So funktioniert die Ausgabe:
site:websitename.de (ohne Leerzeichen zwischen site: und dem Domain-Namen)
Wenn die Website in http oder https ausgegeben wird, muss das bei der Ausgabe des Befehls berücksichtigt werden.
Der Befehl funktioniert übrigens auch für Bilder.
Der Befehl kann außerdem noch verfeinert werden, indem man zum Beispiel eine URL-Erweiterung zu dem Befehl hinzufügt:
site:https://www.websitename.de/produkte
Über die Google Search Console kann man zudem die Anzahl der URLs ermitteln, die in der Sitemap stehen und im Index inkludiert sind.
Eine ganz exakte Anzahl wird man allerdings nie herausfinden können.
Dennoch kann man eine gute Schätzung über Analytics erhalten, indem man die Seiten betrachtet, die Traffic über Google.de generieren.
Die so erhaltene Zahl entspricht natürlich nicht exakt der Definition des Begriffs „Anzahl indexierter Seiten“, aber sie ist dennoch ein interessanter Indikator. Denn eine Seite, die nicht indiziert ist, wird keinen Traffic über Suchmaschinen erhalten (mit Ausnahme von Seiten, die über Sponsored Links angezeigt werden).
Schließlich ist es möglich Seiten zu analysieren, die mit mindestens einer Impression in der Google Search Console auftauchen. Auf diesem Weg kann man auch URLs identifizieren, die bei einer Suche sichtbar waren, ohne angeklickt worden zu sein.