Wayback Machine

Aus Handbuch » XOVI

Das Internetportal namens Wayback Machine ist eine Art Archiv für ältere Versionen von Webseiten. Die Seite speichert in festgelegten Zeitabständen den Inhalt der Seiten und generiert eine Historie mit diversen Versionen und Zuständen. Die Datenbank erfasst zig Webseiten aus aller Welt und dürfte damit schon einige Terabyte an Inhalten gesammelt haben. Die Non-Profit Organisation „Internet Archive“ steckt hinter der Wayback Machine.

Sinn der Wayback Machine

Mit ihrem Sitz in San Francisco hat sich Internet Archive um Gründer Brewster Kahle eine große Aufgabe gestellt. Sie wollen einen öffentlich zugänglichen Dienst anbieten, damit das digitale Archiv von Forschern, Wissenschaftlern und Historikern genutzt werden kann. Die Datenbank für diese riesige Ansammlung von Informationen stellt das Unternehmen Alexa. Seit 1996 sammelt das Unternehmen kontinuierlich verschiedene Versionen von Webseiten. Erfasst werden dabei nicht nur Webseiten an sich, sondern auch Audio- und Video-Inhalte, sowie Texte und Software, also den gesamten Inhalt von älteren Webseiten.

Kritik

Das Tool ist für viele die gern eine geschichtliche Entwicklung nachvollziehen wollen sehr sinnvoll, aber die Abspeicherung von Daten anderer Betreiber ist auch umstritten. Zum Teil wird je nach Gesetz des Landes gegen das Urheberrecht verstoßen. Das Opt-Out-Verfahren der Wayback Machine erfasst erst einmal alle Inhalte und indexiert diese. Die Webmaster müssen dann um eine Löschung ihrer Seite aus dem Archiv bitten. Wer die Erfassung von vornherein verhindern möchte, der muss seinen robots.txt entsprechend gestalten. Viele Inhalte müssten zudem aus rechtlichen Gründen entfernt werden, bleiben aber meist bestehen. Wenn die Webseite noch betrieben wird, kann ein Antrag auf Löschung gestellt werden. Nach Löschung der Seite bleiben die Inhalte aber in der Wayback Machine erhalten. Foren und Social Media-Dienste haben damit zunehmend ein Problem. Der Nutzer kann hier geschriebene Inhalte nicht mehr entfernen lassen, auch wenn sie seine aktuelle Meinung nicht mehr wiederspiegeln. Auf die Indexierung selbst können die Webseitenbetreiber auch keinen Einfluss nehmen. Wenn bestimmte Multimedia-Daten nicht mit aufgezeichnet werden, lassen sich manche Seiten nicht vollständig aufrufen. Wer bspw. die Struktur einer URL nachträglich ändert, kann diese in der Wayback Machine nur finden, wenn er die genaue Adresse kennt.

Die Wayback Machine und SEO

Für Suchmaschinenoptimierer ergibt sich ein gewisser Nutzen der Wayback Machine. Erfolgte eine Abstrafung (Penalty) bei den SERPs, ist dies nicht immer leicht nachzuvollziehen. Die Wayback Machine erleichtert das Vergleichen des Codes der aktuellen und der älteren Version einer Webseite. Schwachstellen lassen sich ausfindig machen und beheben. In der Wayback Machine finden sich meist ältere Links und diese lassen sich dann an die neuen URLs anpassen. Bei einem Wechsel des CMS oder einer Umstellung der Linkstruktur ist dies tatsächlich hilfreich. Alte Versionen einer Seite zeigen auch tote Links auf und wenn diese nicht mehr funktionieren, beeinflusst dies das Ranking negativ. Bei Duplicate Content anderer Seitenbetreiber dient die Wayback Machine als Nachweisquelle, dass die eigenen Inhalte in einer älteren Version schon vorher bestanden haben.