Wayback Machine
Wayback Machine ist ein Internetportal, das ältere Versionen von Webseiten zur Verfügung stellt. Dabei werden die Webseitendaten in regelmäßigen Intervallen gespeichert, so dass verschiedene Versionen und Zustände von Webseiten der ganzen Welt gespeichert werden. Mittlerweile sollte die Datenbank mehrere Terabyte an Datenvolumen haben. Wayback Machine ist ein Dienst von Internet Archive aus den USA, einer Non-Profit Organisation.
Zweck
Internet Archive aus San Fransisco, mit dem Gründer Brewster Kahle hat sich zur Aufgabe gemacht, unter anderem mit Hilfe von Wayback Machine einen öffentlich verfügbaren Dienst anzubieten, damit Forscher, Historiker und Wissenschaftler einen Zugang zum digitalen Archiv haben. Das Unternehmen wurde 1996 in San Fransisco gegründet und verwendet die Datenbank des Internet-Unternehmens Alexa. Internet Archive enthält nicht nur archivierte Webseiten, sondern auch Texte, Audio, bewegte Bilder und Software - also die gesamten Inhalte älterer Webseiten.
Kritik
Die Wayback Machine ist zwar in vielerlei Hinsicht ein nützliches Tool. Allerdings ist der Dienst in den vergangenen Jahren zunehmend in die Kritik geraten, weil je nach Land teilweise gegen geltendes Urheberrecht verstoßen wird. Die Wayback Machine arbeitet mit dem sogenannten Opt-Out-Verfahren. Dies bedeutet, dass grundsätzlich alle Inhalte zunächst einmal indexiert werden. Die betroffenen Webseitenbetreiber können ihre Seiten aus dem Archiv entfernen lassen, sofern sie dies nicht möchten. Verhindern können sie die Indexierung nur über den Einsatz einer robots.txt.
Problematisch ist außerdem, dass viele Inhalte, die aus rechtlichen Gründen eigentlich entfernt werden müssten, bestehen bleiben. Solange eine Webseite existiert, kann der Rechteinhaber diese jederzeit sperren lassen. Besteht sie jedoch nicht mehr, wird es schon ungleich schwerer, diese beispielsweise über die robots.txt. zu sperren. Betroffen sind davon insbesondere auch Foren oder Social Media-Dienste, bei denen der einzelne User keine Möglichkeit hat, die Inhalte wieder entfernen zu lassen, auch wenn er mit seinen früheren Aussagen nicht mehr übereinstimmt oder diese sogar rechtswidrig waren (z. B. üble Nachrede).
Ebenso gibt es Kritik an der Rechtmäßigkeit der Waybackmachine. Vor allem in Bezug auf das deutsche Urheberrecht stellt die Archivierung eine Vervielfältigung urheberrechtlich geschützter Werke dar, da es sich bei Websites zweifelsohne um solche handelt. Nach § 15 Abs. 1 UrhG steht ausschließlich dem Urheber das Recht zur Vervielfältigung zu.[1]
Zwar können Webseitenbetreiber die Vervielfältigungen entfernen lassen, jedoch ist die Kontaktaufnahme zu den Betreibern der Waybackmachine nur per E-Mail möglich und teilweise erfolglos, wie im Forum der Wayback Machine berichtet wird.[2]
Ein weiterer Nachteil ist die unregelmäßige und unvollständige Indexierung. Häufig fehlen Multimedia-Dateien, wodurch der Aufruf der ursprünglichen Version einer Webseite unmöglich wird. Hat sich bei einer Unterseite die URL geändert, ist sie nur noch aufzufinden, wenn man eben diese URL kennt.
Alternativen zur Wayback Machine
Die Wayback Machine ist in ihrer Form einzigartig. Ernstzunehmende Alternativen gibt es nicht, den Abruf älterer Versionen einzelner Webseiten ermöglicht jedoch beispielsweise der Google Cache. Die rückwärtige Suche ist im Google Cache jedoch nur eingeschränkt möglich, da Google die Inhalte nur wenige Wochen lang archiviert.
Bedeutung für SEO
Die Wayback Machine kann dem Bereich der SEO dienlich sein. Wenn eine Webseite in den Google SERPs abgestürzt ist, ist die Ursachenforschung gar nicht so einfach. Die Wayback Machine ermöglicht es, den Code der aktuellen und älteren Versionen der Webseite miteinander zu vergleichen und so etwaige Schwachstellen festzustellen.
Zudem ermöglicht es die Wayback Machine, nach älteren Links zu suchen und sie an neue URLs (z. B. durch einen Wechsel des CMS) anzupassen. Auch tote Links sind auf diese Art und Weise zu finden, da viele nicht mehr funktionierende Links das Ranking einer Webseite schwächen können. Nicht zu unterschätzen ist die Wayback Machine hinsichtlich ihrer Nachweisfunktion. Der Dienst dokumentiert die Seiten auf einem älteren Stand. Kopiert ein anderer Webmaster die Inhalte der Webseite, lässt sich auf diese Art und Weise beweisen, dass die jeweiligen Inhalte bereits zu einem früheren Zeitpunkt bestanden haben.[3]
Einzelnachweise
- ↑ The Wayback Machine und Google Cache jurpc.de. Abgerufen am 26.10.2017
- ↑ Wayback Machine Forum archive.org. Abgerufen am 26.10.2017
- ↑ 5 Reasons why Archive.org is a great SEO Tool (englisch) Bluelinerny.com. Abgerufen am 01.03.2017.