Bei XML-Sitemaps handelt es sich um eine Liste die im XML-Format erstellt wird und die alle Unterseiten einer Webseite enthält. Eine XML-Sitemap gliedert eine Webseite wie ein Inhaltsverzeichnis einen Artikel.
Sie erleichtert Webcrawlern eine schnelle Orientierung, verweist sie per Link zu passenden Unterseiten und unterscheidet Textelemente von zusätzlichen Inhalten wie Bildern, Videos oder Podcasts. Mit Hilfe von Metadaten erhält der Googlebot Informationen darüber, wie oft neue Inhalte auf die Seite hochgeladen werden und wann sie zuletzt geändert wurde.
XML-Sitemaps sind hierarchisch strukturiert, sodass jede Seite mit allen anderen verlinkt wird. Sie erfordern ein maschinenlesbares Format, um von Suchmaschinen gecrawlt werden zu können: das XML-Sitemap-Protokoll. Alternativ kann sie als RSS-Feed oder Textdatei hinterlegt werden.
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
Abbildung 1: Exemplarischer Aufbau einer XML-Sitemap.
Der offensichtlichste Unterschied ist, dass die XML-Sitemap für den Besucher „unsichtbar“ ist, denn sie liegt als unscheinbare Datei in Deiner Site-Struktur. Die XML-Sitemap erstellst Du für Google und andere Suchmaschinen, die Webseiten mit XML-Datei leichter crawlen können. Das kann auch für Deine SEO-Maßnahmen günstig sein, da die Sitemap Google strukturiert mitteilt, was neu ist auf Deiner Webpräsenz.
Abbildung 2: Komplexe XML-Sitemap von Google (www.google.de/sitemap.xml)
Die HTML-Sitemap ist hingegen für den Leser im Browser sichtbar, meist im unteren Bereich der Seite. Sie ist keine Pflicht und nur sinnvoll, wenn die Seite so viel Content anbietet, dass die Hauptnavigation nicht alle Themen übersichtlich darstellen kann. Für Deine Besucher ist sie praktisch, denn sie finden schneller, wonach sie suchen. Die HTML-Sitemap dient also der besseren Orientierung.
Ein solches "Inhaltsverzeichnis" ist zum Beispiel für Unternehmen, Blogger und Online-Magazin-Betreiber interessant, die dem Leser zusätzlichen Mehrwert bieten. Sie binden auf der Startseite sowie auf jeder Unterseite einen Balken ein mit Informationen zum Unternehmen, zu Service-Angeboten oder Partnern. Blogger können als Sitemap ihr Archiv einblenden. So helfen sie dem Besucher, den Blog thematisch oder chronologisch zu lesen.
Abbildung 3: HTML-Sitemap des Duden Verlags
Um die XML-Sitemap zu erstellen, gibt es mehrere Möglichkeiten. Du kannst sie entweder manuell erstellen oder mit Hilfe von Tools – Google nennt dafür einige Drittanbieter. Mit einem Tool ist die Erstellung einfach: Du musst nur Deine URL eingeben und die fertige Datei herunterladen. Standardmäßig heißt die Datei "sitemap.xml", Du kannst sie aber auch umbenennen.
Sind im Zuge der Sitemap-Generierung andere Dateien entstanden, mit den Endungen gz, html oder txt, kannst du sie vernachlässigen. Aufgepasst: Jetzt wird es etwas tricky, wenn Du Deine Verzeichnisstruktur nicht gut kennst. Denn Du solltest die XML-Sitemap auch an der richtigen Stelle hochladen: in das Root- oder Hauptverzeichnis Deiner Webseite. Achte darauf, dass sie in keinem Unterverzeichnis landet, sondern außerhalb von Ordnern wie metadata, wp-admin, wp-content und wp-includes.
Abbildung 4: Beispiel einer Verzeichnisstruktur
Wenn die Datei jetzt unter folgender URL abrufbar ist, kannst Du sie bei Google einreichen:
http://www.beispieldomain.de/sitemap.xml
Alternativ kannst Du an einer beliebigen Stelle in Deiner robots.txt-Datei die Zeile einfügen:
Sitemap: http://beispieldomain.de/sitemap_location.xml.
Logge Dich anschließend in die Google Search Console ein und wähle die entsprechende Domain.
Abbildung 5: Property in der GSC auswählen
Klicke dazu in der Navigation auf "Crawling" und dann auf "Sitemap". Mit einem Klick auf "Sitemap hinzufügen" siehst Du Deine URL und ein leeres Feld, in das Du den Dateinamen einfügen kannst.
Abbildung 6: Sitemap in der GSC hinzufügen
So hast Du Deiner Seite eine Unterseite hinzugefügt, die für den Leser nur durch die direkte Eingabe der ganzen URL sichtbar ist.
Tipp: Ist Deine Sitemap im unkomprimierten Zustand größer als 10 MB, unterteile sie in mehrere kleinere Sitemaps und reiche eine Sitemap-Indexdatei ein.
Dass Du auf Deiner Webseite so oft wie möglich neue Inhalte bereitstellen solltest, um eine "Online-Stammkundschaft", treue Leser und potenzielle Neukunden zu gewinnen, ist selbstverständlich. Ebenso klar ist, dass der Webcrawler regelmäßig das Web nach aktuellen Informationen durchforstet. Aber warum braucht Google bei so intelligenten Algorithmen noch Updates der Sitemap?
Ganz einfach: Als Early Bird verschaffst Du Dir damit einen Wettbewerbsvorteil. Neue Inhalte werden schneller indexiert und gefunden. So erhöhen Online-Magazine ihre Chancen auf eine exklusive Berichterstattung und ergattern im Idealfall eine der heiß begehrten Google-Boxen. Alle verwendeten Sitemap-Typen wie Text, Bilder oder Videos sollten also nach Änderung der Inhalte geupdatet werden.
Bei kleinen Seiten ist das schnell erledigt: XML an den entsprechenden Tagen händisch generieren und Datei hochladen. Betreiber größerer Webpräsenzen und Blogger mit täglicher Änderungsfrequenz können ihre Sitemap automatisch aktualisieren lassen – zum Beispiel durch Plugins. Achtung: Zu häufige Aktualisierungen gehen zu Lasten der Seitengeschwindigkeit.
Für zusätzliche Medientypen gibt es erweiterte Versionen der Sitemap. Die wichtigsten sind die Bilder-, Video- und News-Sitemap. Für eine rein textbasierte Webseite kannst Du es zwar bei der XML- und der HTML-Sitemap belassen. Wenn Du aber gerne Bilder einbaust, Deinen Lesern How-to-Videos anbietest oder in Google News erscheinen willst, reiche die jeweils passenden "Inhaltsverzeichnisse" ein. Google selbst scheint begeistert von den neuen Möglichkeiten, bessere Suchergebnisse zu präsentieren – mit der Hilfe der Seitenbetreiber.
Das gilt insbesondere für Video-XML-Sitemaps:
"Video-Sitemaps sind eine hervorragende Möglichkeit, Google auf alle Videoinhalte auf Ihrer Website aufmerksam zu machen. Das gilt insbesondere für Inhalte, die wir mit unseren üblichen Crawling-Mechanismen andernfalls möglicherweise nicht erfassen würden. Indem Sie die Auffindbarkeit Ihrer Videoinhalte verbessern, erscheint Ihre Website voraussichtlich häufiger in den Ergebnissen der Google Videos-Suche."
(Statement von Google in der Search Console zum Thema Video-XML-Sitemaps)
Eine Bilder-XML-Sitemap verknüpft Bildinhalte mit zusätzlichen Attributen, zum Beispiel alle Informationen über das Bild (image:image). Praktisch für die Auffindbarkeit und das Ranking in Google Images: Es gibt die Möglichkeit, den Bildern Orte zuzuweisen (geo_location). Über die Bilder gelangen die "Suchenden" dann direkt zu Deiner Webseite.
Für Videos bietet sich die gleichnamige Video-XML-Sitemap an. Suchmaschinen können Videos thematisch besser eingrenzen und der richtigen Zielgruppe vorschlagen. Einen Pluspunkt für die Google-Videosuche hast Du, wenn Du Rich Snippets durch ein individuelles schema.org Markup einreichst. In den Tags kannst Du alles Mögliche angeben, vom Ersteller, Titel und Inhalt des Videos über den Ort und die Länge bis hin zur Angabe, ob der Inhalt "familienfreundlich" ist.
Abbildung 7: Beispiel für eine Video-XML-Sitemap (Quelle: https://developers.google.com/webmasters/videosearch/sitemaps)
Besonders spannend für Online-Zeitungen und Unternehmerblogs ist eine separate News-XML-Sitemap. Denn um die Relevanz von Content und den Trust in ihre Urheber zu gewichten, erfordert der Googlebot News-spezifische Tags. Die wichtigsten sind der Name des Mediums (publication), der Titel des Artikels (title) sowie das Veröffentlichungsdatum (publication_date). Diese Angaben können sich positiv auf das Ranking auswirken.
Im Bereich "Webcrawling" in der Search Console findest Du den "Sitemaps-Bericht". Ein sehr praktischer Service von Google, denn hier kannst Du überprüfen, ob Deine Seite Fehler enthält, die Crawler an der Indexierung hindern. Sehr häufig sind das Probleme im Statuscode, wenn URL-Endungen umbenannt wurden und die 301-Weiterleitungen fehlen. Im Sitemaps-Fehlerbericht steht dann, warum ein Zugriff auf die Seite nicht möglich war.
Abbildung 8: Sitemap in der GSC prüfen
Ein häufiges Problem sind 404-Status-Codes (Broken Links): Beim Aufruf der Seite erscheint "Seite nicht gefunden" – und schlimmstenfalls das unsägliche Baustellen-Männchen. Eine Auflistung der nicht gefundenen Seiten und andere Indexierungsprobleme siehst Du in der Rubrik "Crawling-Fehler".
Auch mit Ryte kannst Du prüfen, welche Seiten Deiner Webseite in der Sitemap.xml aufgeführt werden oder ob es Probleme mit Deiner Datei gibt. Im Website Success, klicke im auf den Bericht "Sitemap". Du erhältst hier eine genaue Übersicht aller Seiten, die in Deiner Sitemap.xml aufgeführt werden.
Abbildung 9: Sitemap mit Ryte prüfen
Sitemaps garantieren nicht, dass alle Inhalte Deiner Webseite gecrawlt und indexiert werden, da die Prozesse von Algorithmen gesteuert werden. Doch mit der Übermittlung einer logisch aufgebauten XML-Sitemap kannst Du die Indexierung für die Suchmaschinenbots erleichtern. Insbesondere für die Einbindung von Videos, die für die Suchmaschinenoptimierung immer wichtiger werden, bietet es sich an, eine Video-XML-Sitemap einzureichen.
Indem sie Google umfassende Informationen zu ihrem Webangebot zugänglich machen, können Webmaster Einfluss auf das Crawling der Seite nehmen. Es lohnt sich also, einen Blick in die Technical SEO zu werfen und seinem Ranking-Glück auf die Sprünge zu helfen. Eine XML-Sitemap ist keine Pflicht, aber sie schadet auf keinen Fall und die Erstellung erfordert nur einen geringen Aufwand.
Veröffentlicht am Feb 14, 2017 von Eva Wagner