XML


Die Auszeichnungssprache XML ist weniger kompliziert, als man angesichts des Namens (“Extensible Markup Language”) denken könnte: In einem XML-File steht stark strukturierter Text - ähnlich wie in HTML-Dateien. Allerdings ist die Strukturierung des Textes so eindeutig und logisch, dass damit gesamte Datenbanken abgebildet werden können. Häufig wird XML für Sitemaps genutzt, die anschließend in der Google Search Console oder den Webmaster Tools von Bing hochgeladen werden können.

Der Aufbau

Der Trick von XML ist die Hierarchie und die flexible Kennzeichnung der enthaltenen Daten: Es gibt immer einen Start-Tag wie z.B. “” und einen dazugehörigen End-Tag mit vorangestelltem Slash: “”. Innerhalb dieser beiden Tags gehören die enthaltenen Informationen zu einer Einheit und können weiter strukturiert werden. Das kann dann so aussehen:

<tt>
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<onpage>
  <header>
    <title-tag>iPhones von iPhone-Broker</title-tag>
    <description>Wir haben die besten iPhones der Welt</description>
  </header>
  <content>
    <headline>Tolle iPhones</headline>
    <text>Wenn es unbedingt ein Telefon der Extraklasse sein soll, dann ein iPhone von uns. Bla bla bla.</text>
  <content>
</onpage>
</tt>


In der ersten Zeile werden die XML-Version und die Zeichencodierung definiert. Alle weiteren Zeilen stehen für den eigentlichen Inhalt der Datei. Auf diese Weise enthält die XML-Datei einerseits die zu übergebende Information. Andererseits weiß der “Empfänger”, was er in jedem einzelnen Feld zu erwarten hat.

Definition der Tags

Diese Tags können völlig flexibel benannt werden - das ist ein entscheidender Unterschied zum HTML, in dem jeder Tag eine bestimmte Funktion hat ("strong" für fett und "h1" für eine Überschrift). Zusätzlich kann in einer Dokumenttypdefinition ("DTD") oder in einem XML-Schema geregelt werden, wie die Struktur der Datei zu sein hat, welche Werte enthalten sein müssen, und welche Art von Werten erwartet werden. In dieser Datei wird also festgelegt, dass in dem oben genannten Beispiel immer ein Title-Tag vorhanden sein muss und dass dies Text sein soll. Und dass ein Wert wie etwa die Dateigröße immer in ganzen Zahlen angegeben sein muss. Prüft der Empfänger die erhaltenen XML-Dateien gegen die DTD oder das XML-Schema, wird er automatisch auf Fehler aufmerksam.

Müssen nicht nur Textinformationen, sondern auch Bilder oder Videos übergeben werden, können diese meist nicht im XML enthalten sein, sondern - hier wieder die Parallele zum HTML - es wird eine Referenz, also ein Link, auf die gespeicherte Datei eingefügt. Für zweidimensionale Grafiken kann die Erweiterung .svg (Scalable Vector Graphics) eingefügt werden.

Formen

Verwendet wird XML immer dann, wenn eine strukturierte Übergabe oder Speicherung von Daten sinnvoll ist. Also etwa für Produktdaten vom Netzwerk zum Affiliate oder für das Syndizieren von Inhalten. Eine besondere Form von XML ist das XHTML (Extensible Hypertext Markup Language), eine Auszeichnungssprache für Webseiten. Hierbei enthält XHTML alle Elemente von HTML 4.01 und ist größtenteils abwärtskompatibel verwendbar - kann also von Browsern angezeigt werden, die nicht XHTML-fähig sind.

Weitere Infos

Definiert wird XML vom W3C, zuletzt in der fünften Version vom 26. November 2008. Ob das XML korrekt ist, zeigt zum Beispiel der XML-Validator[1] von Validome.

Einzelnachweise