Sitemap für die Webseite erstellen
Google, Yahoo! und Microsoft haben sich auf einen Standard für die Erstellung von Sitemaps geeinigt. Damit können Sie den Suchmaschinen die Arbeit beim Indizieren Ihrer Webseite erleichtern und zugleich unterschiedliche Schwerpunkte Ihrer Webseite definieren.
Die Sitemap wird im XML-Format angelegt und die Datei muss UTF-8 kodiert sein. Folgende Inhalte müssen zwingend angegeben werden:
- Die Auflistung der Webseiten wird mit dem
<urlset>...</urlset>-Tag umschlossen. - Pro URL bzw. Seite müssen Sie einen
<url>...</url>-Eintrag anlegen. - Als untergeordnetes Element zum
<url>...</url>-Eintrag müssen Sie eine Adresse mit Hilfe des<loc>...</loc>-Tags angeben.
Der folgende Quellcode zeigt eine Sitemap für eine Webseite mit nur zwei Unterseiten.
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.webmaster-resource.de/index.php</loc> <lastmod>2007-04-01</lastmod> <changefreq>weekly</changefreq> <priority>0.5</priority> </url> <url> <loc>http://www.webmaster-resource.de/tricks/php.php</loc> <lastmod>2007-04-15</lastmod> <changefreq>daily</changefreq> <priority>0.8</priority> </url> </urlset>
Die folgende Tabelle erläutert die Verwendung der verschiedenen Tags.
| Attribut | Beschreibung | |
|---|---|---|
| <urlset> | erforderlich | Fasst die Datei zusammen und verweist auf den aktuellen Protokollstandard. |
| <url> | erforderlich | Übergeordneter Tag für die einzelnen URL-Einträge. Die übrigen Tags sind diesem untergeordnet. |
| <loc> | erforderlich | URL der Seite. Diese URL muss mit dem Protokoll beginnen (z.B. “http”) und mit einem abschließenden Schrägstrich enden, sofern vom Webserver benötigt. Dieser Wert darf höchstens 2.048 Zeichen lang sein. |
| <lastmod> | optional | Datum der letzten Änderung der Datei. Dieses Datum sollte das W3C Datetime-Format (s. Links & Querverweise) aufweisen. Mit diesem Format können Sie die Uhrzeit weglassen und JJJJ-MM-TT verwenden.
Dieser Tag ist vom “If-Modified-Since”-Header (304), den der Server zurückgeben kann, unabhängig. Suchmaschinen können die Informationen von beiden Quellen unterschiedlich verwenden. |
| <changefreq> | optional | Die Häufigkeit, mit der sich die Seite voraussichtlich ändern wird. Dieser Wert gibt Suchmaschinen allgemeine Informationen. Er steht nicht unbedingt mit der Häufigkeit in Zusammenhang, mit der Sie die Seite durchsuchen. Gültige Werte sind:
Der Wert “always” wird zur Beschreibung von Dokumenten verwendet, die sich bei jedem Zugriff verändern. Der Wert “never” dient zur Beschreibung archivierter URLs. Der Wert dieses Tags wird als Hinweis aufgefasst, nicht als Befehl. Die Suchmaschinen-Crawler können diese Information zwar bei ihren Entscheidungen berücksichtigen. Sie durchsuchen jedoch Seiten, die mit “hourly” gekennzeichnet sind, eventuell seltener als stündlich, oder Seiten, die mit “yearly” gekennzeichnet sind, häufiger als jährlich. Selbst mit “never” gekennzeichnete Seiten können von den Crawlern in regelmäßigen Zeitabständen durchsucht werden, um unerwartete Änderungen an solchen Seiten zu erkennen. |
| <priority> | optional | Die Priorität dieser URL gegenüber anderen URLs auf Ihrer Website. Gültige Werte liegen zwischen 0,0 und 1,0. Dieser Wert hat keinen Einfluss auf einen Vergleich Ihrer Seiten mit Seiten auf anderen Websites. Er informiert die Suchmaschinen lediglich darüber, welche Seiten für die Crawler die höchste Priorität haben.
Die Standardpriorität einer Seite ist 0.5. Beachten Sie, dass die Priorität, die Sie einer Seite zuordnen, wahrscheinlich keinen Einfluss auf die Position Ihrer URLs in den Ergebnisseiten einer Suchmaschine hat. Diese Information wird unter Umständen von den Suchmaschinen lediglich zur Auswahl zwischen URLs derselben Website genutzt. Die Verwendung dieses Tags erhöht somit die Wahrscheinlichkeit, dass Ihre wichtigsten Seiten im Suchindex aufgeführt werden. Beachten Sie auch, dass es unsinnig ist, sämtlichen URLs Ihrer Website hohe Priorität zuzuordnen. Da die Priorität relativ ist, dient sie nur zur Auswahl zwischen URLs auf Ihrer Website. |
Praktische Hinweise zur Verwendung von Sitemaps
- Ihre Sitemap-Datei muss UTF-8 kodiert sein und Sonderzeichen müssen entsprechend URL-escaped und codiert werden, z.B. wird aus dem kaufmännischen Und (&) der folgende Code
&. - Positionieren Sie die Sitemap-Datei im Hauptverzeichnis Ihrer Webseite.
- Mit Hilfe der Datei “robots.txt” können Sie Suchmaschinen auf Ihre Sitemap hinweisen. Fügen Sie dazu den folgenden Eintrag hinzu:
Sitemap: <http://www.webmaster-resource.de/sitemap.xml>
Achten Sie darauf, dass Sie die vollständige Adresse (inkl. http://) Ihrer Sitemap angeben.
Kategorie: Webentwicklung
