»Sitemap«

Nico Held08. Februar 2025

Suchmaschinen müssen wissen, welche Seiten es gibt. Das Web ist kein geschlossener Raum; Crawler folgen Links und entdecken so neue URLs. Bei großen oder tief verschachtelten Websites kann es aber sein, dass nicht alle Seiten rechtzeitig oder überhaupt gefunden werden. Eine Sitemap – in der Regel eine XML-Datei unter /sitemap.xml – listet die relevanten URLs und hilft Crawlern, nichts zu übersehen. Sie ist wie ein Inhaltsverzeichnis für die Suchmaschine.

In der Sitemap stehen die URLs der Seiten, oft ergänzt um Angaben wie letzte Änderung oder Priorität. Suchmaschinen nutzen diese Information, um gezielter zu crawlen und neue oder aktualisierte Inhalte schneller zu indexieren. Besonders bei großen Sites, neuen Seiten oder nach Relaunches beschleunigt eine aktuelle Sitemap die Indexierung. Sie ist keine Garantie dafür, dass jede Seite rankt, aber sie erleichtert die Arbeit der Crawler.

Die Sitemap sollte nur Seiten enthalten, die indexiert werden sollen. Duplikate, Testseiten oder Admin-Bereiche gehören nicht hinein. Bei sehr großen Websites können mehrere Sitemaps oder eine Sitemap-Index-Datei genutzt werden. Die Sitemap wird in der Search Console eingereicht oder in der robots.txt referenziert – so weiß die Suchmaschine, wo sie zu finden ist.

Für Menschen kann eine HTML-Sitemap eine übersichtliche Seite mit Links zu allen wichtigen Bereichen sein. Sie hilft Nutzern, die sich verlaufen haben, und kann zusätzlich Suchmaschinen bei der Strukturerkennung unterstützen. Ob für Crawler oder Nutzer: Eine aktuelle Sitemap sorgt dafür, dass Inhalte gefunden werden – statt im Verborgenen zu bleiben.

Nach Relaunches oder größeren Strukturänderungen die Sitemap zu aktualisieren und erneut einzureichen, beschleunigt die Neuindexierung. Dynamisch generierte Sitemaps – z. B. aus dem CMS – stellen sicher, dass neue Seiten automatisch aufgenommen werden. So bleibt die Sitemap ein lebendiges Werkzeug statt einer einmaligen Pflichtübung.

Das könnte dich auch interessieren

»301-Redirect«
Webdesign

301-Redirect

»robots.txt«
Webdesign

robots.txt

»Informationsarchitektur«
Webdesign

Informationsarchitektur