Inhaltsverzeichnis
XML-Sitemaps und die robots.txt sind zwei kleine Dateien mit großer Wirkung. Sie steuern, wie Suchmaschinen Ihre Website durchsuchen und welche Seiten in den Index gelangen. Für Unternehmen in Halle (Saale) ist das mehr als ein Technik-Detail: Wenn Ihre Standort- oder Leistungsseiten nicht korrekt erfasst werden, bleiben Sie bei regionalen Suchanfragen unsichtbar – egal wie gut der Inhalt ist.
Dieser Leitfaden erklärt beide Dateien so, dass auch ohne technischen Hintergrund klar wird, worauf es ankommt. Die saubere Konfiguration gehört bei uns zur technischen SEO-Betreuung.
Was ist eine XML-Sitemap?
Eine XML-Sitemap ist eine strukturierte Liste aller wichtigen Seiten Ihrer Website. Sie sagt Google: “Diese Seiten gibt es, sie sind relevant, bitte berücksichtige sie.” Besonders bei größeren Websites mit vielen Leistungs- und Standortseiten hilft die Sitemap dabei, dass keine wichtige Seite übersehen wird.
Für ein Unternehmen in Halle mit mehreren Dienstleistungsseiten und einem Blog stellt die Sitemap sicher, dass Google den Überblick behält und neue Inhalte schneller findet.
Was ist die robots.txt?
Die robots.txt liegt im Wurzelverzeichnis Ihrer Website und gibt Suchmaschinen Anweisungen, welche Bereiche sie crawlen dürfen und welche nicht. Sie ist gewissermaßen der Türsteher Ihrer Website. Hier lassen sich etwa interne Verwaltungsbereiche oder doppelte Inhalte vom Crawling ausschließen.
Vorsicht: Die robots.txt ist mächtig und fehleranfällig. Eine falsche Zeile kann versehentlich die gesamte Website für Google sperren – ein Fehler, der schon manch lokalem Unternehmen die Sichtbarkeit gekostet hat.
Sitemap und robots.txt im Vergleich
| Merkmal | XML-Sitemap | robots.txt |
|---|---|---|
| Zweck | Wichtige Seiten anzeigen | Crawling-Zugriff steuern |
| Wirkung | Empfehlung an Google | Anweisung an Crawler |
| Risiko bei Fehlern | Veraltete URLs | Komplette Sperrung möglich |
| Speicherort | Frei wählbar, meist /sitemap.xml | Immer im Wurzelverzeichnis |
| Einreichung | In der Search Console | Wird automatisch gefunden |
Häufige Anwendungsfälle
Neue Seiten schneller indexieren lassen: Wenn Sie eine neue Leistungsseite für ein Angebot in Halle veröffentlichen, sorgt eine aktuelle Sitemap dafür, dass Google sie zügig entdeckt.
Crawling-Budget schonen: Bei größeren Websites verhindert die robots.txt, dass Google Zeit mit unwichtigen Bereichen verschwendet und sich auf Ihre relevanten Seiten konzentriert.
Sensible Bereiche ausschließen: Login-Bereiche oder interne Suchergebnisseiten gehören nicht in den Index und lassen sich gezielt ausschließen.
Der wichtigste Hinweis zur robots.txt
Ein verbreitetes Missverständnis: Die robots.txt verhindert keine Indexierung, sondern das Crawling. Eine Seite, die von extern verlinkt ist, kann trotz robots.txt-Sperre im Index landen – nur ohne Inhalt. Wenn Sie eine Seite zuverlässig aus dem Index halten wollen, ist eine noindex-Anweisung der richtige Weg, nicht die robots.txt.
Sitemap in der Google Search Console einreichen
Reichen Sie Ihre Sitemap in der Google Search Console ein. Dort sehen Sie auch, ob Google sie verarbeiten konnte und wie viele der enthaltenen URLs indexiert wurden. Eine große Lücke zwischen eingereichten und indexierten Seiten ist ein Warnsignal, dem Sie nachgehen sollten.
Häufige Fehler bei Sitemap und robots.txt
- Versehentliche Komplettsperre: Eine Zeile wie “Disallow: /” sperrt die gesamte Website. Prüfen Sie das immer nach Änderungen.
- Veraltete Sitemap: Wenn die Sitemap auf gelöschte oder weitergeleitete Seiten verweist, verschwendet das Crawling-Budget.
- robots.txt mit noindex verwechseln: Beide haben unterschiedliche Funktionen und sind nicht austauschbar.
- Wichtige Seiten ausschließen: Manchmal werden Leistungsseiten versehentlich blockiert – mit direkten Folgen für die regionale Sichtbarkeit.
- Sitemap nie einreichen: Ohne Einreichung in der Search Console verschenken Sie nützliche Kontrolle und Daten.
Häufige Fragen (FAQ)
Braucht jede Website eine Sitemap?
Für kleine Websites mit wenigen, gut verlinkten Seiten ist sie nicht zwingend, aber empfehlenswert. Bei mehreren Leistungs- und Standortseiten ist sie klar von Vorteil.
Kann ich die robots.txt selbst bearbeiten?
Technisch ja, aber mit Bedacht. Ein kleiner Fehler kann große Folgen haben. Im Zweifel prüfen wir die Datei für Sie, bevor sie live geht.
Wie oft muss ich die Sitemap aktualisieren?
Idealerweise automatisch bei jeder Änderung. Viele Systeme erzeugen die Sitemap dynamisch, sodass sie immer aktuell ist.
Sehe ich in der Search Console, ob alles funktioniert?
Ja. Die Search Console zeigt den Status Ihrer Sitemap und meldet, wenn die robots.txt das Crawling wichtiger Seiten blockiert.
Fazit
Sitemaps und robots.txt sind unscheinbar, aber entscheidend dafür, dass Ihre Website korrekt erfasst wird. Für Unternehmen in Halle (Saale) ist ein sauberes Setup die Voraussetzung, um bei regionalen Suchanfragen überhaupt sichtbar zu sein.
Möchten Sie sichergehen, dass Google Ihre Seiten richtig erfasst? Wir prüfen Crawling und Indexierung transparent. Sehen Sie sich unser technisches SEO an oder fragen Sie eine kostenlose SEO-Analyse an.