Technische Hinweise zur Umsetzung.
Korrekte robots.txt-Konfiguration:
# Regeln für bestimmte KI-Crawler
User-agent: GPTBot
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: anthropic-ai
Allow: /
# Standard für andere Bots
User-agent: *
Allow: /
Disallow: /admin/
Disallow: /private/
Häufige Fehler:
- Reihenfolge zählt – Spezifische Regeln vor Wildcards
- Tippfehler sind fatal – GPTBot, nicht GPT-Bot
- Testen ist Pflicht – Mit Googles robots.txt-Tester prüfen
Rate-Limiting beachten:
Einige Seiten begrenzen Bots zu stark. KI-Crawler sind ungeduldig. Bei 429-Fehlern ziehen sie weiter und zitieren Wettbewerber.
Server-Logs auf KI-Crawler prüfen. Sicherstellen, dass sie 200-Responses bekommen.
Cloudflare beachten:
Mit aktiviertem “Bot Fight Mode” blockiert Cloudflare KI-Crawler evtl. auf Netzwerkebene, unabhängig von robots.txt.
Cloudflare-Einstellungen prüfen, falls Sie in robots.txt erlauben, aber keine Zitate sehen.