Technické poznámky k implementaci.
Správné nastavení robots.txt:
# Pravidla pro konkrétní AI crawlery
User-agent: GPTBot
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: anthropic-ai
Allow: /
# Výchozí pro ostatní boty
User-agent: *
Allow: /
Disallow: /admin/
Disallow: /private/
Časté chyby:
- Pořadí záleží – Specifická pravidla před zástupci (*)
- Překlepy vás zničí – GPTBot, ne GPT-Bot
- Nutno testovat – Použijte Google robots.txt tester
Rate limiting:
Některé weby silně omezují boty. AI crawlery jsou netrpělivé. Pokud vracíte 429, jdou jinam a citují konkurenci.
Sledujte logy serveru na aktivitu AI crawlerů. Ověřte, že dostávají 200 odpovědi.
Cloudflare poznámka:
Používáte-li Cloudflare s “Bot Fight Mode”, AI crawlery mohou být blokovány na úrovni sítě bez ohledu na robots.txt.
Zkontrolujte nastavení Cloudflare, pokud povolujete v robots.txt, ale citace nevidíte.