Důležité doplnění: ověřte, zda jsou crawlery skutečně blokovány, nebo prostě nechodí.
Jak zkontrolovat:
- Serverové logy: Hledejte user-agent řetězce
- Firewallové logy: Zjistěte, jestli WAF blokuje
- CDN logy: Cloudflare/AWS může omezovat rychlost
Co jsme našli u jednoho klienta:
robots.txt povoloval GPTBot, ale bezpečnostní pravidla Cloudflare ho blokovala jako „podezřelého bota“.
Firewallová konfigurace pro AI boty:
Pokud používáte Cloudflare:
- Vytvořte firewall pravidlo: Povolit, pokud User-Agent obsahuje “GPTBot” NEBO “PerplexityBot” NEBO “ClaudeBot”
- Whitelistujte oficiální IP rozsahy (zveřejněné každou firmou)
robots.txt je nutný, ale nestačí.
Zkontrolujte všechny vrstvy vašeho stacku.