Note tehnice de implementare.
Configurarea corectă a robots.txt:
# Reguli specifice pentru crawlere AI
User-agent: GPTBot
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: anthropic-ai
Allow: /
# Implicit pentru alți boti
User-agent: *
Allow: /
Disallow: /admin/
Disallow: /private/
Greșeli frecvente:
- Ordinea contează – Reguli specifice înainte de wildcard
- Erorile de scriere te pot costa – GPTBot, nu GPT-Bot
- Testarea e esențială – Folosește testerul de robots.txt de la Google
Considerații despre rate limiting:
Unele site-uri limitează agresiv rata botilor. Crawlerele AI sunt nerăbdătoare. Dacă returnezi erori 429, ele trec mai departe și citează competiția.
Verifică logurile serverului pentru activitate AI crawler. Asigură-te că primesc răspunsuri 200.
Considerația Cloudflare:
Dacă folosești Cloudflare cu “Bot Fight Mode” activat, crawlerele AI pot fi blocate la nivel de rețea, indiferent de robots.txt.
Verifică setările Cloudflare dacă permiți în robots.txt, dar nu vezi citări.