Notas sobre la implementación técnica.
Configuración adecuada de robots.txt:
# Reglas específicas para rastreadores de IA
User-agent: GPTBot
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: anthropic-ai
Allow: /
# Predeterminado para otros bots
User-agent: *
Allow: /
Disallow: /admin/
Disallow: /private/
Errores comunes:
- El orden importa - Reglas específicas antes de comodines
- Los errores tipográficos te afectan - GPTBot, no GPT-Bot
- Probar es esencial - Usa el probador de robots.txt de Google
Consideración de rate limiting:
Algunos sitios limitan mucho la tasa de bots. Los rastreadores de IA son impacientes. Si devuelves errores 429, se van y citan a competidores.
Revisa tus registros de servidor para actividad de rastreadores de IA. Asegúrate de que reciben respuestas 200.
La consideración de Cloudflare:
Si utilizas Cloudflare con “Bot Fight Mode” activado, es posible que los rastreadores de IA sean bloqueados a nivel de red, sin importar el robots.txt.
Revisa la configuración de Cloudflare si permites en robots.txt pero no ves citaciones.