Tenho monitorado atividade de crawlers de IA em multiplos sites de editores. Aqui esta o que os dados mostram:
Atividade do GPTBot: Aumentou 305% ano a ano de acordo com dados da Cloudflare. Vem em ondas com picos sustentados durando dias.
Comportamento do PerplexityBot: Documentado usando crawlers declarados e nao declarados. Os nao declarados sao mais dificeis de detectar.
O que o monitoramento revelou:
- Crawlers de IA atingem nossas paginas de conteudo mais valiosas com mais frequencia
- Estao ficando mais inteligentes em encontrar conteudo mesmo com restricoes
- Atividade correlaciona com ciclos de treinamento de novos modelos
Recomendacao: Nao apenas implemente protecao - monitore o que esta realmente acontecendo. Usamos Am I Cited para rastrear qual do nosso conteudo aparece em respostas de IA, depois cruzamos com logs de crawler. Isso nos diz exatamente o que esta passando pelas nossas restricoes.