Monitorowalem aktywnosc crawlerow AI na wielu stronach wydawcow. Oto co pokazuja dane:
Aktywnosc GPTBot: Wzrosla o 305% rok do roku wedlug danych Cloudflare. Przychodzi falami z utrzymujacymi sie szczytami trwajacymi dni.
Zachowanie PerplexityBot: Udokumentowane jako uzywajace zarowno deklarowanych, jak i niedeklarowanych crawlerow. Niedeklarowane sa trudniejsze do wykrycia.
Co ujawnil monitoring:
- Crawlery AI najczesciej uderzaja w nasze najbardziej wartosciowe strony z trescia
- Staja sie inteligentniejsze w znajdowaniu tresci mimo ograniczen
- Aktywnosc koreluje z nowymi cyklami trenowania modeli
Rekomendacja: Nie tylko wdrazaj ochrone - monitoruj, co faktycznie sie dzieje. Uzywamy Am I Cited do sledzenia, ktore z naszych tresci pojawiaja sie w odpowiedziach AI, a nastepnie krzyowo sprawdzamy z logami crawlerow. To mowi nam dokladnie, co przechodzi przez nasze ograniczenia.