PerplexityBot: Co musí vědět každý majitel webu

PerplexityBot: Co musí vědět každý majitel webu

Publikováno dne Jan 3, 2026. Naposledy upraveno dne Jan 3, 2026 v 8:37 am

Co je PerplexityBot?

PerplexityBot je oficiální webový crawler vyvinutý společností Perplexity AI, navržený pro indexaci a zobrazování webových stránek ve výsledcích vyhledávání poháněných Perplexity AI. Na rozdíl od některých AI crawlerů, které sbírají data pro trénink velkých jazykových modelů, má PerplexityBot konkrétní účel: objevovat, procházet a odkazovat na weby, které poskytují relevantní odpovědi na uživatelské dotazy. Crawler používá jasně definovaný user-agent řetězec (Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; PerplexityBot/1.0; +https://perplexity.ai/perplexitybot)) a veřejně zveřejňuje své rozsahy IP adres, což majitelům webů umožňuje identifikovat a spravovat provoz crawleru. Porozumět tomu, co PerplexityBot dělá, je zásadní pro majitele webů, kteří chtějí mít kontrolu nad viditelností svého obsahu v odpovídacím enginu Perplexity a zároveň zachovat transparentnost ohledně toho, jak jsou jejich stránky navštěvovány.

PerplexityBot Web Crawler indexing websites

Jak PerplexityBot funguje

PerplexityBot funguje jako standardní webový crawler, který neustále prohledává internet za účelem objevování a indexace webových stránek. Když narazí na web, přečte si soubor robots.txt, aby zjistil, k jakému obsahu má přístup, a poté systematicky prochází stránky za účelem extrakce a indexace jejich obsahu. Takto získané informace jsou základem algoritmu vyhledávání Perplexity, který je využívá k poskytování citovaných odpovědí na uživatelské dotazy. Ve skutečnosti však Perplexity provozuje dva odlišné crawlery s různými účely, každý s vlastním user-agentem a vzorci chování. Porozumění rozdílu mezi těmito crawlery je klíčové pro majitele webů, kteří chtějí přesně nastavit své přístupové politiky.

FunkcePerplexityBotPerplexity-User
ÚčelIndexuje weby pro výsledky vyhledávání a citaceNa vyžádání načítá konkrétní stránky při odpovídání na dotazy uživatelů
User-Agent řetězecPerplexityBot/1.0Perplexity-User/1.0
Soulad s robots.txtRespektuje zákazy v robots.txtObvykle ignoruje robots.txt (požadavky iniciované uživatelem)
IP rozsahyZveřejněno na perplexity.com/perplexitybot.jsonZveřejněno na perplexity.com/perplexity-user.json
FrekvencePrůběžné, plánované procházeníNa vyžádání, spuštěno dotazy uživatelů
VyužitíBudování vyhledávacího indexuZískávání aktuálních informací pro odpovědi

Rozdíl mezi těmito dvěma crawlery je důležitý, protože je možné je spravovat samostatně pomocí pravidel robots.txt a konfigurace firewallu. Pravidelné indexační procházení PerplexityBot respektuje vaše směrnice robots.txt, zatímco Perplexity-User je může obejít, protože získává obsah v reakci na konkrétní požadavek uživatele. Oba crawlery zveřejňují své IP adresy veřejně, což umožňuje majitelům webů implementovat přesná firewall pravidla v případě, že chtějí konkrétní provoz blokovat nebo povolit.

Kontroverze: Obvinění z tajného procházení

V roce 2025 zveřejnila společnost Cloudflare podrobné vyšetřování, které odhalilo, že Perplexity používá neohlášené crawlery k obcházení omezení webových stránek. Podle jejich závěrů, když byly deklarované crawlery Perplexity (PerplexityBot a Perplexity-User) blokovány pomocí robots.txt nebo firewallu, společnost nasadila další crawlery s generickými browser user-agenty (např. Chrome na macOS) a rotujícími IP adresami z různých ASNs (Autonomous System Numbers), aby nadále získávala omezený obsah. Toto chování přímo odporuje standardům pro webové crawlery definovaným v RFC 9309, které kladou důraz na transparentnost a respektování preferencí majitelů webů. Vyšetřování to testovalo vytvořením zcela nových domén s explicitními zákazy v robots.txt, přesto Perplexity stále poskytovala podrobné informace o jejich obsahu, což naznačuje využívání neohlášených zdrojů dat nebo technik tajného procházení.

To je v ostrém kontrastu se způsobem, jakým OpenAI spravuje své crawlery. GPTBot od OpenAI se jasně identifikuje, respektuje směrnice robots.txt a přestane procházet při zablokování – což dokazuje, že transparentní a etické chování crawleru je možné i praktické. Zjištění Cloudflare vzbudila značné obavy ohledně toho, zda je deklarovaný závazek Perplexity respektovat preference majitelů webů skutečný, zejména pro ty, kteří si výslovně nepřejí, aby jejich obsah byl indexován nebo citován AI systémy. Pro majitele webů, kteří dbají na kontrolu nad obsahem a transparentnost, tato kontroverze zdůrazňuje důležitost monitorování chování crawlerů a využívání více vrstev ochrany (robots.txt, WAF pravidla, blokování IP), aby byly jejich preference skutečně uplatněny.

Měli byste povolit PerplexityBot? Výhody a rizika

Rozhodnutí, zda povolit PerplexityBot na svém webu, vyžaduje zvážení několika důležitých faktorů. Na jedné straně povolení crawleru přináší významné výhody: váš obsah může být citován v odpovědích Perplexity, což může přivést návštěvníky z řad uživatelů, kteří váš web uvidí ve výsledcích generovaných AI. Na druhé straně existují oprávněné obavy ohledně spotřeby šířky pásma, scrapingu obsahu a ztráty kontroly nad tím, jak je vaše informace používána. Rozhodnutí závisí na vašich obchodních cílech, obsahové strategii a na tom, jaký máte vztah k tomu, že AI systémy přistupují k vašim datům.

Klíčové úvahy pro povolení PerplexityBot:

  • Zvýšená viditelnost: Váš obsah je vyhledatelný v odpovídacím enginu Perplexity, který oslovuje miliony uživatelů spoléhajících na AI vyhledávání pro rychlé odpovědi
  • Sledování citací: Objevování ve výsledcích Perplexity přináší vaší značce expozici a lze jej monitorovat pomocí nástrojů jako AmICited.com, které sledují, jak často je váš obsah citován
  • Referral traffic: Uživatelé, kteří uvidí váš web uvedený v odpovědích, mohou na vaše stránky kliknout pro podrobnější informace, což může zvýšit konverze
  • Dopad na šířku pásma: Provoz crawleru spotřebovává serverové zdroje; weby s vysokou návštěvností mohou zaznamenat znatelnou spotřebu šířky pásma díky průběžné indexaci PerplexityBot
  • Obavy o kontrolu nad obsahem: Jakmile je váš obsah indexován, může být citován nebo shrnut v AI odpovědích bez přímé kompenzace, což vyvolává otázky o férovém využití a vlastnictví obsahu
Benefits and Risks of allowing PerplexityBot

Jak povolit nebo zablokovat PerplexityBot

Správa přístupu PerplexityBot je přímočará a lze ji provést několika způsoby v závislosti na vaší technické infrastruktuře a konkrétních požadavcích. Nejčastějším přístupem je použití souboru robots.txt, který poskytuje jasné pokyny všem dobře se chovajícím crawlerům o tom, k jakému obsahu mají přístup.

Pro povolení PerplexityBot v souboru robots.txt:

User-agent: PerplexityBot
Allow: /

Pro zablokování PerplexityBot v souboru robots.txt:

User-agent: PerplexityBot
Disallow: /

Pokud chcete zablokovat PerplexityBot pouze v určitých adresářích a jinde jej povolit, můžete použít podrobnější pravidla:

User-agent: PerplexityBot
Disallow: /admin/
Disallow: /private/
Allow: /public/

Pro důkladnější ochranu, zejména pokud máte obavy z tajného procházení, implementujte pravidla firewallu na úrovni Web Application Firewall (WAF). Uživatelé Cloudflare WAF mohou vytvořit vlastní pravidla pro blokování PerplexityBot kombinací podmínek user-agent a IP adres:

  1. Přejděte na Zabezpečení → WAF → Vlastní pravidla
  2. Vytvořte pravidlo s podmínkami: User-Agent obsahuje “PerplexityBot” A IP Source Address je v publikovaných IP rozsazích PerplexityBot
  3. Nastavte akci na Block nebo Challenge podle preference

Uživatelé AWS WAF by měli vytvořit IP sety podle publikovaných rozsahů IP adres PerplexityBot z https://www.perplexity.com/perplexitybot.json a poté vytvořit pravidla, která odpovídají jak IP setu, tak user-agent řetězci PerplexityBot. Vždy používejte oficiální rozsahy IP, které Perplexity zveřejňuje, protože jsou pravidelně aktualizovány a jsou autoritativním zdrojem legitimního provozu crawleru.

Sledování provozu PerplexityBot

Po nastavení politiky pro PerplexityBot vám sledování skutečné aktivity crawleru pomůže ověřit, že vaše pravidla fungují správně a pochopit dopad na infrastrukturu. Požadavky PerplexityBot můžete identifikovat v serverových logech podle charakteristického user-agent řetězce: PerplexityBot/1.0 nebo generického browser user-agenta v případě tajného procházení. Většina analytických platforem a nástrojů pro analýzu serverových logů vám umožní filtrovat provoz podle user-agenta, takže snadno izolujete požadavky PerplexityBot a analyzujete jejich vzorce.

Klíčové metriky ke sledování zahrnují frekvenci návštěv crawleru, navštěvované stránky a spotřebovanou šířku pásma. Pokud zaznamenáte neobvyklé vzorce – například rychlé procházení citlivých stránek nebo požadavky z IP adres, které nejsou v publikovaných rozsazích Perplexity – může to značit tajné procházení. Kromě základního sledování provozu poskytují specializované nástroje jako AmICited.com hlubší vhled do toho, jak je váš obsah skutečně citován napříč AI platformami včetně Perplexity. AmICited sleduje zmínky o vaší značce a obsahu v AI generovaných odpovědích a umožňuje vám měřit skutečný dopad povolení PerplexityBot a zjistit, které stránky jsou pro AI systémy nejcennější. Tato data vám pomohou činit informovaná rozhodnutí o budoucí správě crawlerů i optimalizaci obsahu.

Nejlepší postupy pro majitele webů

Efektivní správa PerplexityBot vyžaduje vyvážený přístup, který chrání vaše zájmy a zároveň uznává hodnotu AI viditelnosti. Začněte tím, že stanovíte jasnou politiku na základě svých obchodních cílů: rozhodněte se, zda potenciální návštěvnost a zviditelnění značky prostřednictvím citací Perplexity převažují nad vašimi obavami o šířku pásma a kontrolu nad obsahem. Toto rozhodnutí zaznamenejte v souboru robots.txt a komunikujte jej svému týmu, aby všichni rozuměli vaší strategii správy crawlerů.

Dále implementujte vrstevnatou ochranu, pokud se rozhodnete PerplexityBot blokovat. Nespoléhejte pouze na robots.txt, protože kontroverze s tajným procházením ukazuje, že někteří crawlery mohou tyto směrnice ignorovat. Kombinujte pravidla robots.txt s WAF pravidly a blokováním IP pro vícestupňovou ochranu. Dále pravidelně sledujte chování crawlerů kontrolou logů a sledujte oborové diskuze o etice a transparentnosti AI crawlerů. Prostředí se rychle vyvíjí a mohou se objevit nové crawlery či taktiky vyžadující úpravu vašich politik.

A konečně, používejte monitorovací nástroje strategicky k měření skutečného dopadu svých rozhodnutí. Nástroje jako AmICited.com vám umožní zjistit, jak AI systémy citují váš obsah, takže můžete pochopit, zda vám povolení PerplexityBot skutečně přináší očekávané výhody. Pokud crawler povolíte, tato data vám pomohou optimalizovat obsah pro AI citace. Pokud jej blokujete, monitoring vám potvrdí účinnost blokace a to, že se váš obsah neobjevuje v Perplexity výsledcích jinými cestami.

Srovnání s dalšími AI crawlery

PerplexityBot působí v prostředí plném AI crawlerů, z nichž každý má jiné účely a standardy transparentnosti. GPTBot od OpenAI je všeobecně považován za vzor transparentního chování crawleru – jasně se identifikuje, respektuje směrnice robots.txt a při blokaci zastaví procházení. Google crawlery pro AI přehledy a další AI funkce si rovněž zachovávají transparentnost a respektují preference webů. Naproti tomu tajné procházení Perplexity, jak zdokumentovala společnost Cloudflare, je znepokojujícím odklonem od těchto standardů.

Klíčový rozdíl spočívá v transparentnosti a respektování preferencí majitele webu. Dobře se chovající crawlery jako GPTBot umožňují majitelům webů snadno pochopit jejich činnost a nabízejí jasné možnosti kontroly. Používání neohlášených crawlerů a rotace IP adres Perplexity k obcházení omezení tuto důvěru podkopává. Pro majitele webů to znamená, že by měli být při čtení politik Perplexity obezřetnější a implementovat silnější technická opatření, pokud chtějí zajistit, že jejich preference budou skutečně respektovány. Jak bude ekosystém AI crawlerů dále zrát, lze očekávat rostoucí tlak na společnosti jako Perplexity, aby přijaly transparentnější a etičtější postupy v souladu se zavedenými webovými standardy a respektem k autonomii majitelů webů.

Často kladené otázky

Co je PerplexityBot a proč prochází můj web?

PerplexityBot je oficiální webový crawler Perplexity AI, určený k indexaci webů a jejich zobrazování ve výsledcích vyhledávání poháněných Perplexity AI. Na rozdíl od některých AI crawlerů, které sbírají data pro trénink, PerplexityBot konkrétně vyhledává a odkazuje na weby, které poskytují relevantní odpovědi na uživatelské dotazy. Funguje transparentně s publikovaným user-agent řetězcem a rozsahy IP adres.

Používá se PerplexityBot k trénování AI modelů?

Ne. Podle oficiální dokumentace Perplexity je PerplexityBot určen k vyhledávání a odkazování webů ve výsledcích vyhledávání na Perplexity. Nepoužívá se ke sběru obsahu pro základní AI modely nebo k tréninkovým účelům. Jedinou funkcí crawleru je indexace obsahu pro zahrnutí do odpovídacího enginu Perplexity.

Jak mohu zablokovat PerplexityBot na svém webu?

PerplexityBot můžete zablokovat pomocí souboru robots.txt přidáním 'User-agent: PerplexityBot' následovaným 'Disallow: /', čímž zabráníte veškerému přístupu. Pro silnější ochranu implementujte pravidla WAF na Cloudflare nebo AWS WAF, která blokují požadavky odpovídající user-agentu PerplexityBot a jeho IP rozsahům. Upozorňujeme však, že tajné procházení může tato opatření obejít.

Jaké jsou IP adresy pro PerplexityBot?

Perplexity zveřejňuje oficiální rozsahy IP adres pro PerplexityBot na https://www.perplexity.com/perplexitybot.json a pro Perplexity-User na https://www.perplexity.com/perplexity-user.json. Tyto rozsahy jsou pravidelně aktualizovány a měly by být autoritativním zdrojem pro vaše firewall a WAF konfigurace. Vždy používejte oficiální endpointy místo zastaralých seznamů IP.

Respektuje PerplexityBot robots.txt?

PerplexityBot tvrdí, že respektuje směrnice robots.txt, ale vyšetřování Cloudflare v roce 2025 odhalilo důkazy o tajném procházení s využitím neohlášených user-agentů a rotujících IP adres za účelem obejití omezení robots.txt. Zatímco deklarovaný crawler PerplexityBot by měl vaše pravidla robots.txt dodržovat, doporučuje se implementovat i dodatečná WAF opatření, pokud chcete mít jistotu, že vaše preference budou vynuceny.

Kolik datového toku PerplexityBot spotřebuje?

Spotřeba datového toku se liší v závislosti na velikosti a objemu obsahu vašeho webu. PerplexityBot provádí průběžné, plánované procházení podobně jako crawler Google. Weby s vysokou návštěvností mohou zaznamenat měřitelnou spotřebu šířky pásma. Skutečnou spotřebu můžete sledovat filtrováním serverových logů na požadavky PerplexityBot a analýzou objemu přenesených dat, abyste zjistili případný dopad na vaši infrastrukturu.

Mohu sledovat, jak Perplexity cituje můj obsah?

Ano. Můžete ručně vyhledávat na Perplexity dotazy související s vaším obsahem a zjistit, zda je váš web citován v odpovědích. Pro komplexnější sledování využijte nástroje jako AmICited.com, které sledují, jak se vaše značka a obsah zobrazují napříč AI platformami včetně Perplexity, a poskytují přehledy v reálném čase o vaší AI viditelnosti a vzorcích citací.

Jaký je rozdíl mezi PerplexityBot a Perplexity-User?

PerplexityBot je plánovaný crawler, který průběžně indexuje weby pro vyhledávací index Perplexity. Perplexity-User se spouští na vyžádání, když uživatelé pokládají dotazy a Perplexity potřebuje získat konkrétní stránky pro aktuální informace. PerplexityBot respektuje robots.txt, zatímco Perplexity-User jej většinou ignoruje, protože reaguje na uživatelské požadavky. Oba mají samostatné user-agent řetězce a rozsahy IP adres.

Sledujte své AI citace s AmICited

Sledujte, jak Perplexity a další AI platformy citují vaši značku. Získejte přehled v reálném čase o své viditelnosti v AI a optimalizujte svou obsahovou strategii pro maximální dopad v generativních vyhledávačích.

Zjistit více

PerplexityBot
PerplexityBot: AI webový crawler pro answer engine Perplexity

PerplexityBot

Zjistěte více o PerplexityBotu, webovém crawleru společnosti Perplexity pro indexaci obsahu pro její AI answer engine. Seznamte se s jeho fungováním, dodržování...

6 min čtení
Vysvětlení AI crawlerů: GPTBot, ClaudeBot a další
Vysvětlení AI crawlerů: GPTBot, ClaudeBot a další

Vysvětlení AI crawlerů: GPTBot, ClaudeBot a další

Pochopte, jak fungují AI crawleři jako GPTBot a ClaudeBot, v čem se liší od tradičních crawlerů vyhledávačů a jak optimalizovat svůj web pro viditelnost ve vyhl...

12 min čtení