Které AI crawlery povolit v robots.txt? GPTBot, PerplexityBot atd.
Diskuze komunity o tom, které AI crawlery povolit či blokovat. Skutečná rozhodnutí webmasterů ohledně přístupu GPTBot, PerplexityBot a dalších AI crawlerů pro v...
Jsme B2B vydavatel. Náš obsah je využíván AI systémy a dostávám protichůdné rady.
Právník A říká: “Jde o porušení autorských práv. Zablokujte všechny AI crawlery. Připravte se na soudní spor.”
Právník B říká: “To je spravedlivé užití. Nelze tomu zabránit. Zaměřte se na maximalizaci výhod z viditelnosti.”
Moje pozorování:
Moje otázky:
Potřebuji praktický postoj, ne jen právní teorii.
Přináším aktuální stav věcí:
Probíhající soudní spory (k prosinci 2025):
Zatím žádný právní precedens. Soudy stále nerozhodly, zda je trénování AI spravedlivé užití.
Argumenty AI společností:
Argumenty vydavatelů:
Praktická realita:
| Typ vydavatele | Typická strategie |
|---|---|
| Velký (NYT, WSJ) | Soudní spory + licenční jednání |
| Velké redakce | Licenční jednání, částečné blokování |
| Střední | Většinou povolují, doufají ve viditelnost |
| Malé | Povolují, zaměřují se na traffic |
Proč střední vydavatelé většinou povolují:
Konkrétně k licenčním dohodám:
Kdo má dohody:
Velikost dohod (uveřejněné):
Proč střední vydavatelé nemohou získat dohodu:
Nepříjemná pravda: Pokud nejste na úrovni NYT, licence není reálná.
Co můžete udělat:
Poměr nákladů a přínosů: Blokování = přijdete o viditelnost, neochráníte nic zásadního Povolování = získáte viditelnost, budoucí práva jsou nejistá
Většina středních vydavatelů volí viditelnost.
Poznámka: Nejde o právní radu, pouze obecné informace.
Proč se vaši právníci neshodnou:
Právník A (blokovat/soudit):
Právník B (přijmout/povolit):
Oba mají ze svého pohledu pravdu.
Otázky, které si klást:
Můžete si dovolit soudní spor?
Co vlastně chráníte?
Jaký je váš obchodní model?
Moje pozorování: Většina B2B vydavatelů volí viditelnost, protože jejich obchodní model z toho těží více, než prodělává používáním AI.
Naše rozhodnutí a proč:
Náš byznys: B2B oborové médium, podobné vašemu. Příjmy: reklama + eventy + sponzorovaný obsah
Naše rozhodnutí: Povolit všechny AI crawlery. Maximalizovat viditelnost.
Proč:
Příjmy máme z publika, ne z prodeje obsahu Viditelnost v AI = více publika = více příjmů
Blokování by nepomohlo Obsah už je v trénovacích datech. Blokováním jen přijdeme o budoucí hodnotu.
AI traffic má hodnotu 5 % návštěvnosti je z AI referralů. Tito uživatelé se dobře konvertují.
Reálná licenční možnost není Oslovili jsme OpenAI. V našem měřítku nemají zájem.
Náklady na právní kroky převyšují přínosy Soudní spor by stál více než možný výnos.
Co jsme udělali:
Výsledek: Viditelnost v AI vzrostla o 200 %. Referral traffic roste. Zvyšuje se povědomí o značce.
Licenční dohodu bychom přijali? Samozřejmě. Ale nečekáme na ni.
Důležité rozlišení, které mnozí přehlížejí:
Použití pro trénování vs. citace v reálném čase
| Aspekt | Trénovací data | Citace v reálném čase |
|---|---|---|
| Kdy se děje | Stavba modelu | Při každém dotazu |
| Co je použito | Celý obsah | Úryvky/fakta |
| Lze blokovat? | Jen do budoucna | Ano (robots.txt) |
| Právní status | Velmi sporné | Méně kontroverzní |
| Obchodní dopad | Minulý obsah zahrnut | Ovlivňuje aktuální viditelnost |
Různé AI systémy, různé přístupy:
ChatGPT (základní):
ChatGPT (Search):
Perplexity:
Nuance: Blokováním trénovacích crawlerů ChatGPT (GPTBot) = vyloučení z budoucího tréninku, neovlivní současný model Blokováním Perplexity = přijdete o výhody citací v reálném čase
Mnoho vydavatelů: Blokuje trénovací crawlery, povoluje citační. Kompromis.
Zde je nuancovaný přístup pomocí robots.txt:
Selektivní strategie:
# Blokovat trénovací crawlery
User-agent: GPTBot
Disallow: /
User-agent: Google-Extended
Disallow: /
User-agent: CCBot
Disallow: /
# Povolit citační/vyhledávací crawlery
User-agent: ChatGPT-User
Allow: /
User-agent: PerplexityBot
Allow: /
Co to dělá:
Kdo tento přístup využívá: Někteří velcí vydavatelé pro vyvážení postupu.
Omezení: Minulá trénovací data zůstávají. Ovlivňuje jen budoucnost.
Pro vaše právníky: Může uspokojit oba:
Je to kompromis, který mnohým vyhovuje.
Co podle mě nastane (můj odhad):
Krátkodobě (2026):
Střednědobě (2027–2028):
Dlouhodobě (2028+):
Co to pro vás znamená:
Paralela: Jako u raného streamování hudby/videa – začátek kontroverzní, později vznikly licence. Obsah pro AI může projít podobnou cestou.
Ale to trvalo roky. Nepozastavujte kvůli tomu byznys.
Pomohlo mi to utvořit si postoj. Naše strategie:
Rozhodnutí: Povolit s dokumentací
Co děláme:
Jak to prezentuji vedení:
“Právní situace je skutečně nejistá. Ani blokování, ani povolování nezaručuje jasnou ochranu. Vzhledem k našemu obchodnímu modelu založenému na dosahu doporučujeme udržet viditelnost v AI a zároveň:
Pro právníky: Tím dáme Právníkovi A blokování/dokumentaci, Právníkovi B viditelnost/pragmatismus.
Klíčový postřeh: Nejde o autorskoprávní strategii – je to obchodní strategie, která uznává právní nejistotu. Optimalizujeme to, co ovlivnit můžeme (viditelnost), a současně si necháváme otevřené možnosti pro to, co ovlivnit nemůžeme (právní výsledek).
Díky všem za praktické pohledy.
Get personalized help from our team. We'll respond within 24 hours.
Zjistěte, jak je váš obsah využíván a citován v ChatGPT, Perplexity a na dalších AI platformách.
Diskuze komunity o tom, které AI crawlery povolit či blokovat. Skutečná rozhodnutí webmasterů ohledně přístupu GPTBot, PerplexityBot a dalších AI crawlerů pro v...
Diskuze komunity o autorských právech v AI, která zahrnuje obavy ohledně autorských práv, licenčních rámců, debaty o fair use a strategie, jak chránit obsah tvů...
Diskuze komunity o tom, jak licenční dohody vydavatelů s AI společnostmi jako OpenAI ovlivňují vzorce citací a viditelnost obsahu. Pohledy vydavatelů a tvůrců o...
Souhlas s cookies
Používáme cookies ke zlepšení vašeho prohlížení a analýze naší návštěvnosti. See our privacy policy.