
Google-Extended: Co dělá a měli byste jej blokovat?
Zjistěte, co je Google-Extended, jak funguje a zda byste jej měli blokovat ve svém robots.txt. Pochopte rozdíl mezi kontrolou trénování AI a AI Přehledy....

Google-Extended je uživatelský agent (user-agent) umožňující kontrolovat, zda je obsah webu využíván ke zlepšování Gemini a dalších AI produktů Google, odděleně od běžného procházení Googlebotem. Vydavatelům umožňuje řídit přístup k trénování AI skrze robots.txt bez dopadu na viditelnost ve vyhledávání. Zaveden v září 2023, reaguje na obavy vydavatelů ohledně využití obsahu při vývoji AI modelů. Google-Extended nemá vliv na SEO pozice ani zařazení do vyhledávání.
Google-Extended je uživatelský agent (user-agent) umožňující kontrolovat, zda je obsah webu využíván ke zlepšování Gemini a dalších AI produktů Google, odděleně od běžného procházení Googlebotem. Vydavatelům umožňuje řídit přístup k trénování AI skrze robots.txt bez dopadu na viditelnost ve vyhledávání. Zaveden v září 2023, reaguje na obavy vydavatelů ohledně využití obsahu při vývoji AI modelů. Google-Extended nemá vliv na SEO pozice ani zařazení do vyhledávání.
Google-Extended je uživatelský agent (user-agent), který umožňuje vydavatelům webových stránek řídit, zda bude jejich obsah použit pro trénování generativních AI modelů Google, včetně Gemini, Barda a Vertex AI. Na rozdíl od Googlebota, který prochází weby kvůli indexaci obsahu pro vyhledávání, Google-Extended funguje nezávisle a sbírá data výhradně pro účely trénování AI modelů a tzv. groundingu (zpřesnění odpovědí). Tento uživatelský agent není samostatný HTTP crawler – slouží jako kontrolní mechanismus v souboru robots.txt, který mohou vydavatelé využít k strategickému rozhodování o roli svého obsahu při vývoji AI. Zavedení Google-Extended představuje významný posun v tom, jak mohou weboví vydavatelé spravovat svá autorská práva v éře umělé inteligence.

Google-Extended funguje prostřednictvím známého protokolu robots.txt, což je prostý textový soubor umístěný v kořenovém adresáři webu a sloužící k udílení instrukcí webovým crawlerům. Na rozdíl od jiných Google crawlerů jako Googlebot či Googlebot-Image Google-Extended nemá samostatný HTTP user agent string – Google procházení provádí pod stávajícími user agenty, zatímco uživatelský agent robots.txt slouží výhradně k řízení přístupu k trénování AI. Pokud do robots.txt přidáte direktivu pro Google-Extended, dáváte Googlu pokyn, zda může váš obsah použít pro trénování budoucích generací Gemini modelů a pro real-time grounding (zpřesnění odpovědí AI). Toto oddělení umožňuje vydavatelům zachovat viditelnost ve vyhledávání a zároveň samostatně řídit přístup k trénování AI.
| Crawler | User-Agent Token | HTTP Request Method | Dotčené produkty |
|---|---|---|---|
| Googlebot | Googlebot | Samostatný user agent string | Google Search, Images, News, Discover |
| Googlebot-Image | Googlebot-Image | Samostatný user agent string | Google Images, Discover, Video |
| Google-Extended | Google-Extended | Využívá stávající Google user agenty | Gemini Apps, Vertex AI, Grounding |
| Google-CloudVertexBot | Google-CloudVertexBot | Samostatný user agent string | Vertex AI Agents (na žádost vlastníka webu) |
Jedním z nejdůležitějších upřesnění ohledně Google-Extended je, že nemá absolutně žádný vliv na pozice vašeho webu ve vyhledávačích ani na zobrazení ve Vyhledávání Google. V dubnu 2025 Google výslovně aktualizoval svou dokumentaci: “Google-Extended neovlivňuje zařazení webu ve Vyhledávání Google ani není využíván jako signál pro řazení výsledků.” To znamená, že můžete Google-Extended blokovat bez obav ze ztráty organické návštěvnosti, snížené viditelnosti nebo jakýchkoli SEO benefitů. Důležité je toto rozlišení: blokace Google-Extended pouze zabrání využití vašeho obsahu při trénování a groundingu AI – nijak to neovlivní, jak vyhledávací algoritmy Google hodnotí nebo řadí vaše stránky. Toto oddělení dává vydavatelům možnost spravovat svůj obsah podle vlastního obchodního modelu a hodnot, aniž by museli volit mezi viditelností ve vyhledávání a účastí na trénování AI.
Nastavení kontroly Google-Extended je jednoduché a vyžaduje jen několik řádků v souboru robots.txt. Chcete-li zablokovat Google-Extended přístup k vašemu obsahu, přidejte do kořenového adresáře webu následující direktivu:
User-agent: Google-Extended
Disallow: /
Tím dáte AI crawleru Google pokyn, že nesmí přistupovat k žádné části vašeho webu. Pokud chcete, aby běžné vyhledávací crawlery jako Googlebot mohly váš web dále indexovat, ale chcete zablokovat trénování AI, bude váš robots.txt vypadat například takto:
User-agent: Google-Extended
Disallow: /
User-agent: Googlebot
Disallow:
User-agent: Bingbot
Disallow:
Můžete také využít selektivní blokování konkrétních adresářů nebo typů souborů. Pokud chcete chránit například pouze prémiový obsah před trénováním AI a ostatní obsah povolit, použijte:
User-agent: Google-Extended
Disallow: /premium/
Disallow: /subscription/
User-agent: Googlebot
Disallow:
Tím získáte detailní kontrolu nad tím, které části webu přispívají k trénování AI modelů, a zároveň zachováte plnou viditelnost ve vyhledávačích na celém doméně.
Pochopení rozdílu mezi přístupem k trénování AI a indexací pro vyhledávače je zásadní pro správné rozhodnutí ohledně Google-Extended. Pokud povolíte Google-Extended, váš obsah může být použit k trénování Gemini modelů a poskytování informací pro AI-generované odpovědi – váš obsah se může objevit v odpovědích Barda, v Gemini Apps i aplikacích Vertex AI. Pokud Google-Extended zablokujete, váš obsah zůstává plně indexován ve Vyhledávání Google a bude se zobrazovat ve výsledcích, ale nebude zařazen do datasetů pro trénování AI ani použit pro grounding. Jak vypadají různé scénáře:
Důležité je, že oba prohledávače fungují nezávisle, což vydavatelům dává dosud nevídanou kontrolu nad využitím jejich obsahu v různých službách a produktech Google.
Google zavedl Google-Extended v reakci na rostoucí obavy vlastníků webů, novinářů a tvůrců obsahu ohledně využívání jejich práce pro trénování AI bez výslovného souhlasu či odměny. Vydavatelé vznesli oprávněné otázky týkající se autorských práv, přisuzování obsahu, ředění značky i konkurenčních konfliktů – zejména v případech, kdy AI systémy vyškolené na jejich obsahu mohou konkurovat nebo nahrazovat jejich původní nabídky. Mnozí tvůrci měli pocit, že je jejich duševní vlastnictví skrytě využíváno bez transparentnosti a možnosti opt-out. Google-Extended tyto obavy přímo řeší tím, že poskytuje jasný a zdokumentovaný způsob, jak mohou vydavatelé rozhodnout o účasti svého obsahu na trénování AI. Jde o významné uznání ze strany Google, že tvůrci si zaslouží kontrolu nad svým duševním vlastnictvím a možnost ovlivnit, jak jejich práce formuje budoucnost AI.
Vaše rozhodnutí o povolení či blokování Google-Extended by mělo odpovídat obchodnímu modelu, obsahové strategii a dlouhodobé vizi. Tvůrci obsahu a vzdělavatelé, kteří chtějí maximalizovat viditelnost a budovat pozici lídra, by měli Google-Extended spíše povolit, protože zobrazení v odpovědích Gemini a AI může výrazně zvýšit povědomí o značce a autoritu. Zpravodajské weby a platformy založené na předplatném by měly zvážit blokaci Google-Extended na ochranu svého exkluzivního obsahu a zachování konkurenčních výhod – zejména pokud jejich byznys model závisí na unikátnosti původního zpravodajství. Firemní software společnosti a poradenské firmy mohou zvolit hybridní přístup: povolit Google-Extended pro obecně vzdělávací obsah, blokovat jej pro proprietární know-how a případové studie. Klíčovou otázkou není, zda je trénování AI dobré či špatné, ale: Přináší vašemu obsahu větší užitek široká AI viditelnost, nebo potřebuje ochranu jako konkurenční výhoda? Zvažte své publikum, zdroj příjmů a to, zda vám zobrazení v AI odpovědích přináší hodnotu, nebo spíše ředí vaši značku.

V současnosti neexistuje robustní veřejný nástroj, který by přesně monitoroval, jak je váš obsah využíván AI modely Google, což je zásadní nedostatek transparentnosti. Ačkoli Google-Extended umožňuje kontrolu nad tím, zda je obsah přístupný, vydavatelům chybí detailní přehled o tom, jak jejich obsah ovlivňuje výstupy AI nebo se objevuje v odpovědích Gemini. Tato omezení vedou k požadavkům na sofistikovanější nástroje monitoringu – například AmICited.com začíná vydavatelům nabízet možnost sledovat, jak jejich značka a obsah jsou zmiňovány a citovány napříč AI systémy, což přináší potřebnou transparentnost. Do budoucna lze očekávat vývoj průmyslových standardů pro AI atribuci, licencování obsahu a kompenzaci vydavatelů – podobně, jako je tomu u tradičního licencování médií. Prozatím se doporučuje hybridní přístup: blokujte Google-Extended pro nejcitlivější či proprietární obsah, povolte jej pro obsah určený k široké distribuci a využívejte nástroje třetích stran pro sledování výskytu vaší značky v AI obsahu. S tím, jak se AI stále více integruje do vyhledávání a objevování informací, bude možnost řídit a monitorovat účast vašeho obsahu v těchto systémech čím dál cennější.
Googlebot prochází weby kvůli indexaci obsahu pro výsledky Vyhledávání Google, zatímco Google-Extended je uživatelský agent, který řídí, zda bude obsah využit k trénování AI v Gemini a Vertex AI. Googlebot ovlivňuje viditelnost ve vyhledávání, Google-Extended nikoliv. Oba lze řídit samostatně přes robots.txt, což vydavatelům umožňuje samostatně spravovat indexaci i trénování AI.
Ne. Blokování Google-Extended nemá vůbec žádný dopad na vaše pozice ve vyhledávačích ani viditelnost ve Vyhledávání Google. Google v dubnu 2025 výslovně potvrdil, že Google-Extended není signálem pro řazení výsledků ani neovlivňuje zařazení do vyhledávání. Můžete jej bezpečně blokovat bez obav ze ztráty organické návštěvnosti.
Do souboru robots.txt přidejte tyto řádky: User-agent: Google-Extended následované Disallow: /. Tím zabráníte AI crawleru Google přistupovat k vašemu obsahu. Můžete také blokovat konkrétní adresáře nebo typy souborů. Pamatujte, že toto ovlivňuje pouze přístup ke trénování AI, ne indexaci pro vyhledávače.
Ano, určitě. Blokace Google-Extended pouze zabrání využití vašeho obsahu k trénování AI. Váš obsah bude i nadále indexován Googlebotem a zobrazí se standardně ve výsledcích vyhledávání Google. Oba prohledávače fungují nezávisle, takže ovlivnění jednoho nemá dopad na druhý.
Pokud povolíte Google-Extended, váš obsah může být využit k trénování Gemini modelů a jako zdroj pro odpovědi generované AI. To znamená, že váš obsah se může objevit v odpovědích Barda, Gemini Apps a aplikacích Vertex AI. Může to zvýšit viditelnost značky, ale také znamená, že váš obsah může být využit způsoby, které přímo neovlivníte.
Ano. Můžete použít selektivní blokování v robots.txt a chránit konkrétní adresáře nebo typy souborů. Například můžete zakázat Google-Extended přístup do /premium/ nebo /subscription/ adresářů, ale povolit jej pro zbytek webu. Získáte tak detailní kontrolu nad tím, který obsah se účastní trénování AI.
Některé AI společnosti představily své vlastní uživatelské agenty nebo crawlery, ale Google-Extended je specifický mechanismus Google pro kontrolu přístupu k trénování AI. Jiné AI platformy jako OpenAI, Anthropic nebo Perplexity mohou mít odlišné přístupy. V současnosti neexistuje jednotný standard, proto je třeba kontrolovat dokumentaci každé AI firmy zvlášť.
Ne, Google-Extended je volitelný. Nemusíte do robots.txt přidávat žádné direktivy. Ve výchozím stavu, pokud nic nespecifikujete, Google-Extended bude váš web pro trénování AI procházet. Direktivy je třeba přidat pouze v případě, že jej chcete blokovat či selektivně omezit přístup k určitému obsahu.
Sledujte zmínky o své značce napříč AI platformami jako Gemini, Perplexity a Google AI Overviews pomocí AmICited. Získejte přehled o tom, jak AI systémy odkazují na váš obsah a měřte svou viditelnost v AI.

Zjistěte, co je Google-Extended, jak funguje a zda byste jej měli blokovat ve svém robots.txt. Pochopte rozdíl mezi kontrolou trénování AI a AI Přehledy....

Zjistěte více o Applebot-Extended, crawleru společnosti Apple pro trénování AI. Pochopte, jak hodnotí obsah pro Apple Intelligence, jak jej zablokovat a jaká má...

Zjistěte, co jsou rozšíření Gemini, jak fungují a jak umožňují AI produktivitu propojením Gemini s Gmail, Drive, Mapami a dalšími službami. Komplexní průvodce e...
Souhlas s cookies
Používáme cookies ke zlepšení vašeho prohlížení a analýze naší návštěvnosti. See our privacy policy.