Google-Extended

Google-Extended

Google-Extended

Google-Extended je uživatelský agent (user-agent) umožňující kontrolovat, zda je obsah webu využíván ke zlepšování Gemini a dalších AI produktů Google, odděleně od běžného procházení Googlebotem. Vydavatelům umožňuje řídit přístup k trénování AI skrze robots.txt bez dopadu na viditelnost ve vyhledávání. Zaveden v září 2023, reaguje na obavy vydavatelů ohledně využití obsahu při vývoji AI modelů. Google-Extended nemá vliv na SEO pozice ani zařazení do vyhledávání.

Co je Google-Extended?

Google-Extended je uživatelský agent (user-agent), který umožňuje vydavatelům webových stránek řídit, zda bude jejich obsah použit pro trénování generativních AI modelů Google, včetně Gemini, Barda a Vertex AI. Na rozdíl od Googlebota, který prochází weby kvůli indexaci obsahu pro vyhledávání, Google-Extended funguje nezávisle a sbírá data výhradně pro účely trénování AI modelů a tzv. groundingu (zpřesnění odpovědí). Tento uživatelský agent není samostatný HTTP crawler – slouží jako kontrolní mechanismus v souboru robots.txt, který mohou vydavatelé využít k strategickému rozhodování o roli svého obsahu při vývoji AI. Zavedení Google-Extended představuje významný posun v tom, jak mohou weboví vydavatelé spravovat svá autorská práva v éře umělé inteligence.

Comparison between Googlebot for search indexing and Google-Extended for AI training

Jak Google-Extended funguje

Google-Extended funguje prostřednictvím známého protokolu robots.txt, což je prostý textový soubor umístěný v kořenovém adresáři webu a sloužící k udílení instrukcí webovým crawlerům. Na rozdíl od jiných Google crawlerů jako Googlebot či Googlebot-Image Google-Extended nemá samostatný HTTP user agent string – Google procházení provádí pod stávajícími user agenty, zatímco uživatelský agent robots.txt slouží výhradně k řízení přístupu k trénování AI. Pokud do robots.txt přidáte direktivu pro Google-Extended, dáváte Googlu pokyn, zda může váš obsah použít pro trénování budoucích generací Gemini modelů a pro real-time grounding (zpřesnění odpovědí AI). Toto oddělení umožňuje vydavatelům zachovat viditelnost ve vyhledávání a zároveň samostatně řídit přístup k trénování AI.

CrawlerUser-Agent TokenHTTP Request MethodDotčené produkty
GooglebotGooglebotSamostatný user agent stringGoogle Search, Images, News, Discover
Googlebot-ImageGooglebot-ImageSamostatný user agent stringGoogle Images, Discover, Video
Google-ExtendedGoogle-ExtendedVyužívá stávající Google user agentyGemini Apps, Vertex AI, Grounding
Google-CloudVertexBotGoogle-CloudVertexBotSamostatný user agent stringVertex AI Agents (na žádost vlastníka webu)

Oddělení od SEO

Jedním z nejdůležitějších upřesnění ohledně Google-Extended je, že nemá absolutně žádný vliv na pozice vašeho webu ve vyhledávačích ani na zobrazení ve Vyhledávání Google. V dubnu 2025 Google výslovně aktualizoval svou dokumentaci: “Google-Extended neovlivňuje zařazení webu ve Vyhledávání Google ani není využíván jako signál pro řazení výsledků.” To znamená, že můžete Google-Extended blokovat bez obav ze ztráty organické návštěvnosti, snížené viditelnosti nebo jakýchkoli SEO benefitů. Důležité je toto rozlišení: blokace Google-Extended pouze zabrání využití vašeho obsahu při trénování a groundingu AI – nijak to neovlivní, jak vyhledávací algoritmy Google hodnotí nebo řadí vaše stránky. Toto oddělení dává vydavatelům možnost spravovat svůj obsah podle vlastního obchodního modelu a hodnot, aniž by museli volit mezi viditelností ve vyhledávání a účastí na trénování AI.

Návod na implementaci

Nastavení kontroly Google-Extended je jednoduché a vyžaduje jen několik řádků v souboru robots.txt. Chcete-li zablokovat Google-Extended přístup k vašemu obsahu, přidejte do kořenového adresáře webu následující direktivu:

User-agent: Google-Extended
Disallow: /

Tím dáte AI crawleru Google pokyn, že nesmí přistupovat k žádné části vašeho webu. Pokud chcete, aby běžné vyhledávací crawlery jako Googlebot mohly váš web dále indexovat, ale chcete zablokovat trénování AI, bude váš robots.txt vypadat například takto:

User-agent: Google-Extended
Disallow: /

User-agent: Googlebot
Disallow:

User-agent: Bingbot
Disallow:

Můžete také využít selektivní blokování konkrétních adresářů nebo typů souborů. Pokud chcete chránit například pouze prémiový obsah před trénováním AI a ostatní obsah povolit, použijte:

User-agent: Google-Extended
Disallow: /premium/
Disallow: /subscription/

User-agent: Googlebot
Disallow:

Tím získáte detailní kontrolu nad tím, které části webu přispívají k trénování AI modelů, a zároveň zachováte plnou viditelnost ve vyhledávačích na celém doméně.

Trénování AI vs. indexace vyhledávačem

Pochopení rozdílu mezi přístupem k trénování AI a indexací pro vyhledávače je zásadní pro správné rozhodnutí ohledně Google-Extended. Pokud povolíte Google-Extended, váš obsah může být použit k trénování Gemini modelů a poskytování informací pro AI-generované odpovědi – váš obsah se může objevit v odpovědích Barda, v Gemini Apps i aplikacích Vertex AI. Pokud Google-Extended zablokujete, váš obsah zůstává plně indexován ve Vyhledávání Google a bude se zobrazovat ve výsledcích, ale nebude zařazen do datasetů pro trénování AI ani použit pro grounding. Jak vypadají různé scénáře:

  • Povolíte Googlebota i Google-Extended: Obsah se zobrazuje ve vyhledávání I je využit pro trénování a grounding AI
  • Povolíte Googlebot, zablokujete Google-Extended: Obsah se zobrazuje ve vyhledávání, ALE není využit pro trénování AI
  • Zablokujete obojí: Obsah se nezobrazuje ve vyhledávání ANI není využit pro trénování AI (nedoporučeno pro většinu vydavatelů)
  • Zablokujete Googlebot, povolíte Google-Extended: Obsah je využit pro trénování AI, ale nezobrazuje se ve vyhledávání (vzácný případ)

Důležité je, že oba prohledávače fungují nezávisle, což vydavatelům dává dosud nevídanou kontrolu nad využitím jejich obsahu v různých službách a produktech Google.

Obavy vydavatelů a řešení

Google zavedl Google-Extended v reakci na rostoucí obavy vlastníků webů, novinářů a tvůrců obsahu ohledně využívání jejich práce pro trénování AI bez výslovného souhlasu či odměny. Vydavatelé vznesli oprávněné otázky týkající se autorských práv, přisuzování obsahu, ředění značky i konkurenčních konfliktů – zejména v případech, kdy AI systémy vyškolené na jejich obsahu mohou konkurovat nebo nahrazovat jejich původní nabídky. Mnozí tvůrci měli pocit, že je jejich duševní vlastnictví skrytě využíváno bez transparentnosti a možnosti opt-out. Google-Extended tyto obavy přímo řeší tím, že poskytuje jasný a zdokumentovaný způsob, jak mohou vydavatelé rozhodnout o účasti svého obsahu na trénování AI. Jde o významné uznání ze strany Google, že tvůrci si zaslouží kontrolu nad svým duševním vlastnictvím a možnost ovlivnit, jak jejich práce formuje budoucnost AI.

Strategické dopady

Vaše rozhodnutí o povolení či blokování Google-Extended by mělo odpovídat obchodnímu modelu, obsahové strategii a dlouhodobé vizi. Tvůrci obsahu a vzdělavatelé, kteří chtějí maximalizovat viditelnost a budovat pozici lídra, by měli Google-Extended spíše povolit, protože zobrazení v odpovědích Gemini a AI může výrazně zvýšit povědomí o značce a autoritu. Zpravodajské weby a platformy založené na předplatném by měly zvážit blokaci Google-Extended na ochranu svého exkluzivního obsahu a zachování konkurenčních výhod – zejména pokud jejich byznys model závisí na unikátnosti původního zpravodajství. Firemní software společnosti a poradenské firmy mohou zvolit hybridní přístup: povolit Google-Extended pro obecně vzdělávací obsah, blokovat jej pro proprietární know-how a případové studie. Klíčovou otázkou není, zda je trénování AI dobré či špatné, ale: Přináší vašemu obsahu větší užitek široká AI viditelnost, nebo potřebuje ochranu jako konkurenční výhoda? Zvažte své publikum, zdroj příjmů a to, zda vám zobrazení v AI odpovědích přináší hodnotu, nebo spíše ředí vaši značku.

Decision guide for allowing or blocking Google-Extended based on business model

Monitoring a budoucí vývoj

V současnosti neexistuje robustní veřejný nástroj, který by přesně monitoroval, jak je váš obsah využíván AI modely Google, což je zásadní nedostatek transparentnosti. Ačkoli Google-Extended umožňuje kontrolu nad tím, zda je obsah přístupný, vydavatelům chybí detailní přehled o tom, jak jejich obsah ovlivňuje výstupy AI nebo se objevuje v odpovědích Gemini. Tato omezení vedou k požadavkům na sofistikovanější nástroje monitoringu – například AmICited.com začíná vydavatelům nabízet možnost sledovat, jak jejich značka a obsah jsou zmiňovány a citovány napříč AI systémy, což přináší potřebnou transparentnost. Do budoucna lze očekávat vývoj průmyslových standardů pro AI atribuci, licencování obsahu a kompenzaci vydavatelů – podobně, jako je tomu u tradičního licencování médií. Prozatím se doporučuje hybridní přístup: blokujte Google-Extended pro nejcitlivější či proprietární obsah, povolte jej pro obsah určený k široké distribuci a využívejte nástroje třetích stran pro sledování výskytu vaší značky v AI obsahu. S tím, jak se AI stále více integruje do vyhledávání a objevování informací, bude možnost řídit a monitorovat účast vašeho obsahu v těchto systémech čím dál cennější.

Často kladené otázky

Jaký je rozdíl mezi Google-Extended a Googlebot?

Googlebot prochází weby kvůli indexaci obsahu pro výsledky Vyhledávání Google, zatímco Google-Extended je uživatelský agent, který řídí, zda bude obsah využit k trénování AI v Gemini a Vertex AI. Googlebot ovlivňuje viditelnost ve vyhledávání, Google-Extended nikoliv. Oba lze řídit samostatně přes robots.txt, což vydavatelům umožňuje samostatně spravovat indexaci i trénování AI.

Ovlivní blokace Google-Extended mé SEO pozice?

Ne. Blokování Google-Extended nemá vůbec žádný dopad na vaše pozice ve vyhledávačích ani viditelnost ve Vyhledávání Google. Google v dubnu 2025 výslovně potvrdil, že Google-Extended není signálem pro řazení výsledků ani neovlivňuje zařazení do vyhledávání. Můžete jej bezpečně blokovat bez obav ze ztráty organické návštěvnosti.

Jak zablokuji Google-Extended v souboru robots.txt?

Do souboru robots.txt přidejte tyto řádky: User-agent: Google-Extended následované Disallow: /. Tím zabráníte AI crawleru Google přistupovat k vašemu obsahu. Můžete také blokovat konkrétní adresáře nebo typy souborů. Pamatujte, že toto ovlivňuje pouze přístup ke trénování AI, ne indexaci pro vyhledávače.

Zobrazí se můj obsah ve Vyhledávání Google, i když zablokuji Google-Extended?

Ano, určitě. Blokace Google-Extended pouze zabrání využití vašeho obsahu k trénování AI. Váš obsah bude i nadále indexován Googlebotem a zobrazí se standardně ve výsledcích vyhledávání Google. Oba prohledávače fungují nezávisle, takže ovlivnění jednoho nemá dopad na druhý.

Co se stane, když Google-Extended povolím?

Pokud povolíte Google-Extended, váš obsah může být využit k trénování Gemini modelů a jako zdroj pro odpovědi generované AI. To znamená, že váš obsah se může objevit v odpovědích Barda, Gemini Apps a aplikacích Vertex AI. Může to zvýšit viditelnost značky, ale také znamená, že váš obsah může být využit způsoby, které přímo neovlivníte.

Mohu blokovat Google-Extended jen pro vybrané stránky?

Ano. Můžete použít selektivní blokování v robots.txt a chránit konkrétní adresáře nebo typy souborů. Například můžete zakázat Google-Extended přístup do /premium/ nebo /subscription/ adresářů, ale povolit jej pro zbytek webu. Získáte tak detailní kontrolu nad tím, který obsah se účastní trénování AI.

Mají i jiné AI společnosti podobné uživatelské agenty?

Některé AI společnosti představily své vlastní uživatelské agenty nebo crawlery, ale Google-Extended je specifický mechanismus Google pro kontrolu přístupu k trénování AI. Jiné AI platformy jako OpenAI, Anthropic nebo Perplexity mohou mít odlišné přístupy. V současnosti neexistuje jednotný standard, proto je třeba kontrolovat dokumentaci každé AI firmy zvlášť.

Je používání Google-Extended povinné?

Ne, Google-Extended je volitelný. Nemusíte do robots.txt přidávat žádné direktivy. Ve výchozím stavu, pokud nic nespecifikujete, Google-Extended bude váš web pro trénování AI procházet. Direktivy je třeba přidat pouze v případě, že jej chcete blokovat či selektivně omezit přístup k určitému obsahu.

Sledujte, jak se vaše značka zobrazuje v AI systémech

Sledujte zmínky o své značce napříč AI platformami jako Gemini, Perplexity a Google AI Overviews pomocí AmICited. Získejte přehled o tom, jak AI systémy odkazují na váš obsah a měřte svou viditelnost v AI.

Zjistit více

Google-Extended: Co dělá a měli byste jej blokovat?
Google-Extended: Co dělá a měli byste jej blokovat?

Google-Extended: Co dělá a měli byste jej blokovat?

Zjistěte, co je Google-Extended, jak funguje a zda byste jej měli blokovat ve svém robots.txt. Pochopte rozdíl mezi kontrolou trénování AI a AI Přehledy....

7 min čtení
Applebot-Extended
Applebot-Extended: Crawler Apple pro trénování AI

Applebot-Extended

Zjistěte více o Applebot-Extended, crawleru společnosti Apple pro trénování AI. Pochopte, jak hodnotí obsah pro Apple Intelligence, jak jej zablokovat a jaká má...

6 min čtení
Rozšíření Gemini
Rozšíření Gemini: AI pluginy pro integraci služeb Google

Rozšíření Gemini

Zjistěte, co jsou rozšíření Gemini, jak fungují a jak umožňují AI produktivitu propojením Gemini s Gmail, Drive, Mapami a dalšími službami. Komplexní průvodce e...

9 min čtení