Google-Extended

Google-Extended

Google-Extended

Google-Extended is een user-agent-token waarmee beheerders van websites kunnen bepalen of hun content gebruikt wordt om Gemini en andere Google AI-producten te verbeteren, los van de standaard Googlebot-crawling. Het stelt uitgevers in staat om via robots.txt de toegang tot AI-training te beheren zonder invloed op de zichtbaarheid in zoekmachines. Geïntroduceerd in september 2023, speelt het in op zorgen van uitgevers over het gebruik van content bij de ontwikkeling van AI-modellen. Google-Extended heeft geen invloed op SEO-rankings of opname in zoekresultaten.

Wat is Google-Extended?

Google-Extended is een user-agent-token waarmee beheerders van websites kunnen bepalen of hun content gebruikt mag worden voor het trainen van Google’s generatieve AI-modellen, waaronder Gemini, Bard en Vertex AI. In tegenstelling tot Googlebot, die websites crawlt om content te indexeren voor zoekresultaten, werkt Google-Extended onafhankelijk en verzamelt het specifiek data voor AI-modeltraining en grounding-doeleinden. Dit user-agent-token is geen aparte HTTP-crawler—het functioneert juist als controlemechanisme binnen het robots.txt-bestand, waarmee uitgevers strategische keuzes kunnen maken over de rol van hun content in AI-ontwikkeling. De introductie van Google-Extended betekent een belangrijke verschuiving in de mogelijkheden voor webuitgevers om hun intellectueel eigendom te beheren in het tijdperk van kunstmatige intelligentie.

Comparison between Googlebot for search indexing and Google-Extended for AI training

Hoe werkt Google-Extended?

Google-Extended werkt via het vertrouwde robots.txt-protocol, een tekstbestand dat je plaatst in de root van je website en instructies bevat voor webcrawlers. Anders dan andere Google-crawlers zoals Googlebot of Googlebot-Image, heeft Google-Extended geen aparte HTTP-request user-agent-string—Google gebruikt bestaande user-agent-strings voor crawling, maar het robots.txt-token fungeert specifiek als controlemechanisme voor AI-training. Als je een richtlijn toevoegt voor Google-Extended in je robots.txt-bestand, geef je aan of Google content van je website mag gebruiken voor het trainen van toekomstige generaties Gemini-modellen en voor grounding (het bieden van realtime-informatie om de nauwkeurigheid van AI-antwoorden te verbeteren). Door deze scheiding kunnen uitgevers hun zoekzichtbaarheid behouden en tegelijkertijd onafhankelijk de toegang tot AI-training regelen.

CrawlerUser-Agent TokenHTTP Request MethodAffected Products
GooglebotGooglebotAparte user-agent-stringGoogle Zoeken, Afbeeldingen, Nieuws, Discover
Googlebot-ImageGooglebot-ImageAparte user-agent-stringGoogle Afbeeldingen, Discover, Video
Google-ExtendedGoogle-ExtendedGebruikt bestaande Google user-agentsGemini Apps, Vertex AI, Grounding
Google-CloudVertexBotGoogle-CloudVertexBotAparte user-agent-stringVertex AI Agents (op verzoek site-eigenaar)

De scheiding met SEO

Een van de belangrijkste verduidelijkingen rond Google-Extended is dat het absoluut geen invloed heeft op de zoekmachinerankings of zichtbaarheid van je website in Google Zoeken. In april 2025 heeft Google expliciet in haar documentatie vermeld: “Google-Extended heeft geen invloed op de opname van een site in Google Zoeken en wordt niet gebruikt als rankingsignaal in Google Zoeken.” Dit betekent dat je Google-Extended kunt blokkeren zonder je zorgen te maken over verlies van organisch verkeer, zoekzichtbaarheid of andere SEO-voordelen waar je site nu van profiteert. Het onderscheid is cruciaal: het blokkeren van Google-Extended betekent alleen dat je content niet wordt gebruikt voor AI-training en grounding—het heeft geen effect op hoe de zoekalgoritmen van Google je pagina’s beoordelen of rangschikken. Dankzij deze scheiding kunnen uitgevers hun contentbeleid afstemmen op hun eigen bedrijfsmodel en waarden, zonder te hoeven kiezen tussen zoekzichtbaarheid en deelname aan AI-training.

Implementatiegids

Het instellen van Google-Extended-controles is eenvoudig en vereist slechts een paar regels in je robots.txt-bestand. Om Google-Extended de toegang tot je content te ontzeggen, voeg je de volgende richtlijn toe in de root van je website:

User-agent: Google-Extended
Disallow: /

Hiermee laat je de AI-training-crawler van Google weten dat hij geen enkel deel van je website mag benaderen. Wil je wel dat standaard zoekmachinecrawlers zoals Googlebot je site blijven indexeren, maar AI-training blokkeren, dan ziet je volledige robots.txt-bestand er als volgt uit:

User-agent: Google-Extended
Disallow: /

User-agent: Googlebot
Disallow:

User-agent: Bingbot
Disallow:

Je kunt ook selectief blokkeren door specifieke mappen of bestandstypen op te geven. Wil je bijvoorbeeld alleen je premium-content beschermen tegen AI-training maar algemene content wel delen, dan kun je het volgende gebruiken:

User-agent: Google-Extended
Disallow: /premium/
Disallow: /subscription/

User-agent: Googlebot
Disallow:

Met deze aanpak houd je volledige controle over welke delen van je site bijdragen aan AI-training, terwijl je de zichtbaarheid in zoekmachines over je hele domein behoudt.

AI-training vs. zoekindexering

Het is essentieel om het onderscheid te begrijpen tussen AI-trainingstoegang en zoekindexering als je keuzes maakt voor Google-Extended. Sta je Google-Extended toe, dan kan je content gebruikt worden om Gemini-modellen te trainen en als basisinformatie dienen in AI-gegenereerde antwoorden—je content kan dus verschijnen in Bard-antwoorden, Gemini Apps en Vertex AI-toepassingen. Blokkeer je Google-Extended, dan blijft je content volledig geïndexeerd in Google Zoeken en zichtbaar in de traditionele zoekresultaten, maar wordt deze niet opgenomen in AI-trainingsdatasets of gebruikt als bron in AI-antwoorden. Zo pakken verschillende scenario’s uit:

  • Googlebot en Google-Extended beide toestaan: Content verschijnt in zoekresultaten EN wordt gebruikt voor AI-training en grounding
  • Googlebot toestaan, Google-Extended blokkeren: Content verschijnt in zoekresultaten maar wordt NIET gebruikt voor AI-training
  • Beide blokkeren: Content verschijnt niet in zoekresultaten EN wordt niet gebruikt voor AI-training (niet aanbevolen voor de meeste uitgevers)
  • Googlebot blokkeren, Google-Extended toestaan: Content wordt gebruikt voor AI-training maar verschijnt niet in zoekresultaten (zeldzaam geval)

Het belangrijkste inzicht is dat deze twee crawlers onafhankelijk van elkaar werken, waardoor uitgevers ongekende controle hebben over het gebruik van hun content binnen verschillende Google-producten en -diensten.

Zorgen van uitgevers en oplossingen

Google heeft Google-Extended geïntroduceerd naar aanleiding van toenemende zorgen van website-eigenaren, journalisten en contentmakers over het gebruik van hun werk voor AI-training zonder expliciete toestemming of vergoeding. Uitgevers stelden terechte vragen over auteursrecht, toeschrijving van content, merkuitholling en concurrentieconflicten—vooral als AI-systemen die getraind zijn op hun content uiteindelijk met hun originele aanbod gaan concurreren of het vervangen. Veel makers hadden het gevoel dat hun intellectueel eigendom ongemerkt werd gebruikt, zonder transparantie over hun bijdrage aan AI-ontwikkeling of een manier om zich af te melden. Google-Extended biedt hiervoor een directe oplossing door een duidelijke, gedocumenteerde methode te geven waarmee uitgevers kunnen bepalen of hun content meedoet aan AI-training. Dit is een belangrijke erkenning van Google dat contentmakers zeggenschap verdienen over hun intellectueel eigendom en een stem moeten hebben in hoe hun werk de toekomst van AI-technologie vormgeeft.

Strategische implicaties

Jouw keuze om Google-Extended toe te staan of te blokkeren, moet aansluiten bij je bedrijfsmodel, contentstrategie en langetermijnvisie. Contentmakers en opleiders die maximale zichtbaarheid en thought leadership nastreven, kunnen vaak het beste Google-Extended toestaan, want verschijnen in Gemini-antwoorden en AI-gegenereerde content kan het merkbereik en de autoriteit flink vergroten. Nieuwspublishers en abonnementsplatforms doen er goed aan Google-Extended te blokkeren om hun eigen content te beschermen en concurrentievoordeel te behouden—zeker als hun verdienmodel draait om exclusieve toegang tot originele inhoud. Enterprise softwarebedrijven en consultancybureaus kunnen een hybride aanpak kiezen: Google-Extended toestaan voor algemene educatieve content, maar blokkeren voor eigen methodes en cases. De strategische vraag is niet of AI-training goed of slecht is, maar: Heeft jouw content meer baat bij brede AI-zichtbaarheid, of moet het beschermd blijven als concurrentieel bezit? Denk aan je doelgroep, verdienmodel, en of verschijnen in AI-antwoorden waarde toevoegt of je merk verwatert.

Decision guide for allowing or blocking Google-Extended based on business model

Monitoring en toekomstige aandachtspunten

Op dit moment is er geen robuust openbaar hulpmiddel om precies te monitoren hoe je content door Google’s AI-modellen wordt gebruikt, wat een groot gebrek aan transparantie betekent. Waar Google-Extended wel controle biedt over toegang, ontbreekt het uitgevers aan gedetailleerd inzicht in hoe hun content AI-uitvoer beïnvloedt of verschijnt in Gemini-antwoorden. Deze beperking heeft geleid tot oproepen voor meer geavanceerde monitoringsoplossingen—tools als AmICited.com komen op om uitgevers te helpen bij het volgen hoe hun merk en content worden vermeld en geciteerd in AI-systemen, en bieden zo de noodzakelijke transparantie die het huidige ecosysteem ontbeert. In de toekomst zullen er waarschijnlijk standaarden ontstaan rond AI-toeschrijving, contentlicenties en compensatie voor uitgevers—vergelijkbaar met hoe traditionele mediavergunningen werken. Voor nu is een hybride aanpak aan te raden: blokkeer Google-Extended voor je meest gevoelige of eigen content, sta het toe voor breed verspreide content, en gebruik monitoringtools van derden om na te gaan hoe je merk verschijnt in AI-gegenereerde content. Naarmate AI dieper integreert in zoek- en informatieontdekking, wordt het vermogen om de deelname van jouw content aan deze systemen te controleren en te volgen steeds waardevoller.

Veelgestelde vragen

Wat is het verschil tussen Google-Extended en Googlebot?

Googlebot crawlt websites om content te indexeren voor Google Zoeken, terwijl Google-Extended een user-agent-token is waarmee je bepaalt of content gebruikt wordt voor AI-training in Gemini en Vertex AI. Googlebot beïnvloedt de zoekzichtbaarheid, Google-Extended niet. Beide kunnen onafhankelijk via robots.txt worden aangestuurd, zodat uitgevers zoekindexering en AI-training los van elkaar kunnen beheren.

Beïnvloedt het blokkeren van Google-Extended mijn SEO-rankings?

Nee. Het blokkeren van Google-Extended heeft absoluut geen invloed op je zoekmachineresultaten of zichtbaarheid in Google Zoeken. Google heeft in april 2025 expliciet bevestigd dat Google-Extended niet gebruikt wordt als rankingsignaal en geen invloed heeft op opname in zoekresultaten. Je kunt het dus gerust blokkeren zonder bang te zijn organisch verkeer te verliezen.

Hoe blokkeer ik Google-Extended in mijn robots.txt-bestand?

Voeg deze regels toe aan je robots.txt-bestand: User-agent: Google-Extended gevolgd door Disallow: /. Hiermee voorkom je dat Google's AI-training crawler toegang krijgt tot je content. Je kunt ook specifieke mappen of bestandstypen blokkeren. Let op: dit heeft alleen invloed op AI-trainingstoegang, niet op zoekmachine-indexering.

Blijft mijn content zichtbaar in Google Zoeken als ik Google-Extended blokkeer?

Ja, absoluut. Het blokkeren van Google-Extended zorgt er alleen voor dat je content niet wordt gebruikt voor AI-training. Je content blijft gewoon door Googlebot geïndexeerd en verschijnt normaal in de zoekresultaten. De twee crawlers werken onafhankelijk, dus het beheren van de één heeft geen invloed op de ander.

Wat gebeurt er als ik Google-Extended toesta?

Als je Google-Extended toestaat, kan je content worden gebruikt om Gemini-modellen te trainen en als basisinformatie te dienen in AI-gegenereerde antwoorden. Dit betekent dat je content kan verschijnen in Bard-antwoorden, Gemini Apps en Vertex AI-toepassingen. Dit kan de merkzichtbaarheid vergroten, maar je content kan ook op manieren worden gebruikt waar je minder controle over hebt.

Kan ik Google-Extended alleen voor specifieke pagina's blokkeren?

Ja. Je kunt selectief blokkeren via robots.txt om bepaalde mappen of bestandstypen te beschermen. Zo kun je Google-Extended bijvoorbeeld weren uit /premium/ of /subscription/ mappen, terwijl andere delen van je site wel toegankelijk zijn. Dit biedt je gedetailleerde controle over welke content meedoet aan AI-training.

Hebben andere AI-bedrijven vergelijkbare user-agent-tokens?

Sommige AI-bedrijven hebben hun eigen user-agent-tokens of crawlers geïntroduceerd, maar Google-Extended is Google's specifieke mechanisme om AI-trainingstoegang te regelen. Andere AI-platforms zoals OpenAI, Anthropic en Perplexity kunnen andere methodes hanteren. Er bestaat momenteel geen universele standaard, dus het is aan te raden per AI-bedrijf de documentatie te raadplegen.

Is Google-Extended verplicht te gebruiken?

Nee, Google-Extended is optioneel. Je hoeft geen richtlijnen toe te voegen aan je robots.txt-bestand. Standaard geldt: als je niets specifieks opgeeft, crawlt Google-Extended je site voor AI-trainingsdoeleinden. Alleen als je het wilt blokkeren of selectief toegang wilt beheren, hoef je instructies toe te voegen.

Monitor hoe jouw merk verschijnt in AI-systemen

Volg je merkvermeldingen op AI-platforms zoals Gemini, Perplexity en Google AI Overviews met AmICited. Krijg inzicht in hoe AI-systemen jouw content refereren en meet je AI-zichtbaarheid.

Meer informatie

Google-Extended: Wat het Doet en Moet je het Blokkeren?
Google-Extended: Wat het Doet en Moet je het Blokkeren?

Google-Extended: Wat het Doet en Moet je het Blokkeren?

Ontdek wat Google-Extended is, hoe het werkt en of je het moet blokkeren in je robots.txt. Begrijp het verschil tussen AI-trainingscontrole en AI Overviews.

8 min lezen
Applebot-Extended
Applebot-Extended: Apple's AI-trainingscrawler

Applebot-Extended

Leer meer over Applebot-Extended, Apple's webcrawler voor AI-training. Begrijp hoe deze content evalueert voor Apple Intelligence, hoe je het blokkeert en je pr...

6 min lezen
Gemini-extensies
Gemini-extensies: AI-plug-ins voor integratie met Google-diensten

Gemini-extensies

Ontdek wat Gemini-extensies zijn, hoe ze werken en hoe ze AI-gestuurde productiviteit mogelijk maken door Gemini te verbinden met Gmail, Drive, Maps en andere d...

10 min lezen