Regex vzor pre AI návštevnosť: Zachytenie referralov z ChatGPT a Perplexity

Regex vzor pre AI návštevnosť: Zachytenie referralov z ChatGPT a Perplexity

Publikované dňa Jan 3, 2026. Naposledy upravené dňa Jan 3, 2026 o 3:24 am

Prečo je AI návštevnosť dôležitá

Sledovanie AI návštevnosti sa stalo nevyhnutnosťou pre moderné webstránky, pretože platformy umelej inteligencie dnes generujú významnú časť webového referral trafficu, ktorý tradičná analytika často nezachytí. Podľa najnovších údajov 63% webstránok prijíma návštevnosť z AI platforiem, pričom samotné ChatGPT tvorí približne 50% všetkých AI referralov. Výzva spočíva v štandardnom správaní GA4: mnohé AI platformy buď referrer informácie odstraňujú, alebo sa javia ako priama návšteva, čo ich robí v bežných reportoch neviditeľnými. Táto skrytá návštevnosť vytvára kritické slepé miesto vo vašej analytike a bráni vám pochopiť, ktorý obsah rezonuje s AI systémami a ich užívateľmi. Bez správneho filtrovania regexom strácate prehľad o jednom z najrýchlejšie rastúcich zdrojov návštevnosti a prichádzate o príležitosti optimalizovať pre AI objaviteľnosť.

GA4 dashboard showing hidden AI traffic in referral sources

Pochopenie zdrojov AI návštevnosti

Rôzne AI platformy vykazujú odlišné referrer správanie, takže komplexné sledovanie vyžaduje prístup špecifický pre každú platformu. Takto sa hlavné AI platformy správajú v GA4:

PlatformaDoménaReferrer správanieZobrazuje sa akoObmedzenia
ChatGPTopenai.comPosiela referrer hlavičkuReferral návštevnosťMôže sa zobrazovať ako priama v niektorých konfiguráciách
Perplexityperplexity.aiPosiela referrer hlavičkuReferral návštevnosťNekonzistentné referrer vzory naprieč verziami
Claudeclaude.aiOdstraňuje referrer informáciePriama návštevaVyžaduje vlastné sledovanie udalostí pre atribúciu
Google Geminigemini.google.comPosiela referrer hlavičkuReferral návštevnosťNedávno pridaná podpora referrera
Copilotcopilot.microsoft.comOdstraňuje referrer informáciePriama návštevaObmedzené údaje o referreri
Bardbard.google.comPosiela referrer hlavičkuReferral návštevnosťSpojené do Gemini; sledovanie starších údajov stále relevantné
DeepSeekdeepseek.comPosiela referrer hlavičkuReferral návštevnosťNová platforma s rastúcim objemom
Mistralchat.mistral.aiPosiela referrer hlavičkuReferral návštevnosťNovšia platforma s obmedzenými historickými dátami

ChatGPT a Perplexity dôsledne posielajú referrer hlavičky, takže sa dajú ľahko sledovať cez štandardné filtre GA4. Claude a Copilot sú väčšou výzvou, pretože referrer informácie úplne odstraňujú a vyžadujú alternatívne metódy sledovania. Pochopenie týchto rozdielov v správaní je zásadné pre budovanie efektívnych regex vzorov zachytávajúcich všetky zdroje AI návštevnosti presne.

Základy regex vzorov

Regulárne výrazy (regex) sú silné nástroje na rozpoznávanie vzorov, ktoré vám v GA4 umožňujú identifikovať a filtrovať návštevnosť podľa špecifických textových vzorov. Prehľad Získavanie návštevnosti v GA4 využíva regex na porovnávanie referrer domén, vďaka čomu môžete vytvoriť filtre zachytávajúce variácie a viaceré platformy naraz. Namiesto vytvárania samostatných filtrov pre každú AI platformu, regex umožňuje napísať jeden vzor, ktorý pokryje viac domén a štruktúr URL.

Základná syntax regexu v GA4 vyzerá takto:

^(openai\.com|perplexity\.ai|claude\.ai)$

Kľúčové komponenty regexu pre sledovanie AI návštevnosti:

  • Zvislá čiara (|): Funguje ako operátor “ALEBO”, umožňuje zachytiť viacero domén naraz
  • Strecha (^) a dolár ($): Ukotvujú vzor na začiatok a koniec reťazca
  • Escapované bodky (\.): Zodpovedajú skutočnej bodke v názve domény (nutné, lebo bodka má v regexe špeciálny význam)
  • Zátvorky (): Združujú viacero možností pre prehľadnejšie vzory
  • Hviezdička (*) a plus (+): Zachytávajú nula alebo viac, resp. jeden alebo viac znakov

Escapovaná bodka je kľúčová, lebo v regexe neescapovaná bodka zodpovedá akémukoľvek znaku, nie len bodke. Preto openai.com by nesprávne zachytilo aj openaiXcom, zatiaľ čo openai\.com zachytáva len skutočnú doménu.

Vytvorenie vášho prvého regex filtra

Vytvorenie prvého AI filtra v GA4 je jednoduché a pozostáva z niekoľkých krokov:

  1. Prejdite do AdminFiltre dát vo vašej GA4 službe
  2. Kliknite na “Vytvoriť filter” a pomenujte ho “AI návštevnosť - ChatGPT & Perplexity”
  3. Vyberte typ filtra: Zvoľte “Typ návštevnosti” a nastavte na “Referral”
  4. V sekcii Podmienka vyberte z rozbaľovačky “Referrer”
  5. Vyberte “Zodpovedá regexu” ako podmienku porovnávania
  6. Zadajte vzor: ^(openai\.com|perplexity\.ai)$
  7. Kliknite na “Vytvoriť filter” a overte, že je nastavený na “Aktívny”

Na overenie funkčnosti filtra skontrolujte prehľad Získavanie návštevnosti do 24-48 hodín a hľadajte referral traffic z týchto domén. Začnite iba s ChatGPT a Perplexity, aby ste sa uistili, že vzor funguje správne, pred rozšírením na ďalšie platformy. Svoj regex vzor môžete otestovať cez zabudovanú náhľadovú funkciu GA4 pred nasadením do produkcie.

Pokročilé regex vzory pre komplexné AI sledovanie

Pre úplný prehľad AI návštevnosti použite tento komplexný regex vzor pokrývajúci všetky hlavné AI platformy:

^(openai\.com|perplexity\.ai|claude\.ai|gemini\.google\.com|copilot\.microsoft\.com|bard\.google\.com|deepseek\.com|chat\.mistral\.ai|huggingface\.co|replicate\.com)$

Tento hlavný vzor zachytáva:

  • Návštevnosť z ChatGPT cez openai\.com – najväčší AI referral zdroj
  • Návštevnosť z Perplexity cez perplexity\.ai – rýchlo rastúci AI vyhľadávač
  • Návštevnosť z Claude cez claude\.ai – AI asistent od Anthropicu (často však ako priama návšteva)
  • Google Gemini cez gemini\.google\.com – unifikovaná AI platforma od Googlu
  • Microsoft Copilot cez copilot\.microsoft\.com – integrovaný do Microsoft produktov
  • Google Bard cez bard\.google\.com – staršia stopa pre historické dáta
  • DeepSeek cez deepseek\.com – vznikajúca čínska AI platforma
  • Mistral cez chat\.mistral\.ai – európska open-source AI platforma
  • HuggingFace cez huggingface\.co – centrum AI modelov a komunita
  • Replicate cez replicate\.com – API platforma AI modelov

Pre podrobnejšie sledovanie vytvorte samostatné filtre pre rôzne AI kategórie:

# AI platformy zamerané na vyhľadávanie
^(perplexity\.ai|deepseek\.com)$

# Všeobecní AI asistenti
^(openai\.com|claude\.ai|gemini\.google\.com)$

# Podnikové AI platformy
^(copilot\.microsoft\.com|bard\.google\.com)$

Táto segmentácia vám umožní analyzovať vzorce návštevnosti podľa kategórií AI platforiem a zistiť, ktoré typy AI systémov prinášajú vášmu obsahu najhodnotnejšiu návštevnosť.

Regex pattern syntax showing AI domain matching and pattern logic

Tvorba vlastných skupín kanálov pomocou regexu

Vlastné skupiny kanálov umožňujú organizovať AI návštevnosť popri existujúcich kanáloch:

  1. Prejdite do AdminSkupiny kanálov vo vašej GA4 službe
  2. Kliknite na “Vytvoriť skupinu kanálov” a pomenujte ju “AI kanály návštevnosti”
  3. Kliknite na “Pridať podmienku” na vytvorenie prvého pravidla
  4. Nastavte podmienku: Zdroj/Médium zodpovedá regexu ^(openai\.com|perplexity\.ai|claude\.ai|gemini\.google\.com|copilot\.microsoft\.com|bard\.google\.com|deepseek\.com|chat\.mistral\.ai)/(organic|referral)$
  5. Pomenujte tento kanál “AI asistenti”
  6. Pridajte ďalšiu podmienku pre platformy zobrazujúce sa ako priame: Zdroj zodpovedá regexu ^(direct)$ A Názov stránky obsahuje regex (ChatGPT|Claude|Gemini|Copilot)
  7. Pomenujte tento kanál “AI priama návštevnosť”
  8. Kliknite na “Vytvoriť” a uistite sa, že táto skupina kanálov je nastavená ako hlavný reportovací pohľad

Poradie kanálov je kritické: GA4 priraďuje návštevnosť k prvému zodpovedajúcemu kanálu, preto dajte najšpecifickejšie AI pravidlá pred širšie kategórie. Tým zabránite, aby bola AI návštevnosť nesprávne kategorizovaná ako Priama alebo Organická. Skúšajte skupinu kanálov cez prehľad Získavanie návštevnosti a overte, že AI návštevnosť sa zobrazuje vo vašej novej skupine “AI kanály návštevnosti”.

Prieskumné reporty a filtrovanie pomocou regexu

Vytvorte vlastné prieskumné reporty na hlbšiu analýzu AI návštevnosti:

  1. Prejdite do Prieskumov (Explore) vo vašej GA4 službe
  2. Vyberte “Prázdny prieskum” ako východiskovú šablónu
  3. Pridajte dimenzie: Zdroj/Médium, Názov stránky, Typ zariadenia, Krajina
  4. Pridajte metriky: Používatelia, Relácie, Miera zapojenia, Miera konverzie
  5. Aplikujte filter: Kliknite na “Pridať filter” a vyberte “Zdroj” zodpovedá regexu ^(openai\.com|perplexity\.ai|claude\.ai)$
  6. Vytvorte vizualizáciu: Zvoľte “Tabuľka” alebo “Bodový graf” na analýzu vzťahov medzi AI platformami a správaním používateľov
  7. Uložte prieskum ako “AI návštevnosť do hĺbky” na opakovanú analýzu

Odporúčané metriky pre AI analýzu sú miera odchodov, priemerné trvanie relácie a miera konverzie, aby ste pochopili, ako sa AI referral návštevníci správajú v porovnaní s ostatnými zdrojmi. Použite šablónu Prieskum zúženia (Funnel Exploration) na sledovanie, ako AI návštevníci prechádzajú vašim konverzným tunelom v porovnaní s organickou alebo platenou návštevnosťou. To vám ukáže, či má AI návštevnosť vyššiu alebo nižšiu kvalitu než vaše iné kanály.

Monitorovanie a údržba regex vzorov

Efektívne sledovanie AI návštevnosti si vyžaduje pravidelnú údržbu a monitorovanie:

  • Týždenná kontrola: Sledujte prehľad Získavanie návštevnosti, či regex filtre zachytávajú očakávané objemy návštevnosti
  • Mesačná analýza: Porovnávajte trendy AI návštevnosti naprieč platformami, aby ste identifikovali nové alebo klesajúce zdroje
  • Štvrťročné aktualizácie: Pridajte nové AI platformy podľa potreby (napr. nové verzie Claude, regionálne AI platformy)
  • Overovanie: Pravidelne testujte svoje regex vzory v online testeroch, či stále zodpovedajú zamýšľaným doménam
  • Nastavenie upozornení: Vytvorte si v GA4 upozornenia na nezvyčajné výkyvy AI návštevnosti, aby ste včas zachytili chyby v konfigurácii

Najčastejšie chyby sú zabudnutie escapovať bodky v doménach, použitie neukotvených vzorov zachytávajúcich aj nechcenú návštevnosť a neaktualizovanie vzorov pri zmene domén AI platforiem. Sledujte false-positive zachytenia občasným kontrolovaním skutočných hodnôt referrera v raw dátach, aby ste mali istotu, že regex nezachytáva ne-AI návštevnosť. Keď vznikajú nové AI platformy alebo existujúce menia svoje referrer správanie, aktualizujte regex vzory, aby ste si zachovali úplný prehľad.

Porovnanie riešení na monitorovanie AI návštevnosti

Kým filtre v GA4 poskytujú základné sledovanie AI návštevnosti, špecializované riešenia ponúkajú hlbší pohľad:

RiešenieDetekcia AI návštevnostiMonitoring v reálnom časeJednoduchosť nastaveniaAutomatizácia
GA4 Regex filtreManuálne vytváranie vzorov24-48 hodín oneskorenieStredná (vyžaduje znalosti regexu)Obmedzené
AmICited.comAutomatická detekcia AI platforiemDashboard v reálnom časeVeľmi jednoduché (bez kódovania)Plná automatizácia
SemrushZákladné sledovanie AI referralovDenné aktualizácieJednoduché (cez rozhranie)Čiastočné
AhrefsObmedzené AI dátaTýždenné reportyStrednéMinimálna
FlowHunt.ioSledovanie generovania AI obsahuV reálnom časeJednoduchéČiastočné (zameranie na obsah)

AmICited.com vyniká ako špecializované riešenie na sledovanie AI návštevnosti, ktoré automaticky deteguje ChatGPT, Perplexity, Claude a vznikajúce AI platformy bez potreby nastavovania regexu. Platforma poskytuje dashboardy v reálnom čase s prehľadom, ktorý obsah priťahuje AI systémy, ako AI návštevnosť konvertuje a detailné rozdelenie podľa platforiem. Pre tímy bez znalostí regexu AmICited.com odstraňuje technické bariéry a poskytuje hlbší AI-špecifický pohľad než samotné GA4. FlowHunt.io je alternatíva, ak je vaším hlavným cieľom sledovanie AI generovaného obsahu a využívania platforiem na generovanie obsahu, nie AI referral návštevnosti.

Najlepšie praktiky a najčastejšie chyby

Správna implementácia regex vzorov si vyžaduje precíznosť a poznanie bežných chýb:

Bežná chybaDopadRiešenie
Zabudnutie escapovať bodky (. namiesto \.)Zachytáva nechcené domény (napr. openaiXcom)Vždy používajte \. pre skutočné bodky v doménach
Použitie neukotvených vzorovZachytáva čiastočné zhody a false positivesVždy používajte ^ na začiatku a $ na konci
Nesprávne kombinovanie regex a ne-regex podmienokNesprávna klasifikácia návštevnostiTestujte podmienky zvlášť pred ich spojením
Neaktualizovanie vzorov pre nové AI platformyVynechaná vznikajúca návštevnosťKontrolujte a aktualizujte štvrťročne
Prekrývajúce sa filtreDvojité započítanie návštevnostiUistite sa, že filtre sú navzájom vylučujúce

Najlepšie praktiky pre presnosť zahŕňajú testovanie regex vzorov v testovacom GA4 pohľade pred nasadením na produkciu, dokumentovanie vašich vzorov s poznámkami vysvetľujúcimi každú sekciu a vedenie changelogu aktualizácií vzorov. Overujte svoje vzory porovnaním filtrovaných výsledkov v GA4 s vašimi serverovými logmi, aby ste sa uistili o presnosti. Využite funkciu Overovanie dát (Data Validation) v GA4 na monitorovanie kvality dát a zachytenie konfiguračných chýb skôr, než ovplyvnia vaše reporty.

Najčastejšie kladené otázky

Čo je regex vzor a prečo ho potrebujem pre GA4?

Regex (regulárny výraz) je nástroj na rozpoznávanie vzorov, ktorý vám umožňuje identifikovať a filtrovať návštevnosť na základe špecifických textových vzorov. V GA4 vám regex umožňuje vytvoriť jeden filter, ktorý zachytí viac AI platforiem naraz, namiesto vytvárania samostatných filtrov pre každú doménu. To je zásadné, pretože AI platformy majú rôzne štruktúry domén a regex vzory dokážu efektívne pokryť všetky varianty.

Ktoré AI platformy odosielajú referrer hlavičky do GA4?

ChatGPT, Perplexity, Google Gemini, Bard, DeepSeek a Mistral dôsledne odosielajú referrer hlavičky, ktoré GA4 dokáže detegovať. Naopak, Claude a Microsoft Copilot často referrer informácie odstraňujú, takže ich návštevnosť sa javí ako Priama návšteva. Pochopenie týchto rozdielov je kľúčové pre vytváranie komplexných regex vzorov, ktoré zachytia všetky AI zdroje návštevnosti.

Ako otestujem svoj regex vzor pred jeho aplikovaním na živé dáta?

GA4 poskytuje funkciu náhľadu v rozhraní na tvorbu filtrov, kde môžete otestovať svoj regex vzor na vzorových dátach. Navyše môžete použiť online testery regexu na overenie syntaxe vzoru. Po aplikovaní filtra skontrolujte prehľad Získavanie návštevnosti do 24-48 hodín, aby ste potvrdili, že zachytáva očakávané objemy AI návštevnosti.

Aký je rozdiel medzi filtrami GA4 a vlastnými skupinami kanálov pre AI návštevnosť?

GA4 filtre sa aplikujú na konkrétne prehľady a môžu vylúčiť dáta, zatiaľ čo vlastné skupiny kanálov organizujú návštevnosť do kategórií pre reportovanie. Filtre sú vhodné na rýchlu analýzu, ale skupiny kanálov poskytujú trvalejšie riešenie, ktoré sa zobrazuje vo všetkých štandardných reportoch. Pre komplexné sledovanie AI návštevnosti použite oboje: filtre na detailnú analýzu a skupiny kanálov na prehľadové reporty.

Ako často mám aktualizovať svoje regex vzory?

Svoje regex vzory kontrolujte štvrťročne, aby ste mali istotu, že zachytávajú nové AI platformy a zohľadňujú prípadné zmeny domén. Sledujte svoj prehľad Získavanie návštevnosti každý mesiac, aby ste identifikovali nové AI zdroje, ktoré ešte vo vzoroch nie sú. Keďže AI oblasť sa rýchlo mení, aktuálnosť vzorov vám zabezpečí úplný prehľad o návštevnosti.

Môžem sledovať AI návštevnosť, ktorá sa v GA4 javí ako Priama návšteva?

Áno, ale vyžaduje si to alternatívne metódy mimo bežného filtrovania regexom. Pre platformy ako Claude a Copilot, ktoré odstraňujú referrer informácie, môžete použiť vlastné udalosti v Google Tag Manageri, implementovať UTM parametre na zdieľaných odkazoch alebo využiť špecializované riešenia monitorovania AI návštevnosti ako AmICited.com, ktoré detegujú AI návštevnosť pomocou iných signálov.

Aká je najčastejšia chyba pri tvorbe regex vzorov pre AI návštevnosť?

Najčastejšou chybou je zabudnutie escapovať bodky v názvoch domén. V regexe nezadaná bodka (.) znamená akýkoľvek znak, nie len bodku. To znamená, že vzor 'openai.com' by nesprávne zachytil aj 'openaiXcom'. Vždy používajte 'openai\.com' s escapovanými bodkami na zachytenie iba skutočnej domény.

Ako sa AmICited.com porovnáva s manuálnym nastavením regexu v GA4?

AmICited.com automaticky deteguje AI návštevnosť z ChatGPT, Perplexity, Claude a vznikajúcich platforiem bez potreby znalosti regexu alebo manuálneho nastavovania. Poskytuje dashboardy v reálnom čase, detailné rozdelenie návštevnosti podľa AI platforiem a prehľad o viditeľnosti obsahu, ktoré samotné GA4 neponúka. Pre tímy bez znalostí regexu alebo s potrebou hlbšej AI-analýzy, AmICited.com odstraňuje technické bariéry a poskytuje lepší prehľad.

Monitorujte svoju AI návštevnosť v reálnom čase

Prestaňte strácať prehľad o AI generovanej návštevnosti. AmICited automaticky deteguje ChatGPT, Perplexity a vznikajúce AI platformy bez zložitých regex nastavení. Získajte prehľad v reálnom čase o tom, ako AI systémy odkazujú na vašu značku.

Zistiť viac

Nastavenie GA4 na sledovanie AI referral návštevnosti
Nastavenie GA4 na sledovanie AI referral návštevnosti

Nastavenie GA4 na sledovanie AI referral návštevnosti

Zistite, ako sledovať AI referral návštevnosť v Google Analytics 4. Objavte 4 metódy na monitorovanie ChatGPT, Perplexity a ďalších AI platforiem, plus stratégi...

7 min čítania