Regex vzor pro AI provoz: Zachycení odkazů z ChatGPT a Perplexity

Regex vzor pro AI provoz: Zachycení odkazů z ChatGPT a Perplexity

Publikováno dne Jan 3, 2026. Naposledy upraveno dne Jan 3, 2026 v 3:24 am

Proč je AI provoz důležitý

Sledování AI provozu se stalo zásadní pro moderní weby, protože platformy umělé inteligence dnes generují významnou část referral provozu, který tradiční analytika často nerozpozná. Podle nedávných dat 63 % webů přijímá provoz z AI platforem, přičemž samotný ChatGPT tvoří přibližně 50 % všech AI referralů. Problém spočívá ve výchozím chování GA4: mnoho AI platforem buď odstraňuje informace o referreru, nebo se tváří jako přímý provoz, což je činí ve standardních reportech neviditelnými. Tento skrytý provoz vytváří zásadní slepou skvrnu v analytice a brání vám pochopit, jaký obsah rezonuje s AI systémy a jejich uživateli. Bez správného filtrování pomocí regex ztrácíte přehled o jednom z nejrychleji rostoucích zdrojů provozu a přicházíte o příležitosti optimalizovat na objevení přes AI.

GA4 dashboard showing hidden AI traffic in referral sources

Pochopení zdrojů AI provozu

Různé AI platformy vykazují odlišné chování s referrerem, což vyžaduje pro komplexní sledování individuální přístup podle platformy. Takto se chovají hlavní AI platformy v GA4:

PlatformaDoménaChování referreruZobrazuje se jakoOmezení
ChatGPTopenai.comPředává referrer hlavičkuReferral trafficMůže se v některých případech jevit jako přímý
Perplexityperplexity.aiPředává referrer hlavičkuReferral trafficNekonzistentní referrer vzory napříč verzemi
Claudeclaude.aiOdstraňuje informace o referreruPřímý provozVyžaduje vlastní sledování událostí pro přiřazení
Google Geminigemini.google.comPředává referrer hlavičkuReferral trafficNedávno přidána podpora referreru
Copilotcopilot.microsoft.comOdstraňuje informace o referreruPřímý provozOmezené údaje o referreru k dispozici
Bardbard.google.comPředává referrer hlavičkuReferral trafficSloučeno do Gemini; sledování starších dat stále relevantní
DeepSeekdeepseek.comPředává referrer hlavičkuReferral trafficNově vznikající platforma s rostoucím objemem provozu
Mistralchat.mistral.aiPředává referrer hlavičkuReferral trafficNovější platforma s omezenými historickými daty

ChatGPT a Perplexity konzistentně předávají referrer hlavičky, což je činí snadno sledovatelnými pomocí standardních filtrů v GA4. Claude a Copilot představují větší výzvu tím, že referrer zcela odstraňují a vyžadují alternativní metody sledování. Pochopení těchto rozdílů je zásadní pro sestavení efektivních regex vzorů, které přesně zachytí všechny zdroje AI provozu.

Základy regex vzoru

Regulární výrazy (regex) jsou mocné nástroje pro vyhledávání vzorů, které umožňují identifikovat a filtrovat provoz na základě konkrétních textových vzorců v GA4. Report Akvizice provozu v GA4 využívá regex pro porovnání domén referreru, což vám umožní vytvářet filtry, které zachytí varianty a více platforem najednou. Místo tvorby jednotlivých filtrů pro každou AI platformu můžete pomocí regex napsat jediný vzor, který odpovídá více doménám i URL strukturám.

Základní syntaxe regex, kterou v GA4 použijete, vypadá takto:

^(openai\.com|perplexity\.ai|claude\.ai)$

Klíčové komponenty regex pro sledování AI provozu:

  • Svislítko (|): Funguje jako operátor „NEBO“, umožňuje více domén ve vzoru
  • Stříška (^) a dolar ($): Ukotvují vzor na začátek a konec řetězce
  • Escapovaná tečka (\.): Odpovídá skutečné tečce v doméně (protože tečka má v regex speciální význam)
  • Závorky (): Seskupují více možností pro přehlednější vzor
  • Hvězdička (*) a plus (+): Odpovídají nule nebo více, respektive jedné nebo více znakům

Escapovaná tečka je kritická, protože v regex neescapovaná tečka odpovídá libovolnému znaku, nejen tečce. Proto openai.com by nesprávně zachytilo i openaiXcom, zatímco openai\.com odpovídá pouze skutečné doméně.

Vytvoření prvního regex filtru

Vytvoření prvního AI filtru v GA4 je jednoduché a vyžaduje jen pár kroků:

  1. Přejděte do SprávceDatové filtry ve své vlastnosti GA4
  2. Klikněte na „Vytvořit filtr“ a pojmenujte ho „AI Traffic - ChatGPT & Perplexity“
  3. Vyberte typ filtru: Zvolte „Typ provozu“ a nastavte na „Referral“
  4. V sekci Podmínka vyberte z rozbalovací nabídky „Referrer“
  5. Zvolte „Odpovídá regexu“ jako podmínku porovnání
  6. Zadejte vzor: ^(openai\.com|perplexity\.ai)$
  7. Klikněte na „Vytvořit filtr“ a ověřte, že je nastaven jako „Aktivní“

Pro ověření funkčnosti filtru zkontrolujte report Akvizice provozu během 24–48 hodin a hledejte referral provoz z těchto domén. Začněte pouze s ChatGPT a Perplexity, abyste si ověřili, že vzor funguje správně, než jej rozšíříte o další platformy. Své regex vzory můžete otestovat pomocí vestavěné náhledové funkce GA4 před nasazením na ostrá data.

Pokročilé regex vzory pro komplexní AI sledování

Pro zajištění úplného přehledu o AI provozu použijte tento komplexní regex vzor, který zahrnuje všechny hlavní AI platformy:

^(openai\.com|perplexity\.ai|claude\.ai|gemini\.google\.com|copilot\.microsoft\.com|bard\.google\.com|deepseek\.com|chat\.mistral\.ai|huggingface\.co|replicate\.com)$

Tento hlavní vzor zachytí:

  • Provoz z ChatGPT přes openai\.com – největší AI referral zdroj
  • Provoz z Perplexity přes perplexity\.ai – rychle rostoucí AI vyhledávač
  • Provoz z Claude přes claude\.ai – AI asistent od Anthropic (často se ale jeví jako přímý)
  • Google Gemini přes gemini\.google\.com – sjednocená AI platforma od Googlu
  • Microsoft Copilot přes copilot\.microsoft\.com – integrovaný do produktů Microsoft
  • Google Bard přes bard\.google\.com – starší vzor pro historická data
  • DeepSeek přes deepseek\.com – nová čínská AI platforma
  • Mistral přes chat\.mistral\.ai – evropská open-source AI platforma
  • HuggingFace přes huggingface\.co – hub a komunita AI modelů
  • Replicate přes replicate\.com – platforma API pro AI modely

Pro detailnější sledování vytvořte samostatné filtry pro různé kategorie AI platforem:

# AI platformy zaměřené na vyhledávání
^(perplexity\.ai|deepseek\.com)$

# Obecní AI asistenti
^(openai\.com|claude\.ai|gemini\.google\.com)$

# Podnikové AI platformy
^(copilot\.microsoft\.com|bard\.google\.com)$

Tato segmentace vám umožní analyzovat vzory provozu podle kategorie AI platforem a zjistit, které typy AI systémů přivádějí na váš obsah nejhodnotnější návštěvy.

Regex pattern syntax showing AI domain matching and pattern logic

Vytváření vlastních skupin kanálů pomocí regex

Vlastní skupiny kanálů vám umožní přehledněji organizovat AI provoz vedle vašich stávajících kanálů:

  1. Přejděte do SprávceSkupiny kanálů ve své vlastnosti GA4
  2. Klikněte na „Vytvořit skupinu kanálů“ a pojmenujte ji „AI Traffic Channels“
  3. Klikněte na „Přidat podmínku“ pro vytvoření prvního pravidla
  4. Nastavte podmínku: Zdroj/Medium odpovídá regexu ^(openai\.com|perplexity\.ai|claude\.ai|gemini\.google\.com|copilot\.microsoft\.com|bard\.google\.com|deepseek\.com|chat\.mistral\.ai)/(organic|referral)$
  5. Pojmenujte tento kanál „AI Assistants“
  6. Přidejte další podmínku pro platformy, které se zobrazují jako přímé: Zdroj odpovídá regexu ^(direct)$ A Název stránky obsahuje regex (ChatGPT|Claude|Gemini|Copilot)
  7. Pojmenujte tento kanál „AI Direct Traffic“
  8. Klikněte na „Vytvořit“ a ujistěte se, že je tato skupina kanálů nastavena jako hlavní zobrazení reportů

Pořadí kanálů je klíčové: GA4 přiřadí provoz do prvního odpovídajícího kanálu, proto umístěte nejkonkrétnější AI pravidla před obecnější kategorie. Tím zabráníte chybnému zařazení AI provozu jako Přímý nebo Organický. Ověřte funkčnost skupiny kanálů v reportu Akvizice provozu a zkontrolujte, zda se AI provoz zobrazuje ve vaší nové skupině „AI Traffic Channels“.

Průzkumné reporty a filtrování pomocí regex

Vytvořte vlastní průzkumné reporty pro detailní analýzu vzorců AI provozu:

  1. Přejděte na Průzkumy ve své vlastnosti GA4
  2. Vyberte „Prázdný průzkum“ jako výchozí šablonu
  3. Přidejte dimenze: Zdroj/Medium, Název stránky, Kategorie zařízení, Země
  4. Přidejte metriky: Uživatelé, Relace, Míra zapojení, Míra konverze
  5. Aplikujte filtr: Klikněte na „Přidat filtr“ a vyberte „Zdroj“ odpovídá regexu ^(openai\.com|perplexity\.ai|claude\.ai)$
  6. Vytvořte vizualizaci: Zvolte „Tabulka“ nebo „Bodový graf“ pro analýzu vztahů mezi AI platformami a chováním uživatelů
  7. Uložte průzkum jako „AI Traffic Deep Dive“ pro opakovanou analýzu

Doporučené metriky pro analýzu AI provozu zahrnují míru okamžitého opuštění (bounce rate), průměrnou dobu relace a míru konverze pro pochopení, jak se uživatelé přicházející z AI liší od ostatních zdrojů. Využijte šablonu Průzkum trychtýře pro sledování, jak AI uživatelé procházejí konverzním trychtýřem oproti organickému nebo placenému provozu. Zjistíte tak, zda má AI referral provoz vyšší, nebo nižší kvalitu než ostatní kanály.

Sledování a údržba regex vzorů

Efektivní sledování AI provozu vyžaduje průběžnou údržbu a monitoring:

  • Týdenní kontrola: Sledujte report Akvizice provozu a ověřte, že regex filtry zachycují očekávaný objem provozu
  • Měsíční analýza: Porovnávejte trendy AI provozu napříč platformami a hledejte nové nebo klesající referrery
  • Čtvrtletní aktualizace: Přidávejte nové AI platformy podle potřeby (např. nové verze Claude, regionální AI platformy)
  • Ověřování: Pravidelně testujte regex vzory v online regex testerech a ujistěte se, že odpovídají zamýšleným doménám
  • Nastavení upozornění: Vytvořte v GA4 upozornění na neobvyklé výkyvy v AI provozu, abyste včas zachytili problémy s konfigurací

Časté chyby, kterým se vyhnout, zahrnují zapomenutí escapovat tečky v doménách, použití neukotvených vzorů, které zachytí i nechtěný provoz, a neaktualizování vzorů při změně domén AI platforem. Sledujte falešně pozitivní případy pravidelnou kontrolou skutečných hodnot referreru v surových datech, abyste ověřili, že regex nezachycuje ne-AI provoz. Jakmile se objeví nové AI platformy nebo stávající změní své chování s referrerem, aktualizujte regex vzory pro zachování kompletního pokrytí.

Srovnání řešení pro sledování AI provozu

Zatímco filtry v GA4 poskytují základní sledování AI provozu, specializovaná řešení nabídnou hlubší pohled:

ŘešeníDetekce AI provozuMonitoring v reálném časeSnadnost nastaveníAutomatizace
GA4 Regex filtryRuční tvorba vzorůZpoždění 24–48 hodinStřední (vyžaduje znalost regex)Omezená
AmICited.comAutomatická detekce AI platforemDashboard v reálném časeVelmi snadné (bez nutnosti kódování)Plně automatizováno
SemrushZákladní sledování AI referralůDenní aktualizaceSnadné (přes rozhraní)Částečná
AhrefsOmezená data o AI provozuTýdenní reportyStředníMinimální
FlowHunt.ioSledování generování AI obsahuReálný časSnadnéČástečné (zaměřeno na obsah)

AmICited.com vyniká jako specializované řešení pro monitoring AI provozu, automaticky detekuje ChatGPT, Perplexity, Claude a nové AI platformy bez nutnosti konfigurace regex. Platforma nabízí dashboardy v reálném čase ukazující, který obsah zaujme AI systémy, jak AI provoz konvertuje a detailní rozpad podle AI platforem. Pro týmy bez znalostí regex AmICited.com odstraňuje technickou bariéru a poskytuje hlubší AI-analytiku než samotné GA4. Pokud je vaším hlavním cílem sledování generování AI obsahu a využití platforem, zvažte FlowHunt.io.

Nejlepší postupy a běžná úskalí

Správná implementace regex vzorů vyžaduje pečlivost a pochopení častých chyb:

Běžná chybaDopadŘešení
Zapomenutí escapovat tečku (. místo \.)Zachytí nechtěné domény (např. openaiXcom)Vždy používejte \. pro skutečné tečky v doménách
Použití neukotvených vzorůZachytí částečné shody a falešně pozitivní případyVždy použijte ^ na začátku a $ na konci
Nesprávné kombinování regex a ne-regex podmínekNesprávná klasifikace provozuTestujte podmínky samostatně před kombinováním
Neaktualizování vzorů pro nové AI platformyChybějící nové zdroje provozuRevidujte a aktualizujte čtvrtletně
Překrývající se filtryDvojité započítání provozuZajistěte, aby byly filtry vzájemně výlučné

Nejlepší postupy pro přesnost zahrnují testování regex vzorů ve stagingové GA4 instanci před nasazením do produkce, dokumentování regex vzorů s komentáři vysvětlujícími jednotlivé sekce a vedení changelogu aktualizací vzorů. Ověřujte vzory porovnáním výsledků filtrování v GA4 s vašimi serverovými logy. Využijte v GA4 funkci Ověření dat pro monitoring kvality dat a záchyt konfiguračních problémů dřív, než ovlivní reporting.

Často kladené otázky

Co je regex vzor a proč ho potřebuji pro GA4?

Regex (regulární výraz) je nástroj pro vyhledávání vzorů, který vám umožní identifikovat a filtrovat provoz na základě konkrétních textových vzorců. V GA4 vám regex umožňuje vytvořit jediný filtr, který zachytí více AI platforem najednou, místo abyste vytvářeli jednotlivé filtry pro každou doménu. To je zásadní, protože AI platformy mají různé struktury domén a regex vzory mohou efektivně pokrýt všechny varianty.

Které AI platformy předávají referrer hlavičky do GA4?

ChatGPT, Perplexity, Google Gemini, Bard, DeepSeek a Mistral konzistentně předávají referrer hlavičky, které GA4 dokáže detekovat. Naopak Claude a Microsoft Copilot často referrer informace odstraňují, což způsobuje, že jejich provoz se jeví jako přímý. Pochopení těchto rozdílů je klíčové pro tvorbu komplexních regex vzorů, které zachytí všechny zdroje AI provozu.

Jak otestuji svůj regex vzor před jeho aplikací na živá data?

GA4 nabízí funkci náhledu v rozhraní pro vytváření filtrů, kde můžete svůj regex vzor otestovat na vzorových datech. Navíc můžete použít online testery regex pro ověření syntaxe vzoru. Po aplikaci filtru zkontrolujte svůj report Akvizice provozu do 24–48 hodin, abyste potvrdili, že zachycuje očekávané objemy provozu z AI platforem.

Jaký je rozdíl mezi filtry GA4 a vlastními skupinami kanálů pro AI provoz?

Filtry GA4 platí pro konkrétní reporty a mohou data vyloučit, zatímco vlastní skupiny kanálů organizují provoz do kategorií pro účely reportování. Filtry jsou užitečné pro rychlou analýzu, ale vlastní skupiny kanálů poskytují trvalejší řešení, které se zobrazí ve všech standardních reportech. Pro komplexní sledování AI provozu použijte obojí: filtry pro detailní analýzu a skupiny kanálů pro přehledové reportování.

Jak často bych měl/a aktualizovat své regex vzory?

Své regex vzory revidujte čtvrtletně, abyste zajistili, že zachytí nové AI platformy a zohlední případné změny domén. Každý měsíc sledujte report Akvizice provozu a identifikujte nové AI zdroje, které ještě nejsou ve vzorech zahrnuty. Protože se AI prostředí rychle vyvíjí, pravidelná aktualizace zajistí, že si udržíte kompletní přehled o provozu.

Lze sledovat AI provoz, který se v GA4 jeví jako přímý?

Ano, ale vyžaduje to alternativní metody mimo standardní filtrování pomocí regex. U platforem jako Claude a Copilot, které odstraňují referrer informace, můžete využít vlastní události v Google Tag Manageru, implementovat UTM parametry na sdílené odkazy nebo využít specializovaná řešení pro sledování AI provozu jako AmICited.com, která detekují AI provoz pomocí jiných signálů.

Jaká je nejčastější chyba při tvorbě regex vzorů pro AI provoz?

Nejčastější chybou je zapomenutí escapovat tečky v názvech domén. V regex znamená neescapovaná tečka (.) jakýkoli znak, nejen tečku. To znamená, že vzor 'openai.com' by nesprávně zachytil i 'openaiXcom'. Vždy používejte 'openai\.com' s escapovanou tečkou, abyste zachytili pouze skutečnou doménu.

Jak si AmICited.com stojí ve srovnání s manuální konfigurací regex v GA4?

AmICited.com automaticky detekuje AI provoz z ChatGPT, Perplexity, Claude a nových platforem bez potřeby znalosti regex nebo manuální konfigurace. Nabízí dashboardy v reálném čase, detailní rozpad AI platforem a přehled o viditelnosti obsahu, což samotné GA4 nemůže nabídnout. Pro týmy bez zkušeností s regex nebo pro ty, kdo potřebují hlubší AI-analýzy, AmICited.com odstraňuje technické bariéry a poskytuje lepší přehled.

Sledujte svůj AI provoz v reálném čase

Přestaňte ztrácet přehled o provozu poháněném AI. AmICited automaticky detekuje ChatGPT, Perplexity a nové AI platformy bez složité konfigurace regex. Získejte okamžitý přehled o tom, jak AI systémy odkazují na vaši značku.

Zjistit více

Nastavení GA4 pro sledování AI referral návštěvnosti
Nastavení GA4 pro sledování AI referral návštěvnosti

Nastavení GA4 pro sledování AI referral návštěvnosti

Naučte se sledovat AI referral návštěvnost v Google Analytics 4. Objevte 4 metody pro monitorování ChatGPT, Perplexity a dalších AI platforem, plus strategie op...

7 min čtení
Monetizace AI provozu: Strategie příjmů pro vydavatele
Monetizace AI provozu: Strategie příjmů pro vydavatele

Monetizace AI provozu: Strategie příjmů pro vydavatele

Objevte osvědčené strategie příjmů pro monetizaci AI provozu. Naučte se o licenčních dohodách, GEO optimalizaci a diverzifikovaných zdrojích příjmů pro vydavate...

7 min čtení