Wzorzec Regex dla ruchu AI: Przechwytywanie przekierowań z ChatGPT i Perplexity

Wzorzec Regex dla ruchu AI: Przechwytywanie przekierowań z ChatGPT i Perplexity

Opublikowano Jan 3, 2026. Ostatnia modyfikacja Jan 3, 2026 o 3:24 am

Dlaczego ruch AI ma znaczenie

Śledzenie ruchu AI stało się niezbędne dla nowoczesnych stron internetowych, ponieważ platformy sztucznej inteligencji generują obecnie znaczącą część przekierowań, których tradycyjne narzędzia analityczne często nie wykrywają. Według najnowszych danych 63% stron otrzymuje ruch z platform AI, z czego sam ChatGPT odpowiada za około 50% wszystkich przekierowań generowanych przez AI. Problem tkwi w domyślnym sposobie śledzenia w GA4: wiele platform AI usuwa informację o referrerze lub pojawia się jako ruch bezpośredni, przez co są niewidoczne w standardowych raportach. Ten ukryty ruch tworzy istotną lukę w Twojej analityce, uniemożliwiając zrozumienie, która treść rezonuje z systemami AI i ich użytkownikami. Bez właściwego filtrowania regex tracisz wgląd w jedno z najszybciej rosnących źródeł ruchu i przegapiasz szanse na optymalizację pod kątem odkrywalności przez AI.

GA4 dashboard showing hidden AI traffic in referral sources

Zrozumienie źródeł ruchu AI

Różne platformy AI zachowują się odmiennie pod względem przekazywania referrera, przez co kompleksowe śledzenie wymaga podejścia dostosowanego do platformy. Oto jak główne platformy AI zachowują się w GA4:

PlatformaDomenaZachowanie referreraWidoczność w raportachOgraniczenia
ChatGPTopenai.comPrzekazuje nagłówek referrerRuch polecającyMoże pojawiać się jako bezpośredni w niektórych konfiguracjach
Perplexityperplexity.aiPrzekazuje nagłówek referrerRuch polecającyNiekonsekwentne wzorce referrera w różnych wersjach
Claudeclaude.aiUsuwa informację o referrerzeRuch bezpośredniWymaga niestandardowego śledzenia zdarzeń do atrybucji
Google Geminigemini.google.comPrzekazuje nagłówek referrerRuch polecającyNiedawno dodano obsługę referrera
Copilotcopilot.microsoft.comUsuwa informację o referrerzeRuch bezpośredniOgraniczone dane o referrerze
Bardbard.google.comPrzekazuje nagłówek referrerRuch polecającyScalony z Gemini; śledzenie historyczne nadal istotne
DeepSeekdeepseek.comPrzekazuje nagłówek referrerRuch polecającyNowa platforma z rosnącym wolumenem ruchu
Mistralchat.mistral.aiPrzekazuje nagłówek referrerRuch polecającyNowa platforma z ograniczonymi danymi historycznymi

ChatGPT i Perplexity konsekwentnie przekazują nagłówki referrer, ułatwiając ich śledzenie za pomocą standardowych filtrów GA4. Claude i Copilot stanowią większe wyzwanie, całkowicie usuwając informację o referrerze i wymagając alternatywnych metod śledzenia. Zrozumienie tych różnic zachowań jest kluczowe do budowy skutecznych wzorców regex, które precyzyjnie przechwytują wszystkie źródła ruchu AI.

Podstawy wzorców Regex

Wyrażenia regularne (regex) to potężne narzędzia dopasowujące wzorce, pozwalające identyfikować i filtrować ruch na podstawie określonych tekstowych wzorców w GA4. Raport Pozyskiwanie ruchu w GA4 używa regex do dopasowywania domen referrera, umożliwiając tworzenie filtrów przechwytujących różne warianty i wiele platform jednocześnie. Zamiast tworzyć osobne filtry dla każdej platformy AI, regex pozwala napisać jeden wzorzec dopasowujący wiele domen i struktur URL.

Oto podstawowa składnia regex, której użyjesz w GA4:

^(openai\.com|perplexity\.ai|claude\.ai)$

Kluczowe elementy regex do śledzenia ruchu AI:

  • Znak pionowej kreski (|): Działa jak operator “LUB”, pozwalając na dopasowanie wielu domen
  • Daszek (^) i znak dolara ($): Zakotwiczają wzorzec na początku i końcu ciągu
  • Ucieczka kropek (\.): Dopasowuje dosłowne kropki w nazwach domen (wymagane, bo kropki mają specjalne znaczenie w regex)
  • Nawiasy (): Grupują wiele opcji dla czystszych wzorców
  • Asterisk (*) i plus (+): Odpowiednio dopasowują zero lub więcej, albo jeden lub więcej znaków

Ucieczka kropki jest kluczowa, ponieważ w regex nieucieczona kropka dopasowuje dowolny znak, a nie tylko dosłowną kropkę. Dlatego openai.com błędnie dopasuje openaiXcom, podczas gdy openai\.com dopasuje tylko właściwą domenę.

Tworzenie pierwszego filtra regex

Stworzenie pierwszego filtra ruchu AI w GA4 jest proste i wymaga kilku kroków:

  1. Przejdź do AdministracjaFiltry danych w swojej usłudze GA4
  2. Kliknij “Utwórz filtr” i nazwij go “Ruch AI - ChatGPT & Perplexity”
  3. Wybierz typ filtra: Wybierz “Typ ruchu” i ustaw na “Polecający”
  4. W sekcji Warunek wybierz “Referrer” z rozwijanej listy
  5. Wybierz “Dopasowuje regex” jako warunek dopasowania
  6. Wprowadź wzorzec: ^(openai\.com|perplexity\.ai)$
  7. Kliknij “Utwórz filtr” i upewnij się, że jest ustawiony jako “Aktywny”

Aby sprawdzić, czy filtr działa, przejrzyj raport Pozyskiwanie ruchu w ciągu 24-48 godzin i poszukaj ruchu polecającego z tych domen. Rozpocznij tylko od ChatGPT i Perplexity, aby upewnić się, że wzorzec działa poprawnie, zanim rozszerzysz go o kolejne platformy. Swoje regex możesz przetestować za pomocą wbudowanej funkcji podglądu GA4 przed zastosowaniem na danych produkcyjnych.

Zaawansowane wzorce regex dla pełnego śledzenia AI

Dla pełnej widoczności ruchu AI użyj tego kompleksowego wzorca regex obejmującego wszystkie główne platformy AI:

^(openai\.com|perplexity\.ai|claude\.ai|gemini\.google\.com|copilot\.microsoft\.com|bard\.google\.com|deepseek\.com|chat\.mistral\.ai|huggingface\.co|replicate\.com)$

Ten wzorzec przechwytuje:

  • Ruch ChatGPT przez openai\.com - największe źródło poleceń AI
  • Ruch Perplexity przez perplexity\.ai - szybko rosnąca wyszukiwarka AI
  • Ruch Claude przez claude\.ai - AI od Anthropic (często jako bezpośredni)
  • Google Gemini przez gemini\.google\.com - zunifikowana platforma AI Google
  • Microsoft Copilot przez copilot\.microsoft\.com - zintegrowany z produktami Microsoft
  • Google Bard przez bard\.google\.com - wzorzec historyczny
  • DeepSeek przez deepseek\.com - wschodząca chińska platforma AI
  • Mistral przez chat\.mistral\.ai - europejska open-source AI
  • HuggingFace przez huggingface\.co - hub modeli AI i społeczność
  • Replicate przez replicate\.com - platforma API modeli AI

Dla dokładniejszego śledzenia stwórz osobne filtry dla różnych kategorii AI:

# Platformy AI nastawione na wyszukiwanie
^(perplexity\.ai|deepseek\.com)$

# Uniwersalne asystenty AI
^(openai\.com|claude\.ai|gemini\.google\.com)$

# Platformy AI dla firm
^(copilot\.microsoft\.com|bard\.google\.com)$

Taka segmentacja pozwala analizować wzorce ruchu według kategorii platform AI i identyfikować, które typy systemów AI generują najcenniejszy ruch na Twoje treści.

Regex pattern syntax showing AI domain matching and pattern logic

Tworzenie niestandardowych grup kanałów z regex

Niestandardowe grupy kanałów umożliwiają czytelniejszą organizację ruchu AI obok istniejących kanałów:

  1. Przejdź do AdministracjaGrupy kanałów w swojej usłudze GA4
  2. Kliknij “Utwórz grupę kanałów” i nazwij ją “Kanały ruchu AI”
  3. Kliknij “Dodaj warunek”, aby utworzyć pierwszą regułę
  4. Ustaw warunek: Źródło/Medium dopasowuje regex ^(openai\.com|perplexity\.ai|claude\.ai|gemini\.google\.com|copilot\.microsoft\.com|bard\.google\.com|deepseek\.com|chat\.mistral\.ai)/(organic|referral)$
  5. Nazwij ten kanał “Asystenci AI”
  6. Dodaj kolejny warunek dla platform, które pojawiają się jako bezpośrednie: Źródło dopasowuje regex ^(direct)$ ORAZ Tytuł strony zawiera regex (ChatGPT|Claude|Gemini|Copilot)
  7. Nazwij ten kanał “Ruch AI bezpośredni”
  8. Kliknij “Utwórz” i upewnij się, że grupa kanałów jest ustawiona jako główny widok raportowania

Kolejność kanałów ma kluczowe znaczenie: GA4 przypisuje ruch do pierwszego pasującego kanału, dlatego najbardziej szczegółowe reguły AI umieść przed szerszymi kategoriami. Zapobiega to błędnemu klasyfikowaniu ruchu AI jako Direct lub Organic. Przetestuj grupę kanałów, przeglądając raport Pozyskiwanie ruchu i sprawdzając, czy ruch AI pojawia się w nowej grupie “Kanały ruchu AI”.

Raporty eksploracyjne i filtrowanie regex

Twórz niestandardowe raporty eksploracyjne, aby głębiej analizować wzorce ruchu AI:

  1. Przejdź do Eksploruj w swojej usłudze GA4
  2. Wybierz “Pusta eksploracja” jako szablon startowy
  3. Dodaj wymiary: Źródło/Medium, Tytuł strony, Kategoria urządzenia, Kraj
  4. Dodaj metryki: Użytkownicy, Sesje, Współczynnik zaangażowania, Współczynnik konwersji
  5. Zastosuj filtr: Kliknij “Dodaj filtr” i wybierz “Źródło” dopasowuje regex ^(openai\.com|perplexity\.ai|claude\.ai)$
  6. Stwórz wizualizację: Wybierz “Tabela” lub “Wykres rozrzutu”, aby analizować zależności między platformami AI a zachowaniami użytkowników
  7. Zapisz eksplorację jako “Analiza ruchu AI” do powtarzalnych analiz

Zalecane metryki do analizy ruchu AI to współczynnik odrzuceń, średni czas trwania sesji i współczynnik konwersji, aby zrozumieć, jak użytkownicy poleceni przez AI angażują się w porównaniu do innych źródeł ruchu. Użyj szablonu Eksploracja ścieżki lejka, by śledzić, jak użytkownicy AI przechodzą przez lejek konwersji w porównaniu do ruchu organicznego lub płatnego. To pokaże, czy ruch z AI ma wyższą czy niższą jakość niż inne kanały.

Monitorowanie i utrzymanie wzorców regex

Skuteczne śledzenie ruchu AI wymaga ciągłego utrzymania i monitorowania:

  • Przegląd cotygodniowy: Sprawdzaj raport Pozyskiwanie ruchu, aby upewnić się, że filtry regex przechwytują oczekiwane wolumeny ruchu
  • Analiza comiesięczna: Porównuj trendy ruchu AI na platformach, by identyfikować nowe lub spadające źródła
  • Aktualizacja kwartalna: Dodawaj nowe platformy AI w miarę ich pojawiania się (np. nowe wersje Claude, regionalne AI)
  • Sprawdzanie poprawności: Okresowo testuj swoje wzorce regex w internetowych testerach, aby upewnić się, że nadal dopasowują właściwe domeny
  • Konfiguracja alertów: Utwórz alerty GA4 na nietypowe skoki lub spadki ruchu AI, by szybko wykryć problemy z konfiguracją

Typowe błędy do uniknięcia to brak ucieczki kropek w domenach, stosowanie niezakotwiczonych wzorców dopasowujących niezamierzony ruch oraz nieaktualizowanie wzorców po zmianach domen platform AI. Monitoruj fałszywe trafienia, okresowo przeglądając rzeczywiste wartości referrera w surowych danych, by upewnić się, że regex nie przechwytuje ruchu spoza AI. W miarę pojawiania się nowych platform AI lub zmian w zachowaniu referrera, aktualizuj wzorce regex, aby utrzymać pełne pokrycie.

Porównanie rozwiązań do monitorowania ruchu AI

Filtry GA4 zapewniają podstawowe śledzenie ruchu AI, ale wyspecjalizowane rozwiązania oferują głębszy wgląd:

RozwiązanieWykrywanie ruchu AIMonitoring w czasie rzeczywistymŁatwość wdrożeniaAutomatyzacja
Filtry Regex w GA4Ręczne tworzenie wzorcówOpóźnienie 24-48hŚrednia (wymagana znajomość regex)Ograniczona
AmICited.comAutomatyczne wykrywanie platform AIPulpit na żywoBardzo łatwe (bez kodowania)Pełna automatyzacja
SemrushPodstawowe śledzenie poleceń AIAktualizacje dzienneŁatwe (interfejs graficzny)Częściowa
AhrefsOgraniczone dane o ruchu AIRaporty tygodnioweŚredniaMinimalna
FlowHunt.ioŚledzenie generowania treści AICzas rzeczywistyŁatweCzęściowa (skupienie na treści)

AmICited.com wyróżnia się jako dedykowane rozwiązanie do monitorowania ruchu AI, automatycznie wykrywając ChatGPT, Perplexity, Claude i nowe platformy AI bez potrzeby konfiguracji regex. Platforma oferuje pulpity na żywo pokazujące, które treści przyciągają systemy AI, jak ruch AI konwertuje oraz szczegółowe rozbicia według platform AI. Dla zespołów bez wiedzy regex AmICited.com eliminuje bariery techniczne, zapewniając głębsze, specyficzne dla AI wnioski niż samo GA4. FlowHunt.io będzie alternatywą, jeśli głównym celem jest śledzenie generowania treści AI i wykorzystania platform do generowania treści, a nie ruchu polecającego AI.

Najlepsze praktyki i częste pułapki

Właściwe wdrożenie wzorców regex wymaga dbałości o szczegóły i znajomości typowych błędów:

Typowy błądSkutekRozwiązanie
Brak ucieczki kropki (. zamiast \.)Dopasowuje niezamierzone domeny (np. openaiXcom)Zawsze używaj \. dla dosłownych kropek w domenach
Użycie niezakotwiczonych wzorcówPrzechwytuje częściowe dopasowania i fałszywe trafieniaZawsze używaj ^ na początku i $ na końcu
Mieszanie warunków regex i nie-regexBłędna klasyfikacja ruchuTestuj warunki osobno przed połączeniem
Brak aktualizacji wzorców dla nowych platform AIUtrata nowych źródeł ruchuPrzeglądaj i aktualizuj co kwartał
Tworzenie nakładających się filtrówPodwójne liczenie ruchuUpewnij się, że filtry są wzajemnie wykluczające się

Najlepsze praktyki dla dokładności obejmują testowanie wzorców regex w widoku testowym GA4 przed wdrożeniem na produkcji, dokumentowanie wzorców z komentarzami opisującymi każdą sekcję oraz prowadzenie dziennika zmian aktualizacji wzorców. Waliduj swoje wzorce porównując wyniki filtracji GA4 z logami serwera, aby upewnić się co do poprawności. Wykorzystaj funkcję Walidacji danych GA4, aby monitorować jakość danych i wykrywać problemy konfiguracyjne, zanim wpłyną na raportowanie.

Najczęściej zadawane pytania

Czym jest wzorzec regex i dlaczego jest mi potrzebny w GA4?

Regex (wyrażenie regularne) to narzędzie dopasowujące wzorce, które pozwala identyfikować i filtrować ruch na podstawie określonych wzorców tekstowych. W GA4 regex umożliwia utworzenie jednego filtra, który przechwytuje wiele platform AI jednocześnie, zamiast tworzyć indywidualne filtry dla każdej domeny. To niezbędne, ponieważ platformy AI mają różne struktury domen, a wzorce regex mogą skutecznie dopasować wszystkie wariacje.

Które platformy AI przekazują nagłówki referrer do GA4?

ChatGPT, Perplexity, Google Gemini, Bard, DeepSeek i Mistral konsekwentnie przekazują nagłówki referrer, które GA4 może wykryć. Jednak Claude i Microsoft Copilot często usuwają informacje o referrerze, przez co ich ruch pojawia się jako ruch bezpośredni. Zrozumienie tych różnic jest kluczowe do budowania pełnych wzorców regex, które przechwytują wszystkie źródła ruchu AI.

Jak przetestować wzorzec regex przed zastosowaniem na danych produkcyjnych?

GA4 oferuje funkcję podglądu w interfejsie tworzenia filtra, gdzie możesz przetestować swój wzorzec regex na danych przykładowych. Dodatkowo możesz użyć internetowych testerów regex do walidacji składni wzorca. Po zastosowaniu filtra sprawdź raport Pozyskiwanie ruchu w ciągu 24-48 godzin, aby potwierdzić, że przechwytuje on oczekiwane wolumeny ruchu z platform AI.

Jaka jest różnica między filtrami GA4 a niestandardowymi grupami kanałów dla ruchu AI?

Filtry GA4 dotyczą konkretnych raportów i mogą wykluczać dane, podczas gdy niestandardowe grupy kanałów organizują ruch w kategorie raportowe. Filtry są przydatne do szybkiej analizy, ale grupy kanałów zapewniają trwalsze rozwiązanie widoczne we wszystkich standardowych raportach. Do kompleksowego śledzenia ruchu AI używaj obu: filtrów do analizy szczegółowej i grup kanałów do raportowania ogólnego.

Jak często powinienem aktualizować swoje wzorce regex?

Przeglądaj wzorce regex co kwartał, aby upewnić się, że przechwytują nowe platformy AI i uwzględniają zmiany domen. Monitoruj raport Pozyskiwanie ruchu co miesiąc, aby identyfikować nowe źródła AI, które nie zostały jeszcze uwzględnione w wzorcach. Ponieważ krajobraz AI szybko się zmienia, aktualność wzorców gwarantuje pełną widoczność ruchu.

Czy mogę śledzić ruch AI, który pojawia się jako ruch bezpośredni w GA4?

Tak, ale wymaga to alternatywnych metod poza standardowym filtrowaniem regex. Dla platform takich jak Claude i Copilot, które usuwają informacje o referrerze, możesz wykorzystać niestandardowe zdarzenia w Google Tag Manager, wdrożyć parametry UTM w udostępnianych linkach lub użyć specjalistycznych rozwiązań monitorowania ruchu AI jak AmICited.com, które wykrywają ruch AI na podstawie innych sygnałów.

Jaki jest najczęstszy błąd przy tworzeniu wzorców regex dla ruchu AI?

Najczęstszym błędem jest zapominanie o ucieczce kropek w nazwach domen. W regex nieucieczona kropka (.) dopasowuje dowolny znak, a nie tylko dosłowną kropkę. Oznacza to, że wzorzec 'openai.com' błędnie dopasuje 'openaiXcom'. Zawsze używaj 'openai\.com' z ucieczkami dla kropek, aby dopasować tylko właściwą domenę.

Jak AmICited.com wypada w porównaniu z ręczną konfiguracją regex w GA4?

AmICited.com automatycznie wykrywa ruch AI z ChatGPT, Perplexity, Claude i nowych platform bez potrzeby znajomości regex ani ręcznej konfiguracji. Oferuje pulpity na żywo, szczegółowe rozbicia platform AI i wgląd w widoczność treści, których samo GA4 nie zapewnia. Dla zespołów bez wiedzy regex lub potrzebujących głębszych analiz AI, AmICited.com eliminuje bariery techniczne i dostarcza lepsze wnioski.

Monitoruj ruch AI w czasie rzeczywistym

Przestań tracić widoczność ruchu generowanego przez AI. AmICited automatycznie wykrywa ChatGPT, Perplexity i nowe platformy AI bez skomplikowanej konfiguracji regex. Uzyskaj wgląd w czasie rzeczywistym, jak systemy AI odwołują się do Twojej marki.

Dowiedz się więcej

Konfigurowanie GA4 do śledzenia ruchu referencyjnego z AI
Konfigurowanie GA4 do śledzenia ruchu referencyjnego z AI

Konfigurowanie GA4 do śledzenia ruchu referencyjnego z AI

Dowiedz się, jak śledzić ruch referencyjny z AI w Google Analytics 4. Poznaj 4 metody monitorowania ChatGPT, Perplexity i innych platform AI oraz strategie opty...

8 min czytania