Regex-Muster für KI-Traffic: ChatGPT- und Perplexity-Referrals erfassen

Regex-Muster für KI-Traffic: ChatGPT- und Perplexity-Referrals erfassen

Veröffentlicht am Jan 3, 2026. Zuletzt geändert am Jan 3, 2026 um 3:24 am

Warum KI-Traffic wichtig ist

Das Tracking von KI-Traffic ist für moderne Websites unerlässlich geworden, da künstliche Intelligenz mittlerweile einen erheblichen Teil der Web-Referrals generiert, der von herkömmlichen Analysen oft nicht erfasst wird. Laut aktuellen Daten erhalten 63 % der Websites Traffic von KI-Plattformen, wobei allein ChatGPT etwa 50 % aller KI-generierten Referrals ausmacht. Die Herausforderung liegt im Standard-Tracking-Verhalten von GA4: Viele KI-Plattformen entfernen entweder Referrer-Informationen oder erscheinen als Direct Traffic und bleiben so in Standardberichten unsichtbar. Dieser versteckte Traffic sorgt für einen kritischen Blind Spot in Ihren Analysen und verhindert, dass Sie verstehen, welche Inhalte bei KI-Systemen und deren Nutzern gut ankommen. Ohne gezielte Regex-Filterung verlieren Sie die Sichtbarkeit für eine der am schnellsten wachsenden Traffic-Quellen und verpassen Chancen, für KI-gestützte Entdeckung zu optimieren.

GA4 dashboard showing hidden AI traffic in referral sources

Verständnis der KI-Traffic-Quellen

Verschiedene KI-Plattformen zeigen unterschiedliche Referrer-Verhalten, was ein umfassendes Tracking mit plattformspezifischen Ansätzen erfordert. So verhalten sich die wichtigsten KI-Plattformen in GA4:

PlattformDomainReferrer-VerhaltenErscheint alsEinschränkungen
ChatGPTopenai.comÜbermittelt Referrer-HeaderReferral-TrafficKann in manchen Konfigurationen als Direct erscheinen
Perplexityperplexity.aiÜbermittelt Referrer-HeaderReferral-TrafficInkonsistente Referrer-Muster je nach Version
Claudeclaude.aiEntfernt Referrer-InformationenDirect TrafficErfordert benutzerdefiniertes Event-Tracking
Google Geminigemini.google.comÜbermittelt Referrer-HeaderReferral-TrafficKürzlich Referrer-Unterstützung hinzugefügt
Copilotcopilot.microsoft.comEntfernt Referrer-InformationenDirect TrafficBegrenzte Referrer-Daten verfügbar
Bardbard.google.comÜbermittelt Referrer-HeaderReferral-TrafficIn Gemini integriert; Legacy-Tracking weiterhin relevant
DeepSeekdeepseek.comÜbermittelt Referrer-HeaderReferral-TrafficAufkommende Plattform mit wachsendem Traffic-Volumen
Mistralchat.mistral.aiÜbermittelt Referrer-HeaderReferral-TrafficNeue Plattform mit begrenzten historischen Daten

ChatGPT und Perplexity übermitteln konsistent Referrer-Header und sind dadurch einfacher über Standard-GA4-Filter zu verfolgen. Claude und Copilot sind schwieriger zu erfassen, da sie Referrer-Informationen komplett entfernen und alternative Tracking-Methoden erfordern. Das Verständnis dieser Verhaltensunterschiede ist entscheidend, um effektive Regex-Muster zu erstellen, die alle KI-Traffic-Quellen exakt abdecken.

Die Grundlagen von Regex-Mustern

Reguläre Ausdrücke (Regex) sind leistungsstarke Tools zur Mustererkennung, mit denen Sie Traffic in GA4 anhand spezifischer Textmuster identifizieren und filtern können. Der Bericht „Traffic-Akquise“ in GA4 nutzt Regex, um Referrer-Domains zu erkennen. So können Sie Filter erstellen, die Varianten und mehrere Plattformen gleichzeitig abdecken. Statt für jede KI-Plattform einen eigenen Filter zu erstellen, ermöglicht Regex ein einziges Muster, das mehrere Domains und URL-Strukturen abdeckt.

Das ist die grundlegende Regex-Syntax, die Sie in GA4 verwenden:

^(openai\.com|perplexity\.ai|claude\.ai)$

Wichtige Regex-Komponenten für das KI-Traffic-Tracking:

  • Pipe-Zeichen (|): Wirkt als “ODER”-Operator und erlaubt das Erfassen mehrerer Domains
  • Zirkumflex (^) und Dollarzeichen ($): Verankern das Muster am Anfang und Ende des Strings
  • Maskierte Punkte (\.): Erfassen echte Punkte in Domains (notwendig, da Punkte in Regex eine Sonderbedeutung haben)
  • Klammern (): Gruppieren mehrere Optionen für übersichtlichere Muster
  • Sternchen (*) und Plus (+): Erfassen null oder mehr bzw. eins oder mehr Zeichen

Der maskierte Punkt ist entscheidend, denn im Regex steht ein unmaskierter Punkt für jedes beliebige Zeichen, nicht nur für einen Punkt. Deshalb würde openai.com fälschlicherweise auch openaiXcom matchen, während openai\.com nur die tatsächliche Domain erfasst.

Ihren ersten Regex-Filter erstellen

Den ersten KI-Traffic-Filter in GA4 zu erstellen, ist einfach und erfordert nur wenige Schritte:

  1. Wechseln Sie zu AdminDatenfilter in Ihrer GA4-Property
  2. Klicken Sie auf “Filter erstellen” und benennen Sie ihn z. B. “AI Traffic - ChatGPT & Perplexity”
  3. Filtertyp wählen: Wählen Sie “Traffic-Typ” und setzen Sie ihn auf “Referral”
  4. Im Bereich Bedingung wählen Sie “Referrer” aus dem Dropdown
  5. Wählen Sie “Regex stimmt überein” als Bedingung
  6. Geben Sie das Muster ein: ^(openai\.com|perplexity\.ai)$
  7. Klicken Sie auf “Filter erstellen” und stellen Sie sicher, dass er auf “Aktiv” gesetzt ist

Um zu prüfen, ob Ihr Filter funktioniert, sehen Sie im Bericht zur Traffic-Akquise nach 24-48 Stunden nach Referral-Traffic von diesen Domains. Starten Sie zunächst nur mit ChatGPT und Perplexity, um sicherzugehen, dass das Muster korrekt funktioniert, bevor Sie weitere Plattformen hinzufügen. Sie können Ihr Regex-Muster vor der Live-Anwendung mit der GA4-Vorschau testen.

Fortgeschrittene Regex-Muster für umfassendes KI-Tracking

Für vollständige Sichtbarkeit von KI-Traffic nutzen Sie dieses umfassende Regex-Muster, das alle wichtigen KI-Plattformen abdeckt:

^(openai\.com|perplexity\.ai|claude\.ai|gemini\.google\.com|copilot\.microsoft\.com|bard\.google\.com|deepseek\.com|chat\.mistral\.ai|huggingface\.co|replicate\.com)$

Dieses Hauptmuster erfasst:

  • ChatGPT-Traffic über openai\.com – die größte KI-Referral-Quelle
  • Perplexity-Traffic über perplexity\.ai – schnell wachsendes KI-Suchsystem
  • Claude-Traffic über claude\.ai – Anthropics KI-Assistent (erscheint oft als Direct)
  • Google Gemini über gemini\.google\.com – Googles einheitliche KI-Plattform
  • Microsoft Copilot über copilot\.microsoft\.com – integriert in Microsoft-Produkte
  • Google Bard über bard\.google\.com – Legacy-Muster für historische Daten
  • DeepSeek über deepseek\.com – aufkommende chinesische KI-Plattform
  • Mistral über chat\.mistral\.ai – europäische Open-Source-KI-Plattform
  • HuggingFace über huggingface\.co – KI-Modellplattform & Community
  • Replicate über replicate\.com – Plattform für KI-Modell-APIs

Für granulareres Tracking können Sie separate Filter für verschiedene KI-Kategorien anlegen:

# KI-Suchplattformen
^(perplexity\.ai|deepseek\.com)$

# Allgemeine KI-Assistenten
^(openai\.com|claude\.ai|gemini\.google\.com)$

# Enterprise-KI-Plattformen
^(copilot\.microsoft\.com|bard\.google\.com)$

Mit dieser Segmentierung können Sie Traffic-Muster nach KI-Plattform-Kategorie analysieren und herausfinden, welche KI-Systeme den wertvollsten Traffic auf Ihre Inhalte bringen.

Regex pattern syntax showing AI domain matching and pattern logic

Benutzerdefinierte Kanalgruppen mit Regex erstellen

Benutzerdefinierte Kanalgruppen ermöglichen es Ihnen, KI-Traffic übersichtlich neben Ihren bestehenden Kanälen zu organisieren:

  1. Wechseln Sie zu AdminKanalgruppen in Ihrer GA4-Property
  2. Klicken Sie auf “Kanalgruppe erstellen” und benennen Sie sie z. B. “AI Traffic Channels”
  3. Klicken Sie auf “Bedingung hinzufügen”, um die erste Regel zu erstellen
  4. Setzen Sie die Bedingung: Quelle/Medium stimmt überein mit Regex ^(openai\.com|perplexity\.ai|claude\.ai|gemini\.google\.com|copilot\.microsoft\.com|bard\.google\.com|deepseek\.com|chat\.mistral\.ai)/(organic|referral)$
  5. Nennen Sie diesen Kanal “AI Assistants”
  6. Fügen Sie eine weitere Bedingung hinzu für Plattformen, die als Direct erscheinen: Quelle stimmt überein mit Regex ^(direct)$ UND Seitentitel enthält Regex (ChatGPT|Claude|Gemini|Copilot)
  7. Nennen Sie diesen Kanal “AI Direct Traffic”
  8. Klicken Sie auf “Erstellen” und stellen Sie sicher, dass diese Kanalgruppe als primäre Berichtsansicht eingestellt ist

Die Reihenfolge der Kanäle ist entscheidend: GA4 ordnet Traffic dem ersten übereinstimmenden Kanal zu, daher sollten Ihre spezifischsten KI-Regeln vor den allgemeinen Kategorien stehen. So verhindern Sie, dass KI-Traffic falsch als Direct oder Organic klassifiziert wird. Testen Sie Ihre Kanalgruppe, indem Sie den Bericht zur Traffic-Akquise aufrufen und prüfen, ob KI-Traffic in Ihrer neuen Gruppe “AI Traffic Channels” erscheint.

Explorationsberichte und Regex-Filterung

Erstellen Sie benutzerdefinierte Explorationsberichte, um KI-Traffic-Muster detailliert zu analysieren:

  1. Wechseln Sie zu Explore in Ihrer GA4-Property
  2. Wählen Sie “Leere Exploration” als Startvorlage
  3. Fügen Sie Dimensionen hinzu: Quelle/Medium, Seitentitel, Gerätetyp, Land
  4. Fügen Sie Metriken hinzu: Nutzer, Sitzungen, Engagement-Rate, Conversion-Rate
  5. Filter anwenden: Klicken Sie auf “Filter hinzufügen” und wählen Sie “Quelle” stimmt überein mit Regex ^(openai\.com|perplexity\.ai|claude\.ai)$
  6. Visualisierung erstellen: Wählen Sie “Tabelle” oder “Streudiagramm”, um Zusammenhänge zwischen KI-Plattformen und Nutzerverhalten zu analysieren
  7. Speichern Sie die Exploration als “AI Traffic Deep Dive” für wiederkehrende Analysen

Empfohlene Metriken für die Analyse von KI-Traffic sind Absprungrate, durchschnittliche Sitzungsdauer und Conversion-Rate, um zu verstehen, wie sich von KI verwiesene Nutzer im Vergleich zu anderem Traffic verhalten. Nutzen Sie die Trichter-Exploration, um zu sehen, wie KI-Nutzer Ihren Conversion-Funnel im Vergleich zu organischem oder bezahltem Traffic durchlaufen. So erkennen Sie, ob KI-Traffic eine höhere oder niedrigere Qualität als andere Kanäle hat.

Überwachung und Pflege Ihrer Regex-Muster

Effektives KI-Traffic-Tracking erfordert laufende Pflege und Kontrolle:

  • Wöchentliche Kontrolle: Prüfen Sie den Bericht zur Traffic-Akquise, ob die Regex-Filter das erwartete Traffic-Volumen erfassen
  • Monatliche Analyse: Vergleichen Sie KI-Traffic-Trends plattformübergreifend, um neue Quellen oder rückläufige Referrer zu erkennen
  • Vierteljährliche Updates: Fügen Sie neue KI-Plattformen hinzu, sobald sie auftauchen (z. B. neue Claude-Versionen, regionale KIs)
  • Validierungstests: Testen Sie Ihre Regex-Muster regelmäßig mit Online-Regex-Testern, um korrekte Domain-Abdeckung sicherzustellen
  • Alarmierung: Richten Sie GA4-Alarme für ungewöhnliche Ausschläge im KI-Traffic ein, um Konfigurationsprobleme frühzeitig zu erkennen

Häufige Fehler, die Sie vermeiden sollten, sind das Vergessen, Punkte in Domains zu maskieren, unzureichend verankerte Muster (führen zu Fehlklassifikationen) und das Versäumnis, Muster bei Domainänderungen der KI-Plattformen zu aktualisieren. Überwachen Sie auch auf False Positives, indem Sie gelegentlich die tatsächlichen Referrer-Werte in Ihren Rohdaten prüfen. Sobald neue KI-Plattformen starten oder bestehende ihr Referrer-Verhalten ändern, passen Sie Ihre Regex-Muster entsprechend an, um vollständige Abdeckung sicherzustellen.

Vergleich von KI-Traffic-Monitoring-Lösungen

Während GA4-Filter grundlegendes KI-Traffic-Tracking ermöglichen, bieten spezialisierte Lösungen tiefere Einblicke:

LösungKI-Traffic-ErkennungEchtzeit-ÜberwachungEinrichtungsaufwandAutomatisierung
GA4 Regex-FilterManuelle Muster-Erstellung24-48h VerzögerungMittel (Regex-Kenntnisse nötig)Eingeschränkt
AmICited.comAutomatische KI-Plattform-ErkennungEchtzeit-DashboardSehr einfach (kein Coding)Vollständig
SemrushGrundlegendes KI-Referral-TrackingTägliche UpdatesEinfach (UI-basiert)Teilweise
AhrefsBegrenzte KI-Traffic-DatenWöchentliche ReportsMittelMinimal
FlowHunt.ioTracking von KI-Content-GenerierungEchtzeitEinfachTeilweise (Content-Fokus)

AmICited.com ist die spezialisierte Lösung für KI-Traffic-Monitoring, erkennt ChatGPT, Perplexity, Claude und aufkommende KI-Plattformen automatisch – ganz ohne Regex-Konfiguration. Die Plattform bietet Echtzeit-Dashboards, zeigt, welche Inhalte KI-Systeme anziehen und wie KI-Traffic konvertiert, sowie detaillierte Aufschlüsselungen nach KI-Plattform. Für Teams ohne Regex-Kenntnisse beseitigt AmICited.com technische Hürden und liefert tiefere KI-spezifische Einblicke als GA4 allein. FlowHunt.io eignet sich als Alternative, wenn der Fokus auf der Erkennung KI-generierter Inhalte und deren Plattform-Nutzung liegt – weniger auf KI-Referral-Traffic.

Best Practices und typische Fehlerquellen

Die korrekte Implementierung von Regex-Mustern erfordert Präzision und das Verständnis häufiger Fehlerquellen:

Häufiger FehlerAuswirkungLösung
Vergessene Maskierung des Punkts (. statt \.)Erfasst unerwünschte Domains (z. B. openaiXcom)Immer \. für tatsächliche Punkte in Domains verwenden
Unverankerte MusterFängt Teilübereinstimmungen & False Positives abImmer ^ am Anfang und $ am Ende verwenden
Falsche Mischung aus Regex- und Nicht-Regex-BedingungenFehlklassifizierung von TrafficBedingungen einzeln testen, bevor sie kombiniert werden
Keine Aktualisierung für neue KI-PlattformenVerpasst neue Traffic-QuellenVierteljährlich überprüfen und anpassen
Überlappende FilterDoppelte Traffic-ErfassungFilter müssen sich gegenseitig ausschließen

Best Practices für höchste Genauigkeit sind das Testen von Regex-Mustern in einer Staging-GA4-View vor dem Produktiveinsatz, die Dokumentation der Muster mit Kommentaren zu jedem Abschnitt sowie das Führen eines Änderungsprotokolls. Validieren Sie Ihre Muster, indem Sie GA4-Filterergebnisse mit Ihren Serverlogs abgleichen. Nutzen Sie das GA4-Datenvalidierungstool, um die Datenqualität zu überwachen und Konfigurationsfehler frühzeitig zu erkennen.

Häufig gestellte Fragen

Was ist ein Regex-Muster und warum brauche ich es für GA4?

Ein Regex (regulärer Ausdruck) ist ein Musterabgleich-Tool, mit dem Sie Traffic anhand bestimmter Textmuster identifizieren und filtern können. In GA4 ermöglicht Regex, einen einzigen Filter zu erstellen, der mehrere KI-Plattformen gleichzeitig erfasst, anstatt für jede Domain einzelne Filter zu erstellen. Das ist essenziell, weil KI-Plattformen unterschiedliche Domainstrukturen haben und Regex-Muster alle Varianten effizient abdecken können.

Welche KI-Plattformen übergeben Referrer-Header an GA4?

ChatGPT, Perplexity, Google Gemini, Bard, DeepSeek und Mistral übergeben konsistent Referrer-Header, die von GA4 erkannt werden können. Claude und Microsoft Copilot entfernen jedoch oft Referrer-Informationen, wodurch deren Traffic als Direct Traffic erscheint. Das Verständnis dieser Unterschiede ist entscheidend, um umfassende Regex-Muster zu erstellen, die alle KI-Traffic-Quellen erfassen.

Wie teste ich mein Regex-Muster, bevor ich es auf Live-Daten anwende?

GA4 bietet eine Vorschaufunktion im Filter-Erstellungsbereich, mit der Sie Ihr Regex-Muster an Beispieldaten testen können. Zusätzlich können Sie Online-Regex-Tester nutzen, um die Syntax Ihres Musters zu validieren. Nach Anwendung des Filters prüfen Sie Ihren Bericht zur Traffic-Akquise innerhalb von 24-48 Stunden, um sicherzustellen, dass das erwartete Traffic-Volumen von KI-Plattformen erfasst wird.

Was ist der Unterschied zwischen GA4-Filtern und benutzerdefinierten Kanalgruppen für KI-Traffic?

GA4-Filter gelten für bestimmte Berichte und können Daten ausschließen, während benutzerdefinierte Kanalgruppen Traffic für die Berichterstattung in Kategorien organisieren. Filter eignen sich für schnelle Analysen, aber Kanalgruppen bieten eine dauerhaftere Lösung, die in allen Standardberichten erscheint. Für umfassendes KI-Traffic-Tracking sollten Sie beides nutzen: Filter für Detailanalysen und Kanalgruppen für die Übersicht.

Wie oft sollte ich meine Regex-Muster aktualisieren?

Überprüfen Sie Ihre Regex-Muster vierteljährlich, um sicherzustellen, dass sie neue KI-Plattformen abdecken und etwaige Domain-Änderungen berücksichtigen. Überwachen Sie Ihren Bericht zur Traffic-Akquise monatlich, um neue KI-Quellen zu identifizieren, die noch nicht in Ihren Mustern enthalten sind. Da sich die KI-Landschaft schnell entwickelt, stellen regelmäßige Updates sicher, dass Sie umfassende Traffic-Sichtbarkeit behalten.

Kann ich KI-Traffic verfolgen, der in GA4 als Direct Traffic erscheint?

Ja, aber das erfordert alternative Methoden außerhalb der Standard-Regex-Filterung. Für Plattformen wie Claude und Copilot, die Referrer-Informationen entfernen, können Sie benutzerdefinierte Events im Google Tag Manager, UTM-Parameter auf geteilten Links oder spezialisierte KI-Traffic-Monitoring-Lösungen wie AmICited.com nutzen, die KI-Traffic anhand anderer Signale erkennen.

Was ist der häufigste Fehler beim Erstellen von Regex-Mustern für KI-Traffic?

Der häufigste Fehler ist das Vergessen, Punkte in Domainnamen zu maskieren. Im Regex steht ein nicht maskierter Punkt (.) für jedes Zeichen, nicht nur für einen tatsächlichen Punkt. So würde das Muster 'openai.com' fälschlicherweise auch 'openaiXcom' matchen. Verwenden Sie immer 'openai\.com' mit maskierten Punkten, um nur die tatsächliche Domain zu erfassen.

Wie schneidet AmICited.com im Vergleich zur manuellen GA4-Regex-Konfiguration ab?

AmICited.com erkennt KI-Traffic von ChatGPT, Perplexity, Claude und aufkommenden Plattformen automatisch, ohne Regex-Kenntnisse oder manuelle Konfiguration. Es bietet Echtzeit-Dashboards, detaillierte Aufschlüsselungen nach KI-Plattform und Content-Sichtbarkeitsanalysen, die GA4 allein nicht leisten kann. Für Teams ohne Regex-Expertise oder mit Bedarf an tiefgehenderen KI-Analysen beseitigt AmICited.com technische Hürden und liefert überlegene Einblicke.

Überwachen Sie Ihren KI-Traffic in Echtzeit

Verlieren Sie keine Sichtbarkeit mehr bei KI-gesteuertem Traffic. AmICited erkennt automatisch ChatGPT, Perplexity und aufkommende KI-Plattformen ohne komplizierte Regex-Konfiguration. Erhalten Sie Echtzeiteinblicke, wie KI-Systeme auf Ihre Marke verweisen.

Mehr erfahren

GA4 für das Tracking von KI-Referral-Traffic einrichten
GA4 für das Tracking von KI-Referral-Traffic einrichten

GA4 für das Tracking von KI-Referral-Traffic einrichten

Erfahren Sie, wie Sie KI-Referral-Traffic in Google Analytics 4 verfolgen. Entdecken Sie 4 Methoden zur Überwachung von ChatGPT, Perplexity und anderen KI-Platt...

7 Min. Lesezeit