
用于AI流量的正则表达式模式:捕获ChatGPT和Perplexity的推荐流量
掌握正则表达式模式,在Google Analytics 4中跟踪来自ChatGPT、Perplexity及其他AI平台的流量。完整技术指南,附逐步实现方法。
了解如何在 Google Analytics 4 中追踪和监控来自 ChatGPT、Perplexity、Gemini 及其他 AI 平台的 AI 流量。发现识别 AI 抓取器活动的 4 种有效方法。
可以,您可以通过多种方法在 Google Analytics 4 中看到 AI 流量,包括手动检查、自定义报告、渠道分组或专业的 AI 追踪工具。但传统的 GA4 不会自动区分 AI 抓取器与常规机器人,因此需要使用正则表达式针对 ChatGPT、Perplexity 和 Gemini 等来源设置特定过滤器来识别。
AI 流量 代表着您网站总流量中日益增长却常常“隐形”的一部分。当像 ChatGPT、Perplexity、Google Gemini、Claude 及 Microsoft Copilot 等平台的 AI 抓取器 访问您网站以收集信息用于生成答案时,传统的 Google Analytics 往往无法捕捉到这些活动。这使您的分析数据出现了重大盲区,因为这些 AI 系统可能正在阅读并引用您的内容,但却不会产生任何可见的流量指标。其挑战在于,AI 抓取器通常不会执行 JavaScript,而 JavaScript 正是 Google Analytics 4 主要的追踪机制,这意味着大多数 AI 访问在常规分析报告中完全不会被记录。
随着越来越多用户依赖 AI 搜索引擎和答案生成器来替代传统搜索,追踪 AI 流量 变得至关重要。研究显示,AI 抓取器在知识型网站上的请求量可占 5-10%,但这些流量在传统分析平台中完全不可见。了解这些隐藏流量对于制定全面的数字策略非常关键,因为这关系到您的内容在 AI 驱动的搜索环境中是如何被发现和利用的。
识别 AI 流量 最简单的方法是在 Google Analytics 4 中直接手动检查您的流量来源。这无需特殊设置,可立即操作,快速获取 AI 生成流量的概览。进入您的 GA4 属性,依次点击 报告 > 获取 > 流量获取,找到通常默认为 “Session default channel group” 的维度选择器。点击下拉菜单,选择 “Session source / medium” 或 “Session source”,即可查看所有访问您网站的流量来源。
切换到来源视图后,浏览流量来源表,查找可能属于 AI 平台 的条目。常见的来源包括 chatgpt.com、perplexity.ai、edgepilot、edgeservices、copilot.microsoft.com、openai.com、gemini.google.com、claude.ai 及其他 AI 相关域名。为进一步聚焦,可以点击“添加过滤器”,选择“Session default channel group”维度,并将其设置为精确匹配“Referral”。此过滤步骤有助于单独筛选引荐流量,更容易在其中发现 AI 来源。
这种手动方法的主要优点是快捷且易于访问——只需要 GA4 的基础权限即可立即操作。但其主要劣势在于每次想要查看 AI 流量数据 都需要重复上述流程,不适合持续监控和分析。此外,这种方法只能提供快照视图,无法进行趋势分析或历史对比。
若想更规律、便捷地分析 AI 流量,建议创建一个自定义保存报告,这在简单与实用之间取得了良好平衡。这样,您只需在 GA4 报告菜单中点击一次,即可访问 AI 流量数据,无需每次手动设置过滤器。首先进入 GA4 左侧菜单的 库(Library)(需具备相应权限)。找到 “流量获取” 报告,点击右侧三点菜单,选择 “复制” 创建属于自己的自定义版本。
为新报告命名,例如 “AI 流量报告”,如只关注数据表可将顶部图表移除。在维度区域,将 “Session source” 设置为默认维度。关键步骤来了:点击 “添加过滤器”,配置如下。将维度设为 “Session source”,匹配方式选择 “matches regex”,在值字段中输入用管道符(|)分隔的所有 AI 来源 的正则表达式。
追踪主流 AI 平台 的正则表达式推荐为:.*chatgpt.com.*|.*perplexity.*|.*edgepilot.*|.*edgeservices.*|.*copilot.microsoft.com.*|.*openai.com.*|.*gemini.google.com.*|.*nimble.ai.*|.*iask.ai.*|.*claude.ai.*|.*aitastic.app.*|.*bnngpt.com.*|.*writesonic.com.*|.*copy.ai.*|.*chat-gpt.org.*|.*grok.x.ai.*。完成并保存报告后,返回库,找到您的主报告集,点击“编辑集合”,将新建的 “AI 流量报告” 拖入菜单结构,保存后即可永久访问。
这方法的优势在于一键快速访问筛选后的 AI 流量数据,且可根据追踪需求完全自定义。但需编辑者权限才能修改报告库,且任何更改对所有拥有 GA4 访问权限的用户可见,因此团队协同也很重要。
最强大且长期的 AI 流量 追踪方案是创建一个 自定义渠道组,将 AI 流量 作为独立分类整合进所有获取报告。此法让 AI 流量 拥有与“自然搜索”或“付费社交”同等的重要地位,分析视角更全面。重要优势是 自定义渠道组具备追溯性,即设置后会立即应用到所有历史数据,便于马上分析 AI 流量模式。
创建 自定义 AI 渠道组,请进入 GA4 后台 管理 > 数据展示 > 渠道组。点击 “复制以创建新组” 复制 “默认渠道分组”,为其命名,例如“默认渠道组 + AI”。点击 “添加新渠道”,命名为 “生成式 AI” 或 “AI 流量”。在条件区域,将维度设为 “Source”(或 “Session source”),匹配方式选 “matches regex”,输入与前述方法相同的正则表达式,列出所有 AI 来源。
保存新渠道后,务必完成关键的排序步骤:点击 “重新排序”,将新建的 “AI 流量” 渠道拖到靠前位置,最好在 “Referral” 之上。排序很重要,因为 GA4 依次对流量应用渠道规则,您希望 AI 流量 优先被正确归类,而不是落入“引荐”类别。完成后保存新渠道组。在任意获取报告中,将主维度切换为新建 “默认渠道组 + AI”,您就能看到 “AI 流量” 作为独立渠道自动汇总所有相关来源。
| 方面 | 手动检查 | 保存报告 | 自定义渠道组 |
|---|---|---|---|
| 设置时间 | 立即 | 5-10 分钟 | 10-15 分钟 |
| 重复操作 | 高(每次手动) | 低(一键访问) | 无(自动化) |
| 历史数据 | 仅当前 | 仅当前 | 追溯 |
| 权限要求 | 基础 | 编辑者 | 管理员 |
| 集成程度 | 有限 | 中等 | 完整 |
| 适用对象 | 快速快照 | 常规分析 | 全面追踪 |
自定义渠道组的优势非常明显:永久自动应用,可追溯历史数据,在 GA4 内将 AI 流量 作为主渠道,分析更直观、集成性更强。唯一不足是需管理员权限,且属于重要配置变更,建议与团队沟通后实施。
除了 Google Analytics 原生功能,专业 AI 流量追踪工具 可更精确地监控 AI 平台 与您内容的互动。这类平台在服务器层面工作,而不是依赖 JavaScript 追踪,能百分百准确捕捉每次 AI 抓取器访问。与 GA4 遗漏大部分 AI 流量 不同,这些专业工具通过 Cloudflare 集成 或服务器层实现,利用用户代理信息和 IP 验证准确识别每个 AI 系统,详细展示哪些 AI 平台 访问了您的内容。
专业 AI 流量分析平台 能揭示传统分析完全遗漏的指标,包括各 AI 平台 访问量随时间的变化、哪些页面被 AI 系统 访问最频繁、AI 抓取器活动 的日/周/月趋势、最频繁访问您网站的 AI 平台 及您被 AI 抓取最多的内容——这些往往与传统搜索排名明显不同。这些工具还可提供 内容表现分析(显示哪些内容在 AI 答案 中被频繁引用)、技术优化建议(提升 AI 系统 解析内容的能力)、以及 归因映射(将 AI 抓取数据 与网站分析对接,计算由 AI 引荐流量 带来的转化率与 ROI)。
部署这些专业工具通常非常简单,只需几分钟即可设置 Cloudflare Worker,对网站性能零影响。大多数平台支持所有使用 Cloudflare 的网站,未来还会提供 WordPress 插件、Vercel、AWS 及服务器直集成等多种方式。最大优点是这些工具专注于解析 AI 系统 如何与您内容互动,而 Google Analytics 虽擅长追踪真人访客,却难以应对 AI 流量。
要准确解读分析数据,理解 AI 流量 与其他机器人流量的区别非常重要。AI 流量 专指来自 大型语言模型 及 AI 搜索引擎(如 ChatGPT、Perplexity、Google Gemini、Claude、Microsoft Copilot)的访问,这些抓取旨在读取并引用网页内容用于答案生成。而常规 机器人流量 则包括搜索引擎爬虫(Googlebot、Bingbot)、垃圾机器人及其他自动访问,目的各异。传统 GA 通常将所有非真人流量归为一类,无法区分不同类型的机器人,更无从得知哪些 AI 平台 正在访问您的内容。
这种区分的意义在于不同流量类型对业务影响不同。AI 流量 意味着您的内容有机会在 AI 生成答案 中获得曝光,即便用户未点击进入网站也能提升品牌认知度。常规 搜索引擎机器人流量 则关乎传统搜索索引排名。垃圾机器人流量多为负面影响,会干扰分析结果。将 AI 流量 单独分类,您才能制定有针对性的内容优化策略,兼顾 AI 可见性 与传统 SEO。
追踪 AI 流量 已成为不可忽视的企业需求。首先,AI 平台 作为搜索结果的新兴渠道,目前竞争相对较小,比传统搜索更容易获得答案曝光机会。AI 搜索作为最新发现渠道,吸引了希望直接得到答案、无需忍受传统平台广告的用户。其次,了解 AI 驱动流量 的互动内容,能为您的内容策略提供参考,帮助兼顾真人读者与 AI 系统 的偏好。第三,通过流量与用户获取报告,您可以分析 AI 是否带来了新用户或提升了现有用户的参与度。
隐藏流量现象更是关键商业考量。当用户在 ChatGPT 或 Perplexity 提问与您行业相关的问题时,AI 抓取器 会读取您的内容用于答案生成,甚至可能以链接形式引用您的内容。但用户直接在 AI 界面 获得答案,可能永远不会访问您网站。在这种日益常见的场景下,您的内容已产生价值,但传统分析却毫无记录。这些“隐形访问”占据内容实际影响力的日益增长比例,若不单独追踪 AI 流量,您将无法准确评估内容的真实表现。
要高效实施 AI 流量追踪,请先评估自身需求与技术条件。如果只需偶尔查看 AI 流量,手动检查法已足够。若需常规分析,可创建自定义保存报告,便于一键获取 AI 流量数据。如需全面、持续地将 AI 流量 融入分析,应实现 自定义渠道组,将 AI 流量 设为主渠道。若想获得关于 AI 系统 如何与内容互动的最详细洞察,可结合专业 AI 流量分析工具,获得服务器级别追踪和详细表现数据。
无论选择哪种方法,请确保您的正则表达式覆盖全面,并随着新 AI 平台 的出现定期更新。AI 生态 变化迅速,新平台和抓取器不断涌现,您的追踪配置需具备足够的灵活性。记录实施流程并与团队共享,确保 AI 流量数据 的一致性和正确解读。最后,将 AI 流量洞察 纳入整体内容策略,利用这些数据指导内容创作、优化及分发,无论是面向传统还是 AI 驱动 的发现渠道。
实时掌握您的品牌在 AI 生成答案中的展示情况。通过 Amicited 的 AI 监控平台追踪 ChatGPT、Perplexity、Gemini 及其他 AI 搜索引擎的提及、引用及流量。

掌握正则表达式模式,在Google Analytics 4中跟踪来自ChatGPT、Perplexity及其他AI平台的流量。完整技术指南,附逐步实现方法。

了解如何在 Google Analytics 4 中追踪 AI 引荐流量。发现 4 种监控 ChatGPT、Perplexity 及其他 AI 平台的方法,以及优化策略。

关于在Google Analytics 4中追踪AI流量的社区讨论。分析师和营销人员分享识别和衡量来自ChatGPT、Perplexity和其他AI平台流量的真实技术。...
Cookie 同意
我们使用 cookie 来增强您的浏览体验并分析我们的流量。 See our privacy policy.