AI 爬虫

Question 1

我应该封锁 AI 爬虫来保护我的内容吗？

Answer

封锁 AI 爬虫会阻止您的内容出现在 AI 生成的答案中。对大多数品牌而言，这是有害的——它使品牌在 AI 系统回答其类别问题时被排除在外。只有在您有法律或商业原因需要特别退出大型语言模型训练数据集时，才应封锁特定爬虫。

Question 2

如何检查我的网站目前封锁了哪些 AI 爬虫？

Answer

检查您的 robots.txt 文件（yourdomain.com/robots.txt）中是否有针对 GPTBot、ClaudeBot、Google-Extended 和 PerplexityBot 的 Disallow 指令。AnswerAtlas AI 可见度审计会在第一步骤中自动检查此项目。

Question 3

AI 爬虫会遵守 robots.txt 吗？

Answer

主要 AI 爬虫——GPTBot、ClaudeBot、Google-Extended——声明它们遵守 robots.txt。PerplexityBot 也遵守 robots.txt 指令。较小型或较新的 AI 平台的合规性不太一致，但大多数主要平台公开承诺遵守 robots.txt 的退出设置。

爬虫名称	运营方	主要用途	User-agent 字符串
GPTBot	OpenAI	训练 + ChatGPT Search	`GPTBot`
OAI-SearchBot	OpenAI	ChatGPT Search 检索	`OAI-SearchBot`
ClaudeBot	Anthropic	训练 + Claude 浏览	`ClaudeBot`
Google-Extended	Google	AI 概览 + Gemini	`Google-Extended`
PerplexityBot	Perplexity	Perplexity 搜索	`PerplexityBot`

AI 爬虫

主要 AI 爬虫

robots.txt 配置

Frequently Asked Questions

相关术语

想知道你的品牌在 AI 答案中是被提及，还是被竞品取代？