当前位置：网站首页技术文章正文

如何禁止OPENAI的爬虫(GPTBot)抓爬网站附该爬虫的IP地址网段

来源：互联网发布时间：2024-08-24 07:50:31

OPENAI 利用自己的网络爬虫在互联网上抓取信息，这些信息经过分类整理后，用来继续训练GPT系列模型。

当然可能会有网站和出版商觉得OPENAI这是在白嫖自己，所以OPENAI公布爬虫和 IP 地址网段供网站屏蔽。

这个爬虫遵守网站提供的robots.txt协议 , 网站和出版商不想被OPENAI抓取内容即可按照提示进行屏蔽操作。

OPENAI提供的说明：

OPENAI使用GPTBot用户代理抓取的网页可能用于改进未来的模型，同时会过滤掉某些付费才能访问的内容。

另外：基于OPENAI的政策，如果网页中包含个人身份信息或其他违规内容，则GPTBot也会删除这部分网页。

允许GPTBot访问您的站点可帮助 AI 模型变得更加准确并提高其总体功能和安全性，但也允许网站屏蔽抓取。

如何禁止OPENAI的爬虫(GPTBot)抓爬网站附该爬虫的IP地址网段

以下是爬虫信息和屏蔽方法：

爬虫名称：GPTBot 该爬虫使用的网段为40.83.2.64/28 你可以使用nslookup命令来判断GPTBot爬虫真假。

# 以下是爬虫的完整UA信息Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)

如果想禁止GPTBot抓爬你的内容，你可以在robots.txt中写入指令，爬虫检测到该指令后会按照指令要求操作。

# 完全禁止GPTBot抓取内容User-agent: GPTBotDisallow: /# 完全允许GPTBot抓取内容(不禁止即默认允许、所以下面的非必须)User-agent: GPTBotAllow: /# 完全允许的另一种作用：当禁止其他所有爬虫但允许 GPTBot 时则必须声明以下内容# 禁止所有爬虫但仅允许 GPTBotUser-agent: *Disallow: /User-agent: GPTBotAllow: /# 允许GPTBot抓取特定内容User-agent: GPTBotDisallow: /Allow: /路径1/...Allow: /路径2/...

查看GPTBot的抓爬记录：

OPENAI毕竟不是传统的搜索引擎提供商，所以并没有站长平台 , OPENAI不提供爬虫的抓爬频次等相关设置。

网站管理员可以搜索自己的网站日志检查GPTBot的抓爬记录，打开网站日志后搜索GPTBot关键词即可查看。

相关教程

[技巧] 开启谷歌浏览器IP保护功能可以隐藏真实IP地址保护隐私此前谷歌浏览器正在开发名为 IP 保护的新功能，该功能旨在将部分连接通过隐私服务器进行中转，这样广告网络无法获取用户的真实 IP 地址
技术文章 08-22
马斯克表示，比尔盖茨对人工智能的理解过于有限，多年来一直如此。 3月28日消息，AI工具已经席卷全球，许多商业领袖也注意到了这一趋势。微软联合创始人比尔盖茨(Bill Gates)最近撰文称，“AI时代已经到来”
技术文章 06-28
Runway：Gen-3 Alpha全面开放，所有人都能使用 AIHub最新消息，7月2日凌晨，知名的生成式AI平台Runway宣布了一个令人振奋的消息——它的文生视频模型Gen-3 Alpha，向全世界敞开了大门，
技术文章 07-06

产业资讯

游戏下载 +

龙之战权力的遗产最新版

类型：游戏下载大小：589.00M
下载
地牢突变手游官方版

类型：游戏下载大小：809.00M
下载
机甲警卫官方版

类型：游戏下载大小：1740.79M
下载
救世主火柴人最新版(SaviorThe Stickman)

类型：游戏下载大小：494.00M
下载
非请勿入中文版

类型：游戏下载大小：240.63M
下载

近期热点 +

最新技术文章 +

08-24

[脚本] 一键跳过CPU/TPM等硬件要求直装Windows 11各种版本昨天提到微软在镓分支版本 (Ga) Windows 11 Can Build 25905 版修改了一些东西，导致在线升级时原本使用的注册表跳过 TPM CPU 检
08-24

[教程] 在硬件不满足要求的Windows 11上在线安装/更新安卓子系统是时候更新更新教程喽！2023年8月微软删除Windows 11安卓子系统的CPU限制，任何CPU均可安装WSA而日前发现即便是国内用户也可以通过微软商
08-24

谷歌新广告政策会将你的兴趣分享给广告商下面是如何在谷歌浏览器中禁用从今年夏季开始谷歌就推出 Topics API，这个 API 可以让浏览器与第三方共享有关用户兴趣的信息，同时保护隐私。当然这只是谷歌的说法，
08-24

[技巧] Windows 11开发版开始菜单推荐部分可以折叠内容下面是开启方法在Windows 11 Dev Build 23545版中，微软继续对开始菜单进行微调，本次微调的是开始菜单的推荐部分。开始菜单固定的应用程序部分目前已
08-24

升级Windows 11 Moment 4后没有新功能？试试这个方法开启目前有不少网友更新到Windows 11 22H2 23H2最新版，这些版本中均包含Windows 11 Moment 4更新。这次更新包含大量的新功能，例如资源管

如何禁止OPENAI的爬虫(GPTBot)抓爬网站 附该爬虫的IP地址网段

如何禁止OPENAI的爬虫(GPTBot)抓爬网站附该爬虫的IP地址网段