您现在的位置是:摩砺以须网 > 百科
谷歌推出爬虫扩展代理 网站管理员可以屏蔽谷歌抓取内容用于训练AI – 蓝点网
摩砺以须网2026-01-15 11:19:43【百科】8人已围观
简介在 OPENAI 公布 GPTBot 爬虫的相关信息后,今天谷歌宣布在 GoogleBot 基础上推出 Google-Extended 爬虫扩展代理,允许网站管理员使用 robots.txt 文件屏蔽
在 OPENAI 公布 GPTBot 爬虫的谷歌管理谷歌相关信息后,今天谷歌宣布在 GoogleBot 基础上推出 Google-Extended 爬虫扩展代理,推出允许网站管理员使用 robots.txt 文件屏蔽谷歌抓取网站内容用来训练 AI 模型。爬虫屏蔽
谷歌没有推出单独的扩展 AI 爬虫,AI 爬虫仍然使用 GoogleBot,代理但网站可以声明是网站网否拒绝其抓取内容后训练 AI,如果要声明那就需要使用 Google-Extende代理令牌。员可用于

谷歌称,内容Google-Extended 是训练一种新控件,网络发布商可以使用它管理其网站是蓝点否有助于改进 Bard 和 Vertex AI 等生成式 AI 模型,在博客中谷歌多次提到网站可以帮助谷歌改进 AI,谷歌管理谷歌比如网站管理员可以选择是推出否帮助这些 AI 模型随着时间推移变得更准确和强大。
不过最终还是爬虫屏蔽网站管理员自己决定是否允许谷歌拿内容去训练 AI,如果不愿意的扩展话,可以在 robots.txt 中添加以下内容:
User-Agent: Google-ExtendedDisallow:/
需要提醒的代理是谷歌对于 robots.txt 的处理遵循了多种原则,而且 Google Bot 本身有一大堆用于不同用途的 bot,例如常规的 GoogleBot、GoogleBot-News、GoogleBot-Image 等,这些 bot 是可以在 robots.txt 里混用的。
例如要允许谷歌搜索抓取网站内容、不允许谷歌抓取内容用于训练 AI,那么 robots.txt 可以这么写:
User-Agent: GooglebotAllow: /User-Agent: Google-ExtendedDisallow: /
很赞哦!(87)
站长推荐
友情链接
- 《战役机器5》“无贫形式”将于Gamescom 2019公开
- 真过瘾!RPCS3摹拟器能以4K/60fps运转《恶魔之魂》
- 国产友尽小游戏 《您抓没有到我》Steam多数好评
- 3DM《鬼哭邦》试玩版汉化下载 鬼人附身战役吧!
- 足游《青丘狐传讲》即将开启公测 灵羽体系大年夜掀秘
- 《灭亡停顿》为何值得等候
- 130万恩敌被誉灭 《幽港迷乡》民圆公布感激疑
- 日本收卖一空的《岔路旅人》音乐会光碟将正在北好上市
- 颜值与真力并存 《艾德我冒险》百变塔罗剧透
- 《巫师3》音乐MOD公布 带去16尾齐新配乐
- 云顶之弈棋子怎么分级 云顶之弈棋子分级参考表一览
- DNF荧紫之星河光环属性一览 DNF荧紫之星河光环外观展示
- 忘川风华录百象轮转第三关噩梦难度攻略分享
- 惊喜 卡普空暗示洛克人新作尚在开发
- 商家买菜用什么app好 适合商家买菜的软件大全
- 茶杯物语材料收集攻略大全
- 索尼公布2月PS+游戏 2月6日至3月4日期间开放
- 刀塔霸业怎样构筑阵容流派呢 刀塔霸业阵容流派构筑技巧攻略分享
- 古魂古神共斗玩法详解
- 米哈游《绝区零》公布新预告 将登陆PS5平台







