设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
报酬
工算小助手
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
网站根目录下设置的 robots.txt 规则现在爬虫机器人不遵 ...
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
新加坡机场入境居然没有安检?
›
新手恋爱求后续指导
›
自从有了小孩后家庭矛盾越来越多,大家帮我
›
1 月 20 号失业, 2 月 1 号离婚,还有更快
›
2026 年了,前端开发还能学点啥
今日热议主题
百度网盘招聘安卓开发, 初/中/高级都需要,
请问我这样的使用场景有没有什么好的方案?
今天被淘宝闪购坑了.....
已大规模发布的漏洞不叫 0day !
求推荐手机/平板远程操作控制台式/笔记本上
夸克这是给整个浏览器下访问的所有网站都上
出老婆的 ddr4 3200 内存条
一月 GLM Coding Pro Token 消耗六个亿
每月例行更新: 1 月工作了 301 小时
mac mini 用罗技鼠标老是会飘,有没有什么
显示全部
|
最新评论
16 条回复
·
1855 次点击
11#
laobaiguolai
初学
2025-10-17 10:06:42
用的 cloudflare ,他们家的识别和阻止能力还是可以的
12#
opengps
初学
2025-10-17 10:07:22
我最近刚好做了相关的,搜索引擎的爬虫,至少人家 UA 是明确的,虽然可以轻松伪造,但如果你不想,可以从 UA 入手拦截官方的爬虫。(按伦理来讲,至少官方的爬虫不至于明目张胆伪造 UA )。 顺便附赠几个最近关注到的 主要的 AI 爬虫 UA 关键字:"mj12bot","openai","gptbot","claudebot","semrushbot","siteauditbot"
13#
charles0
初学
2025-10-17 10:33:10
还有伪装 UA 的爬虫呢,要解决可以试试 Cloudflare 或 https://anubis.techaro.lol/
14#
ZeroClover
小成
2025-10-17 11:44:05
你发的日志里面 GPTBot 都是假的,和官方公布的 IP 对不上 https://platform.openai.com/docs/bots
15#
edak
初学
2025-10-17 12:06:20
君子协议
16#
Ketteiron
初学
2025-10-17 12:17:19
有挂 waf 吗,现在一个小网站/博客都没几个活人看,却被几百个 bot 轮番轰炸
17#
shinciao
初学
2025-10-17 13:05:55
现在 AI 的爬虫会访问除了 robots.txt 之外的所有文件
1
2
/ 2 页
浏览过的版块
Apple
酷工作
返回顶部