设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
报酬
工算小助手
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
Python
›
郁闷,折腾了一周的爬虫
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
L 站被爆出有盲水印
›
看了《为什么国漫进步这么明显,有人却还是
›
是我的问题还是女朋友的问题
›
见证黄金和白银历史了,涨得时候创造记录,
›
我们是不是处于第四次工业(科技)革命中。
今日热议主题
第一次使用 GPT-5.2 开发项目,为什么我和
聊聊 [因材施教] 吧
为喜欢听 fm 的朋友推荐我写的 chrome 插件
[请教] 软路由 passwall 和 ipv6 的问题
[全职远程] 招聘 Python 工程师
兄弟们 我超了刚刚在外面蒸桑拿差点晕过去
昨天在 reddit 上发了个开源插件介绍,被骂
飞牛这个漏洞 POC 太容易了啊
自媒体吹牛的太多了,现阶段 AI 能力边界?,A
某东就是这样招人的吗?
显示全部
|
最新评论
16 条回复
·
668 次点击
11#
somebody1
初学
2024-8-26 20:33:44
到解码 js 的时候就该用 playwright ,selenium 这种快速搞定,自己的时间比机器的资源值钱
12#
xinghusp
小成
2024-8-26 22:33:59
@guoguobaba 兄弟 别搞了。我正在经历这破事,甚至于对方公司都没有报案也不愿意配合作证,这帮人为了 KPI 还是硬要定罪。我这还是公开接口调用,也无反爬机制。
13#
fbichijing
小成
2024-8-26 23:53:48
@yb2313 我倒觉得适度的爬虫是很有存在的必要性的,至少对个人来说是这样,可以节省很多劳力和时间。至于 js 逆向花的时间就感觉意义较低。验证码我就觉得根本没时间和精力去搞它,客观上都跟不上它的变化速度。这种过于被动的东西就极其难以提起欲望。
14#
jianchang512
小成
2024-8-27 00:28:08
国内即便你遵守 robots.txt, 也一样可能吃牢饭
15#
NoOneNoBody
小成
2024-8-27 00:38:50
最近在重拾前端做自动化,一些网页或网站打开就自动提取信息
不过倒不是爬大量页面,就是打开哪个是哪个,减少一顿 select ctrl-c open ctrl-v close 的手工操作而已
爬虫还是要找些机器一起爬才行,单机单 ip 遇到 5 秒反爬确实搞不了,我以前都是爬外站多,没什么线下问题,最多把我“升级”称为“中国黑客”,笑
16#
zeusho871
小成
2024-8-27 01:04:42
不要实名的话 这个框架好一点 drissionpage
playwright selenium 有特征 不用去特征版本的就会被检测
17#
WeaPoon
初学
2024-8-27 01:53:25
@xinghusp #15 哎。
1
2
/ 2 页
浏览过的版块
Apple
信息安全
北京
返回顶部