注册
登录
查看:354 | 回复:9
happy
抓取这个产品的标题,文案,图片,售价,参数,不能用selenium怎么搞
发表于 2022/4/22 18:38:19
楼主

image.png

西木头
发表于 2022/4/22 18:39:13
沙发

不能用selenium

这个难度就上去了啊

前尘往事
发表于 2022/4/22 18:43:00
板凳

req bs4不是都行

抱紧
发表于 2022/4/22 18:47:52
4楼

除了selenium也有别的东西吧

他也没说不能开浏览器

抓这个很容易,油猴

亚马逊
发表于 2022/4/22 18:49:39
5楼

直接给你来个pyautogui

怕菌
发表于 2022/4/22 18:52:12
6楼

我用过pyautogui爬过

效率不行但是

抱紧
发表于 2022/4/22 18:53:52
7楼

多进程+selenium

或者多进程开浏览器,然后插件去爬

比如油猴,浏览器插件

现在网站都不好怼req

要分析的东西太多了

三问
发表于 2022/4/22 18:56:55
8楼

人家说不让用se 就是看你请求和反反爬能力

抱紧
发表于 2022/4/22 18:58:40
9楼

只允许用request的方式

你能爬到?

西木头
发表于 2022/4/22 19:01:53
10楼

那是tls校验

也有办法搞

立即注册站大爷用户,免费试用全部产品
立即注册站大爷用户,免费试用全部产品