注册
登录
查看:382 | 回复:13
暗香
大哥们帮帮孩子吧,我要爬这个页面里的所有停用通知
发表于 2021/9/27 12:34:30
楼主

9.27.1.jpg



只要停用通知,要过滤掉其他的信息

屿.
发表于 2021/9/27 12:39:20
沙发

用xpath

暗香
发表于 2021/9/27 12:40:15
板凳

我使用的WebMagic

咋过滤啊

阿风
发表于 2021/9/27 12:41:04
4楼

xpath感觉可以

暗香
发表于 2021/9/27 12:45:04
5楼

主要是li都一样啊

就title不同

我要获取的是所有停用通知的url

阿风
发表于 2021/9/27 12:47:47
6楼

xpath可以选择第几个,也能找属性

暗香
发表于 2021/9/27 12:49:41
7楼

找属性,但是title里的内容不一样啊


9.27.2.jpg

屿.
发表于 2021/9/27 12:50:42
8楼

属性定位

暗香
发表于 2021/9/27 12:51:57
9楼

属性是啥

阿风
发表于 2021/9/27 12:53:09
10楼

就是title后面等于的东西

屿.
最佳答案 发表于 2021/9/27 12:54:26
11楼

你定位一下位置

然后找相同点

找到相同点做属性定位就可以了

立即注册站大爷用户,免费试用全部产品
立即注册站大爷用户,免费试用全部产品