注册
登录
查看:368 | 回复:11
大姑凉
想问下为什么parse_item方法不执行呀
发表于 2021/12/9 12:38:47
楼主

12.9.1.png

下乡的眼
发表于 2021/12/9 12:41:08
沙发

改成self.parse_item试试


大姑凉
发表于 2021/12/9 12:45:36
板凳

12.9.2.png


这样吗

闪现单杀丈母娘
发表于 2021/12/9 12:46:45
4楼

这是通用爬虫,不是普通爬虫


大姑凉
发表于 2021/12/9 12:47:26
5楼

也不行


12.9.3.png


网上找了好几个 都是这么写的 但是就是不调用callback里面的函数

闪现单杀丈母娘
发表于 2021/12/9 12:51:27
6楼

因为你规则没有匹配到


大姑凉
发表于 2021/12/9 12:55:39
7楼

link = LinkExtractor(allow=r page/\d+\.html ) 这个没有匹配到?


下乡的眼
发表于 2021/12/9 12:59:30
8楼

你不用crawlspider这个模型,


闪现单杀丈母娘
发表于 2021/12/9 13:01:06
9楼

不要用crawlspider

大部分网站都用起来不方便

下乡的眼
发表于 2021/12/9 13:02:20
10楼

还是用LinkExtractor,提取打印出来看看


闪现单杀丈母娘
发表于 2021/12/9 13:05:57
11楼

创建普通爬虫就行


立即注册站大爷用户,免费试用全部产品
立即注册站大爷用户,免费试用全部产品