注册
登录
查看:321 | 回复:5
demode
scrapy使用CSS或者xpath提取,没有 HTML 标签包括的文本,是咋回事呢
发表于 2023/4/28 12:10:56
楼主

image.png


目前的解决方法是使用 beautifulsoup4, 除了这里的数据其他数据都提取到了,不想为了这个问题再引入 bs4, 请教下 css 或者 xpath 如何实现?


codeby
发表于 2023/4/28 12:12:13
沙发

css: i::text()

xpath: a//i//text()


demode
发表于 2023/4/28 12:13:46
板凳

感谢你的解答, 文本没有在 i 标签里面, 在 i 标签后面


pardon
发表于 2023/4/28 12:16:11
4楼

取 a 标签的内的文本节点集合,取第 1 个索引就是了


bgod
最佳答案 发表于 2023/4/28 12:17:08
5楼

爬虫代理IP

demode
发表于 2023/4/28 12:21:05
6楼

感谢大佬

立即注册站大爷用户,免费试用全部产品
立即注册站大爷用户,免费试用全部产品