注册
登录
查看:376 | 回复:8
今天十点起床
这个输出,怎么是空呢,这是怎么回事
发表于 2022/8/24 8:09:58
楼主

DFCJKQ56]GQJR0XG3PE[IVW.png

今天十点起床
发表于 2022/8/24 8:14:12
沙发

/div/div表示第2个子节点吧,我哪个输出怎么是[]呢

喵喵
发表于 2022/8/24 8:17:59
板凳

不用HTML,这个里面放网页

一千零一夜
发表于 2022/8/24 8:22:35
4楼

用py写前端?

喵喵
发表于 2022/8/24 8:23:45
5楼

把HTML改成XML

HTML的括号里放的是网页源代码

放html文件用的是parse()

我的lxml模块里没有etree方法不知道为啥


blog
发表于 2022/8/24 8:24:49
6楼

用bs4好了

潜水1
发表于 2022/8/24 8:29:09
7楼

B(}FFXX6LS51SFMQ8ZPCSOS.jpg

用哪个都行

潜水1
发表于 2022/8/24 8:30:41
8楼
####
h_xml = etree.XML(str_)
print(h_xml.xpath( //div[@class= level ]/text() ))
h_xml1 = etree.HTML(str_)
print(h_xml1.xpath( //div[@class= level ]/text() ))
print(re.findall(  (.*?)  , str_))
html = parsel.Selector(str_)
print(html.xpath( //div[@class= level ]/text() ).extract())
soup = BeautifulSoup(str_,  lxml )
list_ = [item.text for item in soup.select( div   div )]
print(list_)
####
[ 什么是Java ,  Java的版本 ]
[ 什么是Java ,  Java的版本 ]
[ 什么是Java ,  Java的版本 ]
[ 什么是Java ,  Java的版本 ]
[ 什么是Java ,  Java的版本 ]


今天十点起床
发表于 2022/8/24 8:31:33
9楼

多谢各位大佬

立即注册站大爷用户,免费试用全部产品
立即注册站大爷用户,免费试用全部产品