/div/div表示第2个子节点吧,我哪个输出怎么是[]呢
不用HTML,这个里面放网页
用py写前端?
把HTML改成XML
HTML的括号里放的是网页源代码
放html文件用的是parse()
我的lxml模块里没有etree方法不知道为啥
用bs4好了
用哪个都行
#### h_xml = etree.XML(str_) print(h_xml.xpath( //div[@class= level ]/text() )) h_xml1 = etree.HTML(str_) print(h_xml1.xpath( //div[@class= level ]/text() )) print(re.findall( (.*?) , str_)) html = parsel.Selector(str_) print(html.xpath( //div[@class= level ]/text() ).extract()) soup = BeautifulSoup(str_, lxml ) list_ = [item.text for item in soup.select( div div )] print(list_)
#### [ 什么是Java , Java的版本 ] [ 什么是Java , Java的版本 ] [ 什么是Java , Java的版本 ] [ 什么是Java , Java的版本 ] [ 什么是Java , Java的版本 ]
多谢各位大佬