注册
登录
查看:325 | 回复:6
午夜DJ
求助大佬,遇到了python正则表达式的问题
发表于 2023/8/23 14:38:02
楼主

我想获取这个网页里面的狗的所有图片,写了一个正则想匹配图片的地址,

可是不知道为什么匹配不出结果,下面是小代码,求助各位大神


#!/usr/bin/python
# _*_ coding:utf-8 _*_
import re
import urllib
geturl = urllib.urlopen( http://tieba.baidu.com/p/4570256150 )
urlcode = geturl.read()
imgre = r src= (.*?fm=\d{3})  
img = re.findall(imgre,urlcode)
print(img)


显示的结果是空的列表,

我试过把图片地址直接复制下来匹配,是可以匹配成功的,为什么在原代码中就不行呢?

兰陵王
发表于 2023/8/23 14:41:33
沙发

试试这么匹配呢?src= (.*baidu\.com/forum/.*)

感觉你匹配的图片不太对


午夜DJ
发表于 2023/8/23 14:44:42
板凳

这样也不行啊,匹配到的好多都不是图片来的。。。


兰陵王
最佳答案 发表于 2023/8/23 14:45:40
4楼

src= (.*imgsrc\.baidu\.com/forum/.*) 这样,

你可以在正则后面加更多的限制,

这样就能过滤掉那些不是图片的呀


午夜DJ
发表于 2023/8/23 14:47:58
5楼

真的可以了,非常感谢!!!


兰陵王
发表于 2023/8/23 14:51:36
6楼

不客气, 这种问题就得多尝试, 慢慢熟练了就好了


午夜DJ
发表于 2023/8/23 14:56:16
7楼

好的,我多练练

立即注册站大爷用户,免费试用全部产品
立即注册站大爷用户,免费试用全部产品