我想获取这个网页里面的狗的所有图片,写了一个正则想匹配图片的地址,
可是不知道为什么匹配不出结果,下面是小代码,求助各位大神
#!/usr/bin/python # _*_ coding:utf-8 _*_ import re import urllib geturl = urllib.urlopen( http://tieba.baidu.com/p/4570256150 ) urlcode = geturl.read() imgre = r src= (.*?fm=\d{3}) img = re.findall(imgre,urlcode) print(img)
显示的结果是空的列表,
我试过把图片地址直接复制下来匹配,是可以匹配成功的,为什么在原代码中就不行呢?
试试这么匹配呢?src= (.*baidu\.com/forum/.*)
感觉你匹配的图片不太对
这样也不行啊,匹配到的好多都不是图片来的。。。
src= (.*imgsrc\.baidu\.com/forum/.*) 这样,
你可以在正则后面加更多的限制,
这样就能过滤掉那些不是图片的呀
真的可以了,非常感谢!!!
不客气, 这种问题就得多尝试, 慢慢熟练了就好了
好的,我多练练