下载网页图片小爬虫getjpg

kavin Python 2018-05-07 2355浏览 0

最近学习python，根据教程自己编写了一段采取网页上图片的脚本，

导入模块，定义函数，筛选图片信息，并制定下载位置。

代码如下，仅供大家参考：

#!/usr/bin/python
import re
import urllib
def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html
def getImg(html):
    reg = r'src="(.*?\.jpg)'  #定义图片格式
    imgre = re.compile(reg)
    imglist = re.findall(imgre,html)
    x = 0
    for imgurl in imglist:
        urllib.urlretrieve(imgurl,'%s.jpg' % x)
        x+=1
html = getHtml("http://tieba.baidu.com/p/5235046213?see_lz=1")  #地址换成你想要采集图片的地址
print getImg(html)

转载请注明：IT运维空间 » Python » 下载网页图片小爬虫getjpg