Python从网页上爬取图片

在搜索壁纸的时候，想把壁纸保存到本地，一张一张的保存太过麻烦，所以想到用Python来爬取壁纸。

设计思路：

1.首先先去找有壁纸的网页：

http://www.acfun.cn/a/ac3345210

2.然后使用urllib.request解析网页得到网页源代码

html= urlopen(url)
bs0bj=BeautifulSoup(html,"lxml")

3.然后使用正则表达式检索图片链接：

imglist = bs0bj.findAll("img",{"src":re.compile("http://imgs.*?live.*?jpg")}

4.最后将图片下载到本地：

urlretrieve(url,'e:\test\%s.jpg'%name)

源码：

 1 from urllib.request import urlopen
 2 from urllib.request import urlretrieve
 3 from bs4 import BeautifulSoup as da
 4 import re
 5 ulist=[]
 6 localDir = 'D:ImageDownload2017-5-7'
 7 def getlink(url):
 8     html= urlopen(url)
 9     bs0bj=da(html,"lxml")
10     imglist = bs0bj.findAll("img",{"src":re.compile("http://imgs.*?live.*?jpg")})            
11     for img in imglist:
12         imgdict=dict(img.attrs)#将检索的字符串转换为字典
13         imgt=imgdict['src']#提取链接
14         ulist.append(imgt)#将图片链接存放到一个列表里
15     return(ulist)
16 
17 ur="http://www.acfun.cn/a/ac3345210"
18 urllist=getlink(ur)#获取图片链接
19 b=len(urllist)
20 name=0
21 localname = localDir+str(name)
22 for url in urllist:
23     urlretrieve(url,'e:\test\%s.jpg'%name)#下载图片并将图片用数字命名
24     name+=1
25     print(int((name/b)*100),'%')

运行后，图片保存在E：\test;

相关阅读:
Mac安装WineHQ
Ubuntu 16.04下使用Wine安装文件比对工具Beyond Compare 4
Ubuntu 16.04下安装WineHQ
Ubuntu 16.04下使用Wine安装PowerDesigner15
Ubuntu 16.04下使用Wine安装Windows版的微信（不太完美）
Ubuntu 16.04下使用Wine安装Xshell 4和Xftp 4
MySQL中数据类型（char(n)、varchar(n)、nchar(n)、nvarchar(n)的区别）（转）
Ubuntu 16.04安装MongoDB的GUI工具RoboMongo
Linux下Shell的快捷键（转）
Jackson反序列化错误：com.fasterxml.jackson.databind.exc.UnrecognizedPropertyException: Unrecognized field的解决方法

原文地址：https://www.cnblogs.com/wanglei0103/p/6844161.html