基于正则表达式用requests下载网页中的图片

基于正则表达式用requests下载网页中的图片
在慕课网看了正则表达式和requests的课程后，为了加深学习记忆，决定简单记录。

实现步骤：

1、先打开你要下载的网页，查看源码找出图片位置

2、编写正则匹配图片url

3、保存图片到本地

图文步骤：

1、以图虫网为例（https://tuchong.com/），随便点进去个主题（https://mrpig.tuchong.com/14390318/）

定位图片

2、写出正则

通过观察可以发现图片url是以 // 开头以 .jpg结尾的

则正则表达式为 “//.+.jpg”
```
1 import requests
2 import re
3 
4 url='https://mrpig.tuchong.com/14390318/'
5 response = requests.get(url)
6 url_lst = re.findall(r"//.+.jpg",response.text)
7 print url_lst
```
输出

通过拷贝到浏览器，发现前面两个图片不是我们感兴趣的，则把他们切掉 [2:]

3、最后使用一个遍历，将图片保存到本地。

完整代码：
```
 1 import requests
 2 import re
 3 
 4 url='https://mrpig.tuchong.com/14390318/'
 5 response = requests.get(url)
 6 url_lst = re.findall(r"//.+.jpg",response.text)[2:]
 7 i=0
 8 for url in url_lst:
 9     with open(str(i)+".jpg","wb") as fd:
10         #在url前面加上http
11         response=requests.get("http:"+url)
12         fd.write(response.content)
13         print '图片',i,"保存成功
"
14         i+=1
```
相关阅读:
C语言的setlocale和localtime函数（C++也可用）
stdlib.h，string.h，wchar.h的函数列表（cplusplus.com就有，很清楚）goodx
DataSet与JSON互转
 21 步助你成为成功的 Web 开发者（激情不是被动的：它是一种对行动起来的追求）
开发人员与非技术同事沟通的七个聪明策略
 页面架构
 可视化配置以及Net应用MemCache在win7
NPOI以及在ASP.NET MVC中的使用
 TCP/IP协议
 springMVC+angular+bootstrap+mysql的简易购物网站搭建
原文地址：https://www.cnblogs.com/wildbloom/p/6688473.html