用Python写了个抓图小脚本

看上这个网页上一张图了，可惜他没有提供右键另存为，看了下网页代码，是可以找到图片原始链接的！但是因为没法和现实的图片一一对应，图又多，所以找起来还是麻烦。。。然后，我就想用 Python 把他们全部拉下来再找了。

下面是代码：

#coding=utf-8

import urllib
import re

def downloadPage(url):
    h = urllib.urlopen(url)
    return h.read()

def downloadImg(content):
    pattern = r'href="(.+?.jpg)" class'
    m = re.compile(pattern)
    urls = re.findall(m, content)

    for i, url in enumerate(urls):
        print url
        urllib.urlretrieve(url, "%s.jpg" % (i, ))

content = downloadPage("http://www.viajesalazul.com/holiday/lo-mejor-de-portugal-11-dias/")
downloadImg(content)

话说，学了正则表达式要常常练习啊，恩，代码有借鉴另一作者的（代码放硬盘里好久了，原始作者已无从查找），自己改了下正则表达式。

相关阅读:
在 json4s 中自定义CustomSerializer
【重点】2020年宝山区义务教育阶段学校校区范围与招生计划（小学）
2019宝山区小升初对口地段表及对口初中片区划分
2019上海市各区重点幼儿园、小学和中学排名（建议收藏）
转:一千行MYSQL 笔记
基于weixin-java-mp 做微信JS签名 invalid signature签名错误官方说明
转 : 深入解析Java锁机制
微服务架构转型升级
抽奖活动 mark
抽奖 mark

原文地址：https://www.cnblogs.com/pied/p/4660674.html