python3爬取高清壁纸(1)

我们先随机选取一个专辑来爬( http://www.win4000.com/wallpaper_detail_54520.html ).

后面再把整个卡通动漫类别的所有专辑的壁纸爬下来。

代码如下：

import requests
from bs4 import BeautifulSoup
import os

#爬取的网站：http://www.win4000.com/wallpaper_detail_54520.html

def Get_image_url(url):
    #传入页面的URL，得到所有图片所在的标签和图册的名字，并返回
    
    Res = requests.get(url)
    Soup = BeautifulSoup(Res.text,'lxml')
    
    Name = Soup.select('h1')[0].string
    Tag = 'img[title="' + Name + '"]'
    Image = Soup.select(Tag)
    
    return Image,Name

def Download_Image(Image_url):
    #传入图片的URL，将图片保存在本地
    Image = requests.get(Image_url,stream=True)
    #将链接的最后一个字符串最为图片的名字
    name = Image_url.split('/')[-1]
    #保存图片
    with open(name,'wb') as f:
        f.write(Image.content)

def main():
    #主调函数
    url = "http://www.win4000.com/wallpaper_detail_54520.html"
    [Image,Name] = Get_image_url(url)
    #print(Name,Image)
    #保存当前目录
    path = os.getcwd()
    #创建保存图片的目录
    os.mkdir(Name)
    os.chdir(path + '/' + Name)
    for I in Image:
        Download_Image(I['src'])
    #返回之前的目录
    os.chdir(path)
if __name__ == '__main__':
    main()

注：如果是Windows下，将进入文件夹的命令 [ os.chdir(path + '/' + Name) ] 改为：os.chdir(path + '\' + Name)

相关阅读:
Nim or not Nim? HDU
邂逅明下 HDU
4.1.8 巴什博弈
4.1.7 Cutting Game(POJ 2311)
0.1.2 max_element和min_element的用法
bzoj 2152 聪聪可可树形dp
hdu 5976 Detachment 脑洞题猜结论
hdu 5974 A Simple Math Problem gcd(x,y)=gcd((x+y),lcm(x,y))
hdu 5971 Wrestling Match 二分图染色
Codeforces 842C Ilya And The Tree 树上gcd

原文地址：https://www.cnblogs.com/jxc321/p/7337820.html