死党暗恋校花失败，我爬了这个网站发给他分分钟治愈，男人的快乐往往很简单（每天一遍，忘却初恋）

死党一直暗恋校花，但是校花对他印象也不差，就是死党一直太怂了，不敢去找校花，直到昨天看到校花登上了校董儿子的豪车，死党终于彻底死心，大醉一场，作为他的兄弟，我怎么能看他郁郁不振呢？

为了让他忘掉校花，走出阴影，我于是决定把我新收藏的网站分享给他，顺便分享给大家，纯纯的交流技术，大家备好纸巾，不对，备好纸笔

在这里插入图片描述
效果如下

在这里插入图片描述

爬取目标

网址：（实在是不敢放，满满的求生欲，官方大佬手下留情）
在这里插入图片描述

兄弟们啊，不要怪我，不打码不行啊，我是来交流技术的。

要用的工具

软件：

python 3.8
pycharm 2021专业版

模块：

requests
parsel

没有模块 pip 安装模块即可

流程解析

我们首先就是先进入到这个网址，向网站发送网络请求。

然后去拿到它的网页源代码数据，右键点击，查看他的网页源代码。

我们访问网站拿到的数据就是它。
在这里插入图片描述

后续的步骤我就不截图了，可以看我视频讲解。

获取到数据后，我们要去解析数据，筛选我们想要的内容，相册详情页地址，标题等等。

然后向详情页发送请求并解析数据，再向图片链接发送请求，获取图片二进制数据，最后保存图片。

详细步骤我都在视频里讲了，大家可以在这里看视频讲解，还有多线程版本

实现代码

import requests
import parsel
import re
import os

for page in range(1, 11):
    print(f'==================正在爬取第{page}页==================')
    # 1.向目标网站发送请求（get，post）
    response = requests.get(f'https://www.网站不提供，想用来实践技术的话可以私我拿.com/page/{page}')
    # 2. 获取数据（网页源代码）
    data_html = response.text
    # 3. 解析网页（re正则表达式，css选择器，xpath，bs4，json） 提取每一个详情页的链接与标题
    zip_data = re.findall('<a href="(.*?)" target="_blank"rel="bookmark">(.*?)</a>', data_html)
    for url, title in zip_data:
        print(f'----------------正在爬取{title}----------------')
        if not os.path.exists('img/' + title):
            os.mkdir('img/' + title)
        # 4. 向详情页发送请求
        resp = requests.get(url)
        # 5. 获取数据（网页源代码）
        url_data = resp.text
        # 6. 解析网页 （提取图片链接）
        selector = parsel.Selector(url_data)
        img_list = selector.css('p>img::attr(src)').getall()

        for img in img_list:
            # 7. 向图片链接发送请求
            # 8. 获取数据（图片二进制数据）
            img_data = requests.get(img).content
            # 9. 保存数据
            img_name = img.split('/')[-1]
            with open(f"img/{title}/{img_name}", mode='wb') as f:
                f.write(img_data)
            print(img_name, '爬取成功！！！')
        print(title,'爬取成功！！！')

#兄弟们学习python，有时候不知道怎么学，从哪里开始学。掌握了基本的一些语法或者做了两个案例后，不知道下一步怎么走，不知道如何去学习更加高深的知识。
#那么对于这些大兄弟们，我准备了大量的免费视频教程，PDF电子书籍，以及视频源的源代码！
#还会有大佬解答！
#都在这个群里了 924040232
#欢迎加入，一起讨论 一起学习！

暗恋单恋都不可靠，还是要胆大脸皮厚，主动一点到手了才有结果，不然女朋友都是别人的了，祝大家有情人终成眷属，没有的2022年那必有！

在这里插入图片描述

欢迎大家一起在评论中讨论技术，编程嘛，不能一味死板，要灵活有趣才有动力，不低俗不违法，一起进步！

相关阅读:
敏捷软件开发——迭代计划版本号
 01背包问题
 南邮算法分析和实验设计1 分而治之
 PowerShell与Unix Shell对比：八大实例
 grep、sed、awk、perl、js、vim等对正则表达式的支持的差别
 perl的一些基本用法
 Lua学习笔记1
在eclipse中建立lua开发环境
 MYSQL设置远程账户登陆总结，mysql修改、找回密码、增加新用户，MySQL数据库的23个注意事项
 LuaForWindows_v5.1.4-45和lua-5.1.4.tar.gz
原文地址：https://www.cnblogs.com/hahaa/p/15883323.html