• Python爬虫入门教程 32-100 B站博人传评论数据抓取 scrapy


    1. B站博人传评论数据爬取简介

    今天想了半天不知道抓啥,去B站看跳舞的小姐姐,忽然看到了评论,那就抓取一下B站的评论数据,视频动画那么多,也不知道抓取哪个,选了一个博人传跟火影相关的,抓取看看。网址: https://www.bilibili.com/bangumi/media/md5978/?from=search&seid=16013388136765436883#short
    在这个网页看到了18560条短评,数据量也不大,抓取看看,使用的还是scrapy。

    20181206202607830.jpg

    在这里插入图片描述

    2. B站博人传评论数据案例—获取链接

    从开发者工具中你能轻易的得到如下链接,有链接之后就好办了,如何创建项目就不在啰嗦了,我们直接进入主题。
    在这里插入图片描述

    我在代码中的parse函数中,设定了两个yield一个用来返回items 一个用来返回requests
    然后实现一个新的功能,每次访问切换UA,这个点我们需要使用到中间件技术。

  • 相关阅读:
    Ubuntu16.04 + OpenCV源码 + Qt5.10 安装、配置
    DML和DQL
    初识MySql
    表单校验
    使用jQuery操作DOM
    jQuery中的事件与动画
    jQuery选择器
    初识jQuery
    JavaScript对象及初识OOP
    JavaScript操作DOM对象
  • 原文地址:https://www.cnblogs.com/hzcya1995/p/13311565.html
Copyright © 2020-2023  润新知