• 20201303 2020-2021-2 《Python程序设计》实验四报告


    20201303 2020-2021-2 《Python程序设计》实验四报告

    课程:《Python程序设计》
    班级:2013
    姓名:张奕博
    学号:20201303
    实验教师:王志强
    实验日期:2021年6月19日
    必修/选修: 公选课

    1.实验内容

    Python综合应用:爬虫、数据处理、可视化、机器学习、神经网络、游戏、网络安全等。

    我这次选择了爬虫进行实验操作,爬取了B站每天热门榜上的视频地址,UP名字,id,还有视频播放量和视频名,保存到一个CSV文件中。

    2.实验过程及结果

    目标网站:https://www.bilibili.com/v/popular/rank/all

    工具:python3.9,火狐浏览器

    实验过程:

    2.1导入requests库,然后使用requests对目标网站发起访问

    2.2导入BeautifulSoup,使用其对网站所需提取的信息进行更好的筛选

    2.3爬取所需数据

    先用soup将所有数据取出,然后根据所需数据不同的地址名字,爬取不同的数据






    2.4将数据导入新建的csv文件中,并完善格式

    新建了一个类,将其分类放入其中,并新建了一个vidoes的数组,将数据放入其中,最后依次输出即可
    同理设定了一个csv_title函数,可以直接引用输出开头

    最后全部代码展示


    输出结果展示


    3.码云链接

    https://gitee.com/zhang-yibo/jin222/blob/master/main.py

    4.制作过程中出现的问题

    4.1主要的问题就是找的数据的地址范围太大,无法判断.

    查找了资料,知道了可以用beautifulsoup减少工作量,使整个爬虫更简洁,效率更高。

    4.2出现如下报错


    解决途径:询问同学发现是没有utf-8编码,就加上了encoding='utf-8' 报错就没了。

    课程感悟

    整个python跟下来,感觉讲的是很详细,很有趣,无论是字典,数组,函数的介绍,还是最后的爬虫入门,让我对python有了兴趣,加上之前有一点基础,所以感觉课程难度适中,知识很多,需要练习来巩固。而老师课后发在蓝墨云的视频资料也起到了拓展作用,爬虫,GUI等让我非常感兴趣的,也让我感受到了python的功能强大与方便,希望以后还有更多时间来学习python。

  • 相关阅读:
    QString 与 string转换
    Lua 判断表是否为空方法
    QT 继承QWidget && 继承QDialog
    QNetworkAccessManager
    Lua语言特色
    Lua逻辑操作符
    Lua语言总结
    Lua 函数
    Lua数据类型
    QT 通过QNetworkReply *获取对应请求的URL地址
  • 原文地址:https://www.cnblogs.com/sanfeng-ooo/p/14902753.html
Copyright © 2020-2023  润新知