• Python爬虫:获取新浪网新闻


    代码

    #coding:utf-8
    
    import requests
    from bs4 import BeautifulSoup
    
    res = requests.get("http://news.sina.com.cn/china/")
    res.encoding = "utf-8"
    
    soup = BeautifulSoup(res.text,'html.parser')
    for news in soup.select('.blk122'):
        # print news
        new_as = news.select("a")
        i = 1
        for news_a in new_as:
            print '第%d条新闻标题:'%i,news_a.text
            i = i+1
    

    结果

    第1条新闻标题: 少将为何带500多名海军未来精英赴欧
    第2条新闻标题: 9月18日 这4艘中国军舰齐聚日本海
    第3条新闻标题: 中国最大市同时调整2名高层 其中1人为跨界入政
    第4条新闻标题: “百名红通人员”王林娟回国投案 已到案45人
    第5条新闻标题: 海军戚继光舰首次远航实习出访 舰上能唱K健身
    第6条新闻标题: 35颗卫星3重天网 中国这个全球定位系统厉害了
    第7条新闻标题: 港中大“标语战”升级 有人贴出:这里就是中国
    第8条新闻标题: 韩媒:萨德问题致韩企对中国直接投资缩水近一半
    第9条新闻标题: 刚与台“断交”三个月 巴拿马总统对中国送祝愿
    第10条新闻标题: 天舟一号与天宫二号分离 最终将陨落太平洋
    第11条新闻标题: 新华社:从金砖国家领导人会晤看五大民生实惠
    
  • 相关阅读:
    rust中的arm交叉编译
    Dockerfile简单编写
    docker常用命令
    linux下tf/u盘格式化
    rust查看支持的架构列表
    linux内核版本修改
    cgo引用外部c文件注意1
    redis服务允许外部ip访问开启
    redis密码修改
    setInterval和setTimeout的使用区别
  • 原文地址:https://www.cnblogs.com/Mysterious/p/7538833.html
Copyright © 2020-2023  润新知