• python爬取英文名


    爬取某网站名字的详细信息

    部分代码

    # 翻页
        # 每页50条数据
        pageNum = 0
        if counts % 50 == 0:
            pageNum = counts / 50
        else:
            pageNum = counts // 50 + 1
        while page <= pageNum:
            page += 1
            url = url + "/page/{}/".format(page)
            print("========第{}页============".format(page))
            get_contents(url, page)

    获取名细

    def get_detail(url):
        html = requests.get(url, headers=headers, verify=False)
        soup = BeautifulSoup(html.text, "lxml")
        name = soup.find('div', attrs={'class': 'single_baby_name_title'}).find('h1').text  # 获取name
        s = soup.find('div', attrs={'class': 'single_baby_name_description'}).find_all('span')  # 获取Meaning
        Meaning = s[0].text  # 获取Meaning
        Gender = s[1].text  # 获取Gender
        Origin = s[3].text  # 获取Origin

    保存到csv

    # 保存数据到csv
        with open("baby_name.csv", 'a+', encoding="utf-8-sig", newline='') as f:
            csv_writer = csv.writer(f)
            csv_writer.writerow([name, Meaning, Gender, Origin])
            print("=========保存数据成功==========")

    实验中慢慢摸索,总结出不少东西

  • 相关阅读:
    第三章 p62 或运算
    p57 字符串的长度
    p53 ASCII码
    整数类型,如同时钟
    重要:原码、反码、补码...
    p42 实验溢出(上溢)
    P40 字节单位:KMGT
    p38 二、八、十六进制的对应关系
    p13 数组元素的地址
    p11 内存中的数据和地址
  • 原文地址:https://www.cnblogs.com/llbb/p/12081491.html
Copyright © 2020-2023  润新知