• 用BeautifulSoup简单爬取BOSS直聘网岗位


    用BeautifulSoup简单爬取BOSS直聘网岗位

    • 爬取python招聘
    import requests
    from bs4 import BeautifulSoup
    
    def fun(path):
        r1 = requests.get(url=path,
                          headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3676.400 QQBrowser/10.4.3469.400'},
                          )
        soup = BeautifulSoup(r1.text,'html.parser')
        div = soup.find(name='div',id='main')
        info  = div.find(name='div',attrs={'class':'job-list'})
        li = info.find_all(name='li')
        f = open('boss直聘.txt','a',encoding='utf-8')
        for i in li:
            job = i.find(name='div',attrs={'class':'job-title'})
            red = i.find(name='span',attrs={'class':'red'})
            company = i.find_all(name="a")
            em = i.find_all(name='p')
    
            info = "%s|%s|%s|%s|%s"%(job.text,red.text,em[0].text,em[1].text,company[1].text)
            f.write(info+'
    ')
        f.close()
    for i in range(1,11):
        path = 'https://www.zhipin.com/c101010100-p100109/?page=%d&ka=page-%d'%(i,i)
        fun(path)
    

    此代码仅供学习使用。

  • 相关阅读:
    2月24日-寒假进度24
    2月23日-寒假学习进度23
    2月22日-寒假学习进度22
    2月21日-寒假学习进度21
    第一周冲刺意见汇总
    团队绩效评估
    团队工作第七天
    团队工作第六天
    团队工作第五天
    团队工作第四天
  • 原文地址:https://www.cnblogs.com/xujunkai/p/11048246.html
Copyright © 2020-2023  润新知