第十二节豆瓣电影实战

import requests
from lxml import etree


headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36',
    'Referer':'https://pagead2.googlesyndication.com/pagead/s/cookie_push.html'
}
url = 'https://movie.douban.com/cinema/nowplaying/fuzhou/'
resp = requests.get(url, headers = headers)
text = resp.text
html = etree.HTML(text)
ul = html.xpath('//ul[@class="lists"]')[0]
lis = ul.xpath('./li[@class="list-item"]')
movies = []
for li in lis:
    title = li.xpath('@data-title')
    score = li.xpath('@data-score')
    star = li.xpath('@data-star')
    duration = li.xpath('@data-duration')
    region = li.xpath('@data-region')
    director = li.xpath('@data-director')
    actors = li.xpath('@data-actors')
    movie = {
        "title":title,
        "score":score,
        "star":star,
        "duration":duration,
        "region":region,
        "director":director,
        "actors":actors
    }
    movies.append(movie)
for m in movies:
    print(m)

相关阅读:
数组方法总结
CSS3总结
关于h5的一些知识整理
如何去掉iview里面的input，button等一系列标签自带的蓝色边框
CSS隐藏多余的文字
百度搜索之历史搜索记录~
transform相关~
有关数组的相关知识~~
[Javascript]js中所学知识点回顾总结
js_随即生成多位验证码及变换颜色

原文地址：https://www.cnblogs.com/kogmaw/p/12506966.html

第十二节 豆瓣电影实战

第十二节豆瓣电影实战