python爬虫--小猪短租的租房信息

利用requests获取网页
利用Beautifulsoup4和lxml解析网页

具体代码如下

from bs4 import BeautifulSoup
import requests

url = 'http://bj.xiaozhu.com/fangzi/1508951935.html'
web_data = requests.get(url)
soup = BeautifulSoup(web_data.text, 'lxml')

title = soup.select('div.pho_info > h4 ')[0].text
address = soup.select('div.pho_info > p ')[0].get('title')
price = soup.select('div.day_l > span')[0].text
first_pic = soup.select('#curBigImage')[0].get('src')
landlord_pic = soup.select('div.member_pic > a > img')[0].get('src')
landlord_name = soup.select('div.w_240 > h6 > a')[0].text
if soup.select('span[class="member_girl_ico"]'):
landlord_gender = 'female'
else:
landlord_gender = 'male'

data = {
'title': title,
'address': address,
'price': price,
'first_pic': first_pic,
'landlord_pic': landlord_pic,
'landlord_name': landlord_name,
'landlord_gender': landlord_gender
}
print(data)

相关阅读:
Anaconda-navigator 打不开的解决方法（亲测有效！）
Python3.7安装keras和TensorFlow的教程图解
win10环境下使用anaconda安装opencv
windows环境下的Anaconda安装与OpenCV机器视觉环境搭建
各种工具汇总（20210702更新）
关于文章致谢
公共数据库信息汇总(20210709更新)
关于摆脱痛苦
pip 本地安装 python 包
报错Error: Sorted input specified, but the file file.bedgraph has the following out of order record解决方案

原文地址：https://www.cnblogs.com/november1943/p/5230924.html