我的第一个 python 爬虫脚本

我的第一个 python 爬虫脚本

#!/usr/bin/env python
# coding=utf-8
import urllib2
from bs4 import BeautifulSoup

#res = urllib.urlopen("http://www.douban.com/tag/%E5%B0%8F%E8%AF%B4/?focus=book")
#res = urllib2.urlopen("https://www.cnblogs.com/bensonyang/")
res = urllib2.urlopen("https://www.cnblogs.com/hearzeus/")
#print res
soup = BeautifulSoup(res,features="html.parser")
#print soup
book_div = soup.find(attrs={"id":"main"})
#print book_div
book_a = book_div.findAll(attrs={"class":"postTitle2"})
for book in book_a:
print book.string.strip()

【输出结果：】

benson@bensons-MacBook-Pro:~/vm_share/python_mysql $ ./benson.py
Python 爬虫入门——小项目实战（自动私信博客园某篇博客下的评论人，随机发送一条笑话，完整代码在博文最后）
Python 爬虫入门（四）—— 验证码下篇（破解简单的验证码）
Python 爬虫入门（四）—— 验证码上篇（主要讲述验证码验证流程，不含破解验证码）
Python 爬虫入门（三）—— 寻找合适的爬取策略
Python 爬虫入门（二）—— IP代理使用
Python 爬虫入门（一）
Dubbo、Zookeeper集群搭建及Rose使用心得（二）
Dubbo、Zookeeper集群搭建及Rose使用心得（一）
JAVA 加密算法初探DES&AES
Android 蓝牙模块基础操作
benson@bensons-MacBook-Pro:~/vm_share/python_mysql $
相关阅读:
正则表达式解决身份证号码和手机号
 redis：集群配置
 linux：NFS
xshell提示必须安装最新的更新
 linux：ssh远程调用tomcat脚本时候出错
 linux：scp从入门到刚入门
 linux：SSH最简单教程
 nginx;keepalived配置出现主主的解决方法（脑裂问题）
（4）事件处理——（4）网页上的多个脚本（Multiple scripts on one page）
[php]应用控制器（一）
原文地址：https://www.cnblogs.com/bensonyang/p/12011650.html

热门文章
leetcode72
leetcode161
leetcode527
leetcode408
leetcode91
lintcode104
lintcode612
lintcode544
lintcode642
一些做vue前端的经验