【python】获取指定网页上的所有超级链接

# -*- coding: utf-8 -*-
import urllib2
import re

#connect to a URL
website = urllib2.urlopen("http://www.baidu.com")
#read html code
html = website.read()
#use re.findall to get all the links
links = re.findall('"((http|ftp)s?://.*?)"', html)  ###".*?"任意匹配
print links

相关阅读:
dmesg
[转]df命令
 [转]linux /proc/cpuinfo 文件分析
 awk
sed
[转]进程间通信
 Bootstrap 树形列表与右键菜单
 Maven国内仓库
 《深入剖析Tomcat》源码
 Spring in Action学习笔记（2）
原文地址：https://www.cnblogs.com/paulwinflo/p/5853386.html

最新文章
一脚踩进java之基础篇20——面向对象 (匿名对象、内部类)
一脚踩进java之基础篇19——面向对象 (final,static关键字)
一脚踩进java之基础篇17——面向对象 (this关键字)
一脚踩进java之基础篇16——面向对象 (构造方法)
一脚踩进java之基础篇15——面向对象 (多态)
一脚踩进java之基础篇14——面向对象 (接口)
phpStorm如何用FTP,SSH连接到虚拟机linux系统？
Swoole安装问题
 微信公众号开发第一天---接入
 Larvel操作MongoDB（对内嵌数组增删改）

热门文章
PHP操作MongoDB
PHP去除bom头，json_decode()返回NULL，php无法对字符串做处理
 配置frp实现内网穿透
 apache经常无法访问目录列表,显示403 forbidden
appium解决无法通过name属性识别元素org.openqa.selenium.InvalidSelectorException: Locator Strategy 'name' is not supported for this session
使用app-inspector查看元素，无法连接到手机，提示错误{ Error: Command failed ……forward tcp:9001 tcp:9001错误解决
 org.testng.TestNGException: java.lang.NullPointerException解决方法
 程序的执行顺序
 观察系统资源的几个命令
 程序的删除kill、killall