简单的web应用包括使用被称为url(统一资源定位器,uniform resource locator)的web地址
这个地址用来在web上定位一个文档,或调用一个CGI程序来为你的客户端产生一个文档。
python核心编程中介绍了urlparse,适用与python2.x,然3.x略有不同之处
urlparse模块
from urllib import parse urltup = parse.urlparse('http://www.cnblogs.com/changbo/p/5652331.html') print(urltup)
输出结果如图所示
我们看到解析出一个6元组,各个元素含义如下
(网络协议, 域名(服务器位置), 资源位置, 可选参数, 连接符(&)链接键值对, 拆分文档中特殊锚)
urlunparse与其功能相反,它拼合一个urltuple,接上,代码如下
urlstr = parse.urlunparse(urltup) print(urlstr)
显示结果如下
在需要多个相关的URL时我们需要使用urljoin()功能,如在一个web页面中
生成一系列页面的URL。
usrle = parse.urljoin('http://www.cnblogs.com/changbo/p/5652331.html', '5014247.html' ) print(usrle)
显示结果如下
urlparse模块核心函数
END!