1)urlparse模块提供了操作URL字符串的基本功能。
urlparse.urlparse()接收一个url地址,返回一个6元组。
urlparse.urlparse('http://www.python.org/doc/faq.html')
# ('http','www.python.org','/doc/faq.html','','','')
urlparse.urlunparese()功能正相反。
2)urllib模块提供一些更高级的功能。
urllib.urlopen(urlstr,postQueryData),接收两个参数,第一个是url地址,如果有get方式传的参,也放在第一个参数里,第二个参数放需要通过post传递的值。方法返回一个文件对象f,f有如下方法f.read(),f.readline(),f.readlines(),f.close(),f.fileno(),f.info(),f.geturl()。
urllib.urlretrieve(urlstr,localfie,downloadStatusHook),接收三个参数,第一个参数是url地址,第二个参数是文件保存到本地的路径,第三个参数是文件下载时的回调,回调里会传入三个参数:目前读入的块数、块的字节数和文件的总字节数,可以用来做下载进度条。
urllib.quote()和urllib.unquote()是用来编码和解码url的,和js中的encodeURIComponent()方法功能相同。
urllib.urlencode(dic),方法接收一个参数,参数为字典类型,返回一个用于url中的queryString。可以方便地将字典变成名值对字符串。