抓取网页
import urllib.request //导入模块
result=urllib.request.urlopen('http://www.baidu.com')//打开url网址的操作
getnr=result.read()//read()读取内容,返回一个字符串
print getnr
------------------------------------
import urllib.request,re,time,random,gzip
re 正则模块
time 时间模块
random 数字模块
gzip 压缩模块
------------------------------
open() open(name[,mode[,buffering]])
name 要打开的文件 mode 打开方式 buffering 是否启用缓冲
- 参数 描述
- r 读取模式打开文件
- w 读写模式打开文件
- a 写入模式打开文件
- b 二进制模式打开文件(可以和其他模式并用)
- + 读/写模式(可以和其他模式并用)
- U 支持换行符(例如:n、r 或 nr 等)
也就是说当我们使用open()
函数打开文件时,程序首先会查询open()
函数的文件名称,然后才是文件的模式。文件模式是相当重要的一个参数。默认情况下,该函数的默认模式参数为r,用来只读打开文件,如果读取特殊文件(例如视频或者图片文件),那么必须使用b模式。
- #-*-coding:utf-8-*-
- #Python 模板
- o=open('index.txt','w');
- o.write("x")
- o.close();
在上述代码中,首先使用open()
函数来打开index.txt
文件,以读写模式打开,这样就可以对文件进行读写操作了。打开文后返回一个文件对象,然后调用write()
函数写入信息,最后调用close()
关闭文件!
str()函数用于把任何值转变为字符串
str(2) 输出2
encode() 方法返回字符串的编码版本