采集新闻,体会到面向问题和面向对象的区别。
如果希望新闻来源多出,比如NNTP,Web。可以实现:Source,Destination,NewItem,NewAgent。
Scoure处理来源,
Destination生成报告格式。
NewItem用来封装每条新闻的主题和Body
Agent:用来添加新闻源,添加目标源。然后将每个新闻源发布给每个目标。
用到的模块:
nntplib import NNTP
time import time, localtime, strftime
email import message_from_string
urllib import urlopen
re
textwarp.wrap ==>调整字符串最大行宽
NNTP:
NNTP(host)
server.newnews(group,yymmdd,hhmmss)[1] ==>某个时间之后的某个Group的新闻
Web:
urlopen(url)
往文件里面输入文本:
f = open(‘filename’,'w')
print >>f,'xxxxx' ===>可以用格式