很久以前就想写了,一直都没时间,现在就应 Range的要求写一下.
Feed43是一个为没有提供rss输出的网页制作rss的在线服务.
首先是注册,然后收确认邮件,然后登陆.
先创建:creat new feed
Step 1. Specify source page address (URL)
输入你想订阅的页面,一定要是那一页,这里用绿色软件站最新更新的那一页举例.
输入http://www.greendown.cn/Software/Latenew.html,在 Encoding输入gb2312,这要看那页面的编码.点击Reload,等待自动分析那页的源代码.
(晕:服务高峰期,暂停服务,等能用了再写下去)
(好了,3分钟过去....能用了)
接着就会看到分析好的源码
看第二步
Step 2. Define extraction rules
设置你需要看的东西.第一个要输入的是范围
"Global Search Pattern"
看一下那页面源码,我们需要的是更新的软件列表,好在源码有注解,找到了"<!--#最近更新表格开始-->"和"<!--#最近更新表格结束-->"就以这个为搜索范围,根据它的帮助知道范围的格式是这样的:
<!--#最近更新表格开始-->{%}<!--#最近更新表格结束-->
也就是在搜索范围中间用"{%}" (不包括双引号)做为通配符号,意思就是从<!--#最近更新表格开始-->到<!--#最近更新表格结束-->的意思,分析其他网页也类似这样,找到头和尾,中间用"{%}"
在下一个Item (repeatable) Search Pattern
就是设置具体你需要的东西.
我们需要的就是新的软件名称还有它的链接,还有别的描述和日期什么的,分析源码找到软件名称的地方,如:
<a href='http://www.greendown.cn/Software/Catalog63/1640.html'>木马克星iparmor V5.55 Build 2422 绿色特别版+整合04.05 病毒库</A>
这就是名称和链接的源码,可以在绿色软件的页面复制"木马克星"再到feed43那页ctrl+F查找"木马克星"找到上面的源码,再分析下去,每个软件的完整源码如下:
<TR onmouseover="this.style.backgroundColor='#FFFFD9';this.style.color='red'" onmouseout="this.style.backgroundColor='';this.style.color=''" class="Border2"> <TD height=23> [<a href='http://www.greendown.cn/Sorting/Catalog63/Sorting_Indate_Desc_1.html'>病毒防治</a>] <a href='http://www.greendown.cn/Software/Catalog63/1640.html'>木马克星iparmor V5.55 Build 2422 绿色特别版+整合04.05 病毒库</A></TD>
相同的是开头的<TR onmouseover 和 结尾的 </A></TD> 这就是我们需要的.根据它的帮助,格式如下:
<TR onmouseover="this.style.backgroundColor{*}href='{%}'{*}>{%}<{*}href='{%}'{*}>{%}</A></TD>
(*)代表省略的东西,{%}代表需要的东西,如软件名称,地址等等,整个格式简单来说就是 头+{*}+(具体需要的东西前面一点的代码)href=' + {%} (代表链接) + 尾
可以设置多行,将你需要的东西都做成这个格式,就会有几个 {%}
我就设置了3个{%} 分别代表 软件类别地址 软件类别 软件地址 软件名称
设置好就点击Extract
在Clipped Data就可以看到搜索结果,看看是不是我们要的东西
Item 1
{%1} = http://www.greendown.cn/Sorting/Catalog63/Sorting_Indate_Desc_1.html
{%2} = 病毒防治
{%3} = http://www.greendown.cn/Software/Catalog63/1640.html
{%4} = 木马克星iparmor V5.55 Build 2422 绿色特别版+整合04.05 病毒库
第三部 设置这个feed的细节
Step 3. Define output format
Feed Title :feed 的名称 .
Feed Link : feed对应的网页地址
Feed Description : feed的描述
RSS item properties 输出的样式
Item Title Template : 名称 用{%4}代替 看第二步搜索的结果
Item Link Template : 地址 {%3}
Item Content Template : 描述 {%4}
所以在rss订阅里看的就是
木马克星iparmor V5.55 Build 2422 绿色特别版+整合04.05 病毒库
http://www.greendown.cn/Software/Catalog63/1640.html
木马克星iparmor V5.55 Build 2422 绿色特别版+整合04.05 病毒库
这样
还有一个选项是将所有item作一个链接输出,样子不好看,不推荐用
点击Preview看看成果吧....
不会写教程,写得很罗嗦,希望你明白,不明白可以留言,我很乐意再解释.