• feed43使用教程


      很久以前就想写了,一直都没时间,现在就应 Range的要求写一下.

      Feed43是一个为没有提供rss输出的网页制作rss的在线服务.

    首先是注册,然后收确认邮件,然后登陆.

    先创建:creat new feed

    Step 1. Specify source page address (URL)

    输入你想订阅的页面,一定要是那一页,这里用绿色软件站最新更新的那一页举例.

    输入http://www.greendown.cn/Software/Latenew.html,在 Encoding输入gb2312,这要看那页面的编码.点击Reload,等待自动分析那页的源代码.

    (晕:服务高峰期,暂停服务,等能用了再写下去)

    (好了,3分钟过去....能用了)

    接着就会看到分析好的源码

    http://kenzone.blogbus.com/files/1145379794.jpg

    看第二步

    Step 2. Define extraction rules

    设置你需要看的东西.第一个要输入的是范围

    "Global Search Pattern"

    看一下那页面源码,我们需要的是更新的软件列表,好在源码有注解,找到了"<!--#最近更新表格开始-->"和"<!--#最近更新表格结束-->"就以这个为搜索范围,根据它的帮助知道范围的格式是这样的:

    <!--#最近更新表格开始-->{%}<!--#最近更新表格结束-->

    也就是在搜索范围中间用"{%}" (不包括双引号)做为通配符号,意思就是从<!--#最近更新表格开始-->到<!--#最近更新表格结束-->的意思,分析其他网页也类似这样,找到头和尾,中间用"{%}"

    在下一个Item (repeatable) Search Pattern

    就是设置具体你需要的东西.

    我们需要的就是新的软件名称还有它的链接,还有别的描述和日期什么的,分析源码找到软件名称的地方,如: 

     <a href='http://www.greendown.cn/Software/Catalog63/1640.html'>木马克星iparmor V5.55 Build 2422 绿色特别版+整合04.05 病毒库</A>

    这就是名称和链接的源码,可以在绿色软件的页面复制"木马克星"再到feed43那页ctrl+F查找"木马克星"找到上面的源码,再分析下去,每个软件的完整源码如下:

    <TR onmouseover="this.style.backgroundColor='#FFFFD9';this.style.color='red'" onmouseout="this.style.backgroundColor='';this.style.color=''" class="Border2"> <TD height=23>&nbsp;[<a href='http://www.greendown.cn/Sorting/Catalog63/Sorting_Indate_Desc_1.html'>病毒防治</a><a href='http://www.greendown.cn/Software/Catalog63/1640.html'>木马克星iparmor V5.55 Build 2422 绿色特别版+整合04.05 病毒库</A></TD>

    相同的是开头的<TR onmouseover  和 结尾的  </A></TD>  这就是我们需要的.根据它的帮助,格式如下:

    <TR onmouseover="this.style.backgroundColor{*}href='{%}'{*}>{%}<{*}href='{%}'{*}>{%}</A></TD>

    (*)代表省略的东西,{%}代表需要的东西,如软件名称,地址等等,整个格式简单来说就是  头+{*}+(具体需要的东西前面一点的代码)href='   +     {%} (代表链接)    +   尾

    可以设置多行,将你需要的东西都做成这个格式,就会有几个 {%}

    我就设置了3个{%} 分别代表 软件类别地址 软件类别   软件地址  软件名称

    设置好就点击Extract

    在Clipped Data就可以看到搜索结果,看看是不是我们要的东西

    Item 1

    {%1} = http://www.greendown.cn/Sorting/Catalog63/Sorting_Indate_Desc_1.html
    {%2} = 病毒防治
    {%3} = http://www.greendown.cn/Software/Catalog63/1640.html
    {%4} = 木马克星iparmor V5.55 Build 2422 绿色特别版+整合04.05 病毒库

    http://kenzone.blogbus.com/files/1145379817.jpg

    第三部 设置这个feed的细节

    Step 3. Define output format

    Feed Title                 :feed 的名称 . 
    Feed Link                : feed对应的网页地址
    Feed Description      : feed的描述

    RSS item properties   输出的样式

     Item Title Template       :  名称  用{%4}代替 看第二步搜索的结果
     Item Link Template       :  地址  {%3}
     Item Content Template  :  描述  {%4}

    所以在rss订阅里看的就是

    木马克星iparmor V5.55 Build 2422 绿色特别版+整合04.05 病毒库
     http://www.greendown.cn/Software/Catalog63/1640.html
    木马克星iparmor V5.55 Build 2422 绿色特别版+整合04.05 病毒库

    这样
    还有一个选项是将所有item作一个链接输出,样子不好看,不推荐用

    http://kenzone.blogbus.com/files/1145379765.jpg

    点击Preview看看成果吧....

    不会写教程,写得很罗嗦,希望你明白,不明白可以留言,我很乐意再解释.

  • 相关阅读:
    ACE反应器(Reactor)模式(1)
    net 命令
    ACE反应器(Reactor)模式(2)
    恢复SQLServer实例连接 (转载)
    在SQL Server Management Studio中可以运行作业但是用TSQL运行则失败 (转载)
    VirtualBox 之 共享磁盘
    从 IClassFactory 为 CLSID 为 {0002450000000000C000000000000046} 的 COM 组件创建实例失败,原因是出现以下错误: 8001010a解决办法 .
    SQLServer数据类型优先级对性能的影响 (转)
    封装getElementsByAttribute
    js中setAttribute 的兼容性
  • 原文地址:https://www.cnblogs.com/meetrice/p/2812933.html
Copyright © 2020-2023  润新知