• 织梦入门2-采集1


    文章数据库

    标题在dede_archives里
    内容在dede_addonarticle里

    织梦采集的临时内容在dede_co_htmls表里

    dede_arctiny表存储文章的ID,一般会因为这个表报找不到模版错误

    如果在一件更新的更新所有中报文章ID-模版不存在错误,那就是因为dede_arctiny表对应的dede_archives和dede_addonarticle表内容不存在

    需要删除dede_arctiny表中的ID号

    一般调用数据库中的内容是通过{dede:field.标签名/}来调用的

    节点名称:电影天堂科幻片2
    引用网址:http://www.dy2018.com/4/index.htm
    匹配网站(测试用):http://www.dy2018.com/4/index_(*).html 2-2
    区域开始HTML:<div class="co_content8">
    区域结束HTML:</ul>

    织梦采集时内容区域对空格敏感

    【内容配置】
    预览网址:http://www.dy2018.com/i/97869.html
    匹配规则:<h1>[内容]</h1>
    发布时间:<span class="updatetime">[内容]</span>

    文章内容匹配规则:

    <td colspan="2" align="center" valign="top"><div id="Zoom">
    [内容]
                  </tr>

    过滤规则:[常用规则的表格过滤][脚本过滤][图像过滤][div过滤]

    {dede:trim replace=""}<script([^>]*)>(.*)</script>{/dede:trim}
    {dede:trim replace=""}<table([^>]*)>(.*)</table>{/dede:trim}
    {dede:trim replace=""}<img([^>]*)>{/dede:trim}
    {dede:trim replace=""}<div([^.]*)>{/dede:trim}
    {dede:trim replace=""}</div>{/dede:trim}

    自定义处理接口:

    @me=str_replace('<td><span style="FONT-SIZE: 12px"><td>',’’,@me);
    @me=str_replace('<div id="contentMidPicAD" style="float:right; clear:both; top:0; vertical-align:top;"><!-- 250x250启用SSP 开始 --><script type="text/javascript">var _mda_place_id ="58bcc82381892";</script><script type="text/javascript" src="http://place.ssp.desdev.cn/pageplace/show.js"></script><!-- 250x250启用SSP 结束 --></div>',’’,@me);

  • 相关阅读:
    File初识和练习
    图床
    servlet
    css伪类及伪元素用法
    css中的定位position
    块级元素与行级元素
    清除浮动
    CSS浮动
    fastjson 1.2.6以下版本 解析字符串末尾出现/x会陷入死循环 报oom异常
    记一次select2赋值动态数组的坑
  • 原文地址:https://www.cnblogs.com/wgphp/p/7765961.html
Copyright © 2020-2023  润新知