• oracle_job 清空冗余数据 ,每一分钟执行一次


    参照这个例子:http://cherryqq.iteye.com/blog/855022

     思路: data表中有4条数据 ,relation有3条数据,通过data_id 对应,需要定时删除 data表中在relation表中没有data_id引向的数据,

    通过存储过程+job的方式。

    已有表结构 

    tab_page_data

    create table TAB_PAGE_DATA
    (
      DATA_ID         CHAR(32) not null,
      PAGE_ID         NUMBER not null,
      PARENT_ID       NUMBER,
      SYSTEM_ID       NUMBER,
      EXTENSION       VARCHAR2(255),
      CREATEDTIME     DATE,
      TITLE           VARCHAR2(255),
      AUTHORS         VARCHAR2(255),
      DOMAIN          VARCHAR2(255),
      CONTENT         CLOB,
      CONTENTLENGTH   NUMBER,
      SUMMARY         VARCHAR2(1000),
      CLASSIFY_DIR_ID NUMBER,
      FLAG            NUMBER
    )

    tab_page_relation

    create table TAB_PAGE_RELATION
    (
      UNIQUE_ID         CHAR(32) not null,
      DATA_ID           CHAR(32),
      NICK_ID           NUMBER,
      URL               VARCHAR2(512),
      UPDATE_TIME       DATE default sysdate,
      INSERT_TIME       DATE default sysdate not null,
      LAST_CRAWLER_TIME DATE default sysdate
    )
    

    tab_page_data插入测试数据 四条

    insert into tab_page_data (DATA_ID, PAGE_ID, PARENT_ID, SYSTEM_ID, EXTENSION, CREATEDTIME, TITLE, AUTHORS, DOMAIN, CONTENT, CONTENTLENGTH, SUMMARY, CLASSIFY_DIR_ID, FLAG)
    values ('b3764d3494655859cd0de9309f3376d6', 0, 0, 1, 'html', to_date('30-10-2013 11:55:27', 'dd-mm-yyyy hh24:mi:ss'), 'AutoCADArchitecture2010中国标准件库', '', '鹏宇成MIS管理系统', 'test', 4762, 'test', null, null);
    
    insert into tab_page_data (DATA_ID, PAGE_ID, PARENT_ID, SYSTEM_ID, EXTENSION, CREATEDTIME, TITLE, AUTHORS, DOMAIN, CONTENT, CONTENTLENGTH, SUMMARY, CLASSIFY_DIR_ID, FLAG)
    values ('0f8342f81e3931ce8667f001409aef03', 0, 0, 1, 'html', to_date('30-10-2013 11:59:02', 'dd-mm-yyyy hh24:mi:ss'), '在安装AIP的模块的时候会出现1722或1904错误', '', '鹏宇成MIS管理系统', 'test', 12311, 'test', null, null);
    
    insert into tab_page_data (DATA_ID, PAGE_ID, PARENT_ID, SYSTEM_ID, EXTENSION, CREATEDTIME, TITLE, AUTHORS, DOMAIN, CONTENT, CONTENTLENGTH, SUMMARY, CLASSIFY_DIR_ID, FLAG)
    values ('6fd0b3d8bddf94a4c59a467a893eaab7', 0, 0, 2, 'html', to_date('30-10-2013 12:06:52', 'dd-mm-yyyy hh24:mi:ss'), '无障碍台盆', '', '鹏宇成公司网', 'test', 62694, 'test', null, null);
    
    insert into tab_page_data (DATA_ID, PAGE_ID, PARENT_ID, SYSTEM_ID, EXTENSION, CREATEDTIME, TITLE, AUTHORS, DOMAIN, CONTENT, CONTENTLENGTH, SUMMARY, CLASSIFY_DIR_ID, FLAG)
    values ('62cfc3e5aec21b533eac4358d39cab56', 0, 0, 1, 'html', to_date('30-10-2013 12:27:58', 'dd-mm-yyyy hh24:mi:ss'), 'Autodesk产品服务详细介绍', '', '鹏宇成MIS管理系统', 'test', 6889, 'test', null, null);
    

      tab_page_relation  三条

    insert into tab_page_relation (UNIQUE_ID, DATA_ID, NICK_ID, URL, UPDATE_TIME, INSERT_TIME, LAST_CRAWLER_TIME)
    values ('00244IUVNKIG0FMKJIO6SO8T1R100010', 'b3764d3494655859cd0de9309f3376d6', 10001, 'http://mis.pyc.com.cn/report_forms/knowledge_info.aspx?knid=1109&p=17&y=1&id=', to_date('30-10-2013 11:55:28', 'dd-mm-yyyy hh24:mi:ss'), to_date('30-10-2013 11:55:28', 'dd-mm-yyyy hh24:mi:ss'), to_date('30-10-2013 11:55:28', 'dd-mm-yyyy hh24:mi:ss'));
    
    insert into tab_page_relation (UNIQUE_ID, DATA_ID, NICK_ID, URL, UPDATE_TIME, INSERT_TIME, LAST_CRAWLER_TIME)
    values ('00014HT98UKDD6IVHOR5VVLSAF100010', '0f8342f81e3931ce8667f001409aef03', 10001, 'http://mis.pyc.com.cn/report_forms/knowledge_info.aspx?knid=332&p=2&y=1&id=1', to_date('30-10-2013 11:59:03', 'dd-mm-yyyy hh24:mi:ss'), to_date('30-10-2013 11:59:03', 'dd-mm-yyyy hh24:mi:ss'), to_date('30-10-2013 11:59:03', 'dd-mm-yyyy hh24:mi:ss'));
    
    insert into tab_page_relation (UNIQUE_ID, DATA_ID, NICK_ID, URL, UPDATE_TIME, INSERT_TIME, LAST_CRAWLER_TIME)
    values ('0012RS6G1LNPOJV7SQBUSI2LLF100010', '6fd0b3d8bddf94a4c59a467a893eaab7', 10000, 'http://www1.pyc.com.cn/Application/Family.aspx?pid=319', to_date('30-10-2013 12:06:52', 'dd-mm-yyyy hh24:mi:ss'), to_date('30-10-2013 12:06:52', 'dd-mm-yyyy hh24:mi:ss'), to_date('30-10-2013 12:06:52', 'dd-mm-yyyy hh24:mi:ss'));
    

    创建历史记录表

    CREATE TABLE TAB_PAGE_DATA_HISTORY AS SELECT * FROM tab_page_data WHERE 1=2;
    

    在plsql下 创建存储过程 

    PRO_PAGE_DATA_CLEAR
    CREATE OR REPLACE PROCEDURE PRO_PAGE_DATA_CLEAR IS
      DATAID NUMBER(32);
    BEGIN
      INSERT INTO TAB_PAGE_DATA_HISTORY
        SELECT *
          FROM TAB_PAGE_DATA TPDD
         WHERE TPDD.DATA_ID IN
               (SELECT TPD.DATA_ID
                  FROM TAB_PAGE_DATA TPD
                 WHERE TPD.DATA_ID NOT IN
                       (SELECT DISTINCT TPR.DATA_ID FROM TAB_PAGE_RELATION TPR));
      COMMIT;
    END PRO_PAGE_DATA_CLEAR;
    

      在oracle服务器本机sqlplus / as sysdba 本机登陆 登陆用户  conn pyc3/pyc3

    创建一个job,名称为job2013 ;作用是每分钟(60×24=1440)执行一次存储过程PRO_PAGE_DATA_CLEAR

    SQL> variable job2013 number;
    SQL> begin
    2 dbms_job.submit(:job2013,'PRO_PAGE_DATA_CLEAR;',sysdate,'sysdate+1/1440');
    3 end;
    4 /

    PL/SQL 过程已成功完成。

    运行job2013

    SQL> begin
    2 dbms_job.run(:job2013);
    3 end;
    4 /

    PL/SQL 过程已成功完成。

    查看运行效果 。

    select * from tab_page_data_history;

    停止job

    SQL> begin

      2  dbms_job.remove(:job2013);

      3  end;

      4  /

    ===========================================

    6,查询jobs的相关视图

    select job,last_date,last_sec,broken,failures,interval, what from dba_jobs

    详解 dba_jobs中几个比较重要的字段

    job: 指的是job的id号。比如上面的 41

    failures:job执行的时候失败次数,如果超过了15次,那么broken列将被标为Y,以后就不会运行该job了

    broken:默认为N,如果为Y,意味着不再执行该job!

    interval:执行job的间隔时间。

    what:该job的实际工作。

    二:job 的相关知识:

    1,DBA_JOBS

    DBA_JOBS

    ===========================================

    字段(列) 类型 描述

    JOB NUMBER 任务的唯一标示号

    LOG_USER VARCHAR2(30) 提交任务的用户

    PRIV_USER VARCHAR2(30) 赋予任务权限的用户

    SCHEMA_USER VARCHAR2(30) 对任务作语法分析的用户模式

    LAST_DATE DATE 最后一次成功运行任务的时间

    LAST_SEC VARCHAR2(8) 如HH24:MM:SS格式的last_date日期的小时,分钟和秒

    THIS_DATE DATE 正在运行任务的开始时间,如果没有运行任务则为null

    THIS_SEC VARCHAR2(8) 如HH24:MM:SS格式的this_date日期的小时,分钟和秒

    NEXT_DATE DATE 下一次定时运行任务的时间

    NEXT_SEC VARCHAR2(8) 如HH24:MM:SS格式的next_date日期的小时,分钟和秒

    TOTAL_TIME NUMBER 该任务运行所需要的总时间,单位为秒

    BROKEN VARCHAR2(1) 标志参数,Y标示任务中断,以后不会运行

    INTERVAL VARCHAR2(200) 用于计算下一运行时间的表达式

    FAILURES NUMBER 任务运行连续没有成功的次数

    WHAT VARCHAR2(2000) 执行任务的PL/SQL块

    CURRENT_SESSION_LABEL RAW MLSLABEL 该任务的信任Oracle会话符

    CLEARANCE_HI RAW MLSLABEL 该任务可信任的Oracle最大间隙

    CLEARANCE_LO RAW MLSLABEL 该任务可信任的Oracle最小间隙

    NLS_ENV VARCHAR2(2000) 任务运行的NLS会话设置

    MISC_ENV RAW(32) 任务运行的其他一些会话参数

    --------------------------

    2,描述 INTERVAL参数值

    每天午夜12点: 'TRUNC(SYSDATE + 1)'

    每天早上8点30分: 'TRUNC(SYSDATE + 1) + (8*60+30)/(24*60)'

    每星期二中午12点: 'NEXT_DAY(TRUNC(SYSDATE ), ''TUESDAY'' ) + 12/24'

    每个月第一天的午夜12点: 'TRUNC(LAST_DAY(SYSDATE ) + 1)'

    每个季度最后一天的晚上11点: 'TRUNC(ADD_MONTHS(SYSDATE + 2/24, 3 ), 'Q' ) -1/24'

    每星期六和日早上6点10分: 'TRUNC(LEAST(NEXT_DAY(SYSDATE, ''SATURDAY"), NEXT_DAY(SYSDATE, "SUNDAY"))) + (6×60+10)/(24×60)'

    每月25号00:00执行: 'TRUNC(LAST_DAY(SYSDATE ) + 25)'

    --------------------------

    1:每分钟执行

    Interval => TRUNC(sysdate,'mi') + 1/ (24*60)

    Interval => sysdate+1/1440

    2:每天定时执行

    例如:每天的凌晨1点执行

    Interval => TRUNC(sysdate) + 1 +1/ (24)

    3:每周定时执行

    例如:每周一凌晨1点执行

    Interval => TRUNC(next_day(sysdate,'星期一'))+1/24

    4:每月定时执行

    例如:每月1日凌晨1点执行

    Interval =>TRUNC(LAST_DAY(SYSDATE))+1+1/24

    5:每季度定时执行

    例如每季度的第一天凌晨1点执行

    Interval => TRUNC(ADD_MONTHS(SYSDATE,3),'Q') + 1/24

    6:每半年定时执行

    例如:每年7月1日和1月1日凌晨1点

    Interval => ADD_MONTHS(trunc(sysdate,'yyyy'),6)+1/24

    7:每年定时执行

    例如:每年1月1日凌晨1点执行

    Interval =>ADD_MONTHS(trunc(sysdate,'yyyy'),12)+1/24

    3. 查看相关job信息

    相关视图

    dba_jobs

    all_jobs

    user_jobs

    dba_jobs_running 包含正在运行job相关信息

  • 相关阅读:
    自动刷新页面
    docker 数据卷管理
    docker container(容器)
    docker images
    docker 设计原理
    hbase数据原理及基本架构
    详谈kafka的深入浅出
    django介绍及路由系统
    mysql爱之深探测
    mysql数据库内容相关操作
  • 原文地址:https://www.cnblogs.com/cphmvp/p/3486146.html
Copyright © 2020-2023  润新知