• 集合包含关系的快速算法


    #1 每行数据代表一个集合,如何判断集合的包含关系? -- 集合的数据仅在有限范围内。

    0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23       a --24个元素
    1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24     b --24个元素

    最容易想到的是蛮力运算,计算前还应该知道谁元素多,对吧?不过还好,我耍了个花招,在读取数据时已经把数组元素数目存入数组第0号元素。

    1 for each element x in a
    2     if (!setContain(b , x))
    3        return false;
    4 
    5 return true;    

    #2 数据在31以内,考虑用无符号数编码数组
    例如 1 2 3 4 用 0x00000000 00000000 00000000 00001111编码,也就是1用第一个bit,2用第二个bit,依此类推...
    但是数据里面有0,也好说,0用第一个bit,1用第二个bit,依此类推...
    这样1 2 3 4 最终形式 0x00000000 00000000 00000000 00011110
    这么一来要判断要简单多了,只需要

    1 unsigned src //代表较多元素数组的编码
    2 unsigned dst //代表较少元素数组的编码
    3 if (src & dst == dst)
    4     return true;
    5 
    6 return false;

    但是且慢,如何将1 2 3 4等元素存入 src 之类变量?
    So, 手工加工的 table登场

     1     unsigned int table[32] = {
     2         0x000000010x000000020x000000040x00000008
     3         0x000000100x000000200x000000400x00000080,
     4         0x000001000x000002000x000004000x00000800
     5         0x000010000x000020000x000040000x00008000,
     6         0x000100000x000200000x000400000x00080000,
     7         0x001000000x002000000x004000000x00800000,
     8         0x010000000x020000000x040000000x08000000,
     9         0x100000000x200000000x400000000x80000000
    10     };

    只需要每数组扫描一遍即可实现目标。

    1 src = 0;
    2
    3 for each element x in a
    4     src = src + table[x];

    问题基本解决。

    #3 考虑如下数组:如何扩展至64位

    25 26 27 28 29 30 31 32 33 34 35 36 37 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
    26 27 28 29 30 31 32 33 34 35 36 37 38 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

    可按下图来考虑

    number      bit
    0           1
    .           .
    .           .
    .           .
    31          32


    32 -- 0     1
    .           .
    .           .
    .           .
    63 -- 31    32

    再构造数组

    1 int cache = {032};
    2 unsigned int cacheManager[2][2];
    3 //用二维数组维护两个数组的编码,每行编码一数组

    方法如下,分别以16  , 63为例

    运算 (16 & 0x00000020) >> 5 得出  0,  然后 16 - cache[0] 得出 16,   16 存入cacheManager[?][ 0 ]

    运算 (63 & 0x00000020) >> 5 得出  1,  然后 63 - cache[1] 得出 31,    31存入cacheManager[?][ 1 ]

    #4 实际代码,利用此方法,程序运行时间缩短到原来1/3.

     1 int fillCacheManager(normalInt * index, Element (* dt)[ElementNumber], unsigned int (*cm)[cacheLine], unsigned int * table){
     2     int element;
     3     int cache[2] = {0 , 32};
     4     int serial;
     5 
     6     for( normalInt m=1; m<=index[0]; m++ ){
     7         normalInt t = index[m];
     8         cm[t][0] = 0;
     9         cm[t][1] = 0;
    10         for ( normalInt n=1; n<=dt[t][0]; n++  ){
    11             element = dt[t][n];
    12             serial = (element & 0x00000020) >>5;
    13             element = element - cache[serial];
    14             cm[t][serial] = cm[t][serial] + table[element] ;
    15         }
    16     }
    17 
    18     return 0;
    19 }
    20 
    21 
    22 int quickTableReducton(normalInt * index, Element (* dt)[ElementNumber], unsigned int (*cm)[cacheLine]){
    23     normalInt subset = index[0];
    24     if (subset == 0return -1;
    25     
    26     for (normalInt m=1; m<subset; m++ ){
    27         if (index[m] < 0continue;
    28         
    29         for(normalInt n=m+1; n<subset+1; n++){
    30             if(index[n] < 0continue;
    31             if(n == m) continue;
    32 
    33             normalInt src = index[m];
    34             normalInt dst = index[n];
    35             normalInt QQ = dst;
    36             bool swaped = false;
    37             if (dt[src][0] < dt[dst][0]){
    38                 swaped = true;
    39                 QQ = src;
    40             }
    41 
    42             if (  (cm[src][0] & cm[dst][0]) == cm[QQ][0]    &&   (cm[src][1] & cm[dst][1]) == cm[QQ][1]  ){
    43                 int t = m;
    44                 if (swaped) t = n;
    45                 index[t] = -2
    46                 index[0] = index[0]-1;
    47                 if (swaped == falsebreak;            
    48             }
    49         }
    50     }
    51 
    52     normalInt idx[indexCount];//indexOver
    53     normalInt len=1;
    54     for (normalInt m=1; index[m]!=indexOver; m++)//m<=index[0]
    55         if (index[m] > -1){
    56             idx[len] = index[m];
    57             len++;
    58         }
    59 
    60     for (normalInt m=1; m<len; m++) index[m] = idx[m];
    61     index[len] = indexOver;
    62 
    63     return 0;
    64 }

    #5 STL bitset : better choice?

  • 相关阅读:
    [2]Linux 环境下安装Maven
    [1]linux下安装java
    NET CORE LINUX 部署 报 A connection was successfully established with the server, but then an error occurred during the prelogin handshake.解决方法
    php保留数组中的某个元素为某个值的数组元素
    安装python 3.5
    部署tidb同步到mysql(drainer)
    perconabackupmongodb安装部署
    安装部署TiCDC
    percona相关软件网页无法打开其他下载方式
    SqlSugar 和 FreeSql 以及 EF Core 我的最终选择
  • 原文地址:https://www.cnblogs.com/servo/p/2712577.html
Copyright © 2020-2023  润新知