• (linux)idr(integer ID management)机制


    最近研究进程间通信,遇到了idr相关的函数,为了扫清障碍,先研究了linux的idr机制。
    IDR(integer ID management)的要完成的任务是给要管理的对象分配一个唯一的ID,于是可以通过这个数字找到要管理的对象。

    应用IDR机制时要包含头文件<linux/idr.h>。

    struct idr {
    
    	struct idr_layer *top;  //idr的top层,可以方便的理解为根节点。
    	struct idr_layer *id_free; //id_free为首的形成一个链表,这个是预备队,
                                              //并没有参与到top为根的节点中去
    	int layers; //当前的层数。
    	int id_free_cnt;// 预备队的个数。
    	spinlock_t lock;
    
    };
    
    
    struct idr_layer {
    
    	unsigned long
    	bitmap; /* A zero bit means "space here" */
    
    	struct idr_layer
    	*ary[1<<IDR_BITS];
    
    	int count; /* When zero, we can release it */
    };
    
    IDR_BITS 在32位操作系统是5 ,64位操作系统是6,我们以32位操作系统为例。
    

    本文的介绍以两层的为例。layers = 2.
    idr中的top指向的是当前正在工作的最高层的idr_layer,即图中的A,top的ary是个指针数组,指向
    低一层的idr_layer。top层ary指针数组不一定都指向已经分配了的低一层idr_layer。也可能某个指针指
    向NULL。如下图的ary[1]就指向NULL。
    最后一层idr_layer 叶子层 例如B,他的指针数组ary中的元素,如果分配出去了那么指向某个结构体的地址,这个地址指向要管理的数据结构。如果没有分配出去,指针指向NULL。对于叶子层而言,判断指针数组某个元素是否指向有意义的数据结构,用位图bitmap。bitmap对应的位 是1,表示ary数组的对应元素指向某有意义的数据结构。
    最后一层的bitmap的含义已经介绍,但是top层(或者层数大于2的时候,中间某层)bitmap的含义是什么呢?以两层为例,如果图中B的bitmap是0xFFFFFFFF,即每一个指针都分配出去了,那么A的bitmap的第0位置1.同样如果A的bitmap的第2位是1,表示ary[2]指向的C的bitmap是0xFFFFFFFF,即C也ary数组也分配完毕。

    这部分是函数idr_mark_full来实现:

    static void idr_mark_full(struct idr_layer **pa, int id)
    {
    
    	struct idr_layer *p = pa[0];
    	int l = 0;
    
    	__set_bit(id & IDR_MASK, &p->bitmap);// 叶子层数字id对应的位 置1.
    
    	/*
    	 * If this layer is full mark the bit in the layer above to
    	 * show that this part of the radix tree is full.  This may
    	 * complete the layer above and require walking up the radix
    	 * tree.
    	 */
    	while (p->bitmap == IDR_FULL) {
    
    		if (!(p = pa[++l]))              // pa[++l]记录的上一层idr_layer。
    			break;
    	
    		id = id >> IDR_BITS;
    
    		__set_bit((id & IDR_MASK), &p->bitmap); //如果由于本层满了,则上一层对应位置1.
                                                                  
    	} //循环检测。
    
    }
    
    

    介绍完负责工作的部分,下面介绍预备役。所谓预备役就是id_free指向的空闲的idr_layer。所谓空闲是指,这些idr_layer并没有投入。如果需要分配一个idr_layer,首先将id_free指向的idr_layer取出来使用,同时id_free指向下一个。即如下图所示,如果需要分配,D被取出来使用,同时id_free指针指向E,同时id_freecnt减一。

    将预备役投入使用是函数alloc_layer完成的:

    static struct idr_layer *alloc_layer(struct idr *idp)
    {
    
    	struct idr_layer *p;
    	unsigned long flags;
    
    	spin_lock_irqsave(&idp->lock, flags);
    
    	if ((p = idp->id_free)) {   
    
    		idp->id_free = p->ary[0]; // id_free 指向D的下一位 E 
    		idp->id_free_cnt--;         // 预备役的个数减1
    		p->ary[0] = NULL;          //D要被使用了,第0个指针不再指向E,初始化为NULL
    	}
    
    	spin_unlock_irqrestore(&idp->lock, flags);
    
    	return(p);  // 返回D
    
    }
    

    有个问题是预备役是怎么来的?如果预备役分配光了怎么办。分配光了也没有关系,还好我们有idr_pre_get函数。

    #if BITS_PER_LONG == 32
    #define IDR_BITS 5
    #define MAX_ID_SHIFT (sizeof(int)*8 - 1)               //31
    #define MAX_LEVEL         (MAX_ID_SHIFT + IDR_BITS - 1) / IDR_BITS              //7
    #define IDR_FREE_MAX      MAX_LEVEL + MAX_LEVEL                                 //14
    

    坦白说,MAX_LEVEL的含义是什么,我并不清楚。为什么一次分配14个idr_layer充当预备役我并不清楚。请清楚的兄弟不吝赐教。
    这个函数的含义就是我要分配14个idr_layer,充当预备役。如果中间分配失败,那么能分配几个算几个。投入预备役的函数是free_layer。比较好懂我就不解释了。

    int idr_pre_get(struct idr *idp, gfp_t gfp_mask)
    {
    
    	while (idp->id_free_cnt < IDR_FREE_MAX) {
    
    		struct idr_layer *new;
    		new = kmem_cache_alloc(idr_layer_cache, gfp_mask);
    
    		if (new == NULL)
    			return (0);
    
    		free_layer(idp, new);
    	}
    
    	return 1;
    }
    
    static void free_layer(struct idr *idp, struct idr_layer *p)
    {
    
    	unsigned long flags;
    
    	/*
     	 * Depends on the return element being zeroed.			
    	 */
    
    	spin_lock_irqsave(&idp->lock, flags);
    
    	__free_layer(idp, p);
    
    	spin_unlock_irqrestore(&idp->lock, flags);
    }
    
    static void __free_layer(struct idr *idp, struct idr_layer *p)
    {
    
    	p->ary[0] = idp->id_free;
    	idp->id_free = p; 
    	idp->id_free_cnt++; 
    }
    

    从预备役机制上看,我们可以得到使用idr编程流程应该是这样的。
    首先调用idr_pre_get,来分配可用的idr_layer,投入预备役,接下来调用idr_get_new,
    给要管理的对象target分配一个数字id,这个过程中可能会调用alloc_layer,将预备役中的
    idr_layer投入使用,用在top为根管理结构中。
    终有一天,预备役也被打光了idr_get_new
    函数返回-EAGAIN,告诉我们,预备役全部阵亡,于是,我们从-EAGAIN的遗言中,知道,我们需要调用
    idr_pre_get来充实预备役了。

    again: if (idr_pre_get(&my_idr, GFP_KERNEL) == 0) {
    	/* No memory, give up entirely */ 
    } 
    	spin_lock(&my_lock); 
    	result = idr_get_new(&my_idr, &target, &id); 
    	if (result == -EAGAIN) { 
    		sigh(); 
    		spin_unlock(&my_lock);
    		goto again;
    	}
    
    

    下面:讲述如何给要管理的对象分配一个小数字作为id。
    首先看知道obj的ID,如果查找obj ,即指向obj的指针。也就是说先看我们想要达到的效果,在来分析如何实现给对象分配ID。
    根据ID ,来查找obj。函数idr_find实现查找功能
    假如下图中C 的ary[2]指向一个管理的obj。我们来看下如何通过数字66来查找到obj。
    我们以top为根的树其实是一个32叉树。如果只有一层,那么top本身指向叶子层,那么最多理32个obj,即ary数组的每个元素,指向一个obj。 但是假如说我们管理的对象超过了32个,我们就不能用一层来管理这个需要有两层结构。就像我们的示意图。
    其实idr有一种比较简单的理解方式,就是它是一种32进制的数,满32,向前进一位。
    我们还是从示意图讲起。我们寻找66指向的obj。首先判断66是否超过了当前层数所能管理最多obj。
    当前我们是两层结构,top指向32叉树的根,top下面管理32个叶子层的idr_layer。上面一讲提到了,叶子层idr_layer的ary数组元素是用来指向目标obj的。那么两层总共可以管理3232=1024个obj。同样道理三层可以最多管理3232*32=32K 个obj。
    要想找到obj的指针,必须根据ID,一路寻找的叶子层。66/32 = 2,所以从top--->top->ary[2],
    我们就找到了叶子节点C。66|IDR_MASK = 2,所以C的ary[2]指向管理的obj。

    用前面的32进制方法理解就是66 = 232+2,所以,top->ary[2]->ary[2]指向obj。
    同样我们可以求ID是27对应的obj 27=0
    32+27,所以top->ary[0]->ary[27]指向obj。

    小结:通过上面的描述,我们也看到了,我们就是要建立一个32叉树,来管理obj。通过ID,可以一层层定位到叶子层,叶子层的指针指向的就是我们要管理的obj。 需要指出的是32叉树,不一定每个分支都分配好了idr_layer,用到了再分配,防止浪费,比如示意图中,并没有用到32~63,我们看到top->ary[1]为NULL。如有需要分配34了,那没办法,会在分配过程中分配个idr_layer,top->ary[1]指向分配的idr_layer。

    void *idr_find(struct idr *idp, int id)
    {
    	int n;
        struct idr_layer *p;
        n = idp->layers * IDR_BITS;
        p = idp->top;
    
        /* Mask off upper bits we don't use for the search. */
        id &= MAX_ID_MASK;
        if (id >= (1 << n))
    		return NULL;
    
        while (n > 0 && p) {
    		n -= IDR_BITS;
    		p = p->ary[(id >> n) & IDR_MASK];
        }
    
        return((void *)p);
    }
    

    下面分析如果给一个obj分配个ID。
    提供两个函数给obj分配ID

    int idr_get_new(struct idr *idp, void *ptr, int *id)
    int idr_get_new_above(struct idr *idp, void *ptr, int starting_id, int *id)
    

    参数说明:

    idp---不说了,管理结构idr的指针,对应示意图中最左面的那个结构。
    ptr---指向要管理的结构的指针,我们的任务就是给它分配个小数字,作为他的身份证。成功之后,我们可以拿着这个ID,直接找到ptr。
    id----输出参数,将分配的数字存入id。
    

    这两个函数其中idr_get_new比较乖,比较好说话,随便给他分配一个没人用的id就可以,他他不挑不捡。第二个函数idr_get_new_above有点难说话,要求挺多,他有个参数starting_id,要求分配不小于starting_id的一个数字作为id。
    两个函数都是调用了idr_get_new_above_int,区别是idr_get_new将starting_id填成了0.表示随便给分配个大于0的没被别人用的id就行。
    -EAGAIN的意思上面一讲提到过,这个是预备役全体阵亡的遗言,没有空闲的idr_layer用来分配了,所以失败了,如果用户非常需要给ptr分配个id,那么请先分配点预备役,即调用idr_pre_get。
    -ENOSPC的含义是你小子要的id太大了,超过了MAX_ID_BIT,即2^31,idr说,我是管理小数字的结构,拜托不要那这么大的数字骚扰我。

    if ((id >= MAX_ID_BIT) || (id < 0))
    	return -3;           //  sub_alloc函数中的语句
    
    int idr_get_new(struct idr *idp, void *ptr, int *id)
    {
    	int rv;
    	rv = idr_get_new_above_int(idp, ptr, 0);
    	/*
    	* This is a cheap hack until the IDR code can be fixed to
    	* return proper error values.
    	*/
    
    	if (rv < 0) {
    		if (rv == -1)
    			return -EAGAIN;
    		else /* Will be -3 */
    			return -ENOSPC;
    	}
    
    	*id = rv;
    	return 0;
    }
    

    酝酿了半天,可以聊聊idr_get_new_above_int这个了。

    idr_get_empty_slot函数是分配个大于starting_id的数字作为ptr的ID。如果分配成功,id>=0,将叶子节点id对应的ary数组的元素赋值为 ptr。同时将叶子层的count++,表示又分配出去一个。将叶子层的位图bitmap对应槽位置1的工作是idr_mark_full完成。如果叶子层全满了,则通知叶子层的父亲对应槽位置1,依次传递。

    static int idr_get_new_above_int(struct idr *idp, void *ptr, int starting_id)
    {
    
    	struct idr_layer *pa[MAX_LEVEL];
    	int id;
    	id = idr_get_empty_slot(idp, starting_id, pa);
    
    	if (id >= 0) {
    		/*
    	 	* Successfully found an empty slot.  Install the user
    	 	* pointer and mark the slot full.
    	 	*/
    		pa[0]->ary[id & IDR_MASK] = (struct idr_layer *)ptr;
    		pa[0]->count++;
    		idr_mark_full(pa, id);
    	} 
    	return id;
    
    }
    

    OK,到了idr_get_empty_slot。这个函数是干重活的函数。需要仔细研读代码。这个函数不举例子很难描述清楚,举例子又显得特别琐碎,很头疼。建议读者从0开始分配一直分配到32需要分层,就可以理解代码的含义。
    先讲初始化:

    #define IDR_INIT(name)                        
    {                                
    	.top        = NULL,                    
        .id_free    = NULL,                    
        .layers     = 0,                    
        .id_free_cnt    = 0,                    
        .lock        = __SPIN_LOCK_UNLOCKED(name.lock),    
    }    
    

    top等于NULL 表示我的32叉树还没建立起来,id_free =NULL,id_free_cnt=0表示不好意思,我的预备役也为空,没法为您分配idr_layer。这是最初的状态,32叉树连个根都没有,整个idr处于一穷二白的状态。

    	p = idp->top;
        layers = idp->layers;
    
        if (unlikely(!p)) {
    
        	if (!(p = alloc_layer(idp)))
    			return -1;
    		layers = 1;
    
        }
    

    idr_get_empty_slot这个部分,表示如果idr的32叉树连个根都没有,我需要分配一个idr_layer来当根。如果alloc_layer失败,表示预备役空了,惨了,只能返回失败,告诉调用者,预备役没了,请填充预备役。一般是可以分配的。

    这个循环体的含义是,用户这个搞得这个starting_id太大了,或者低的id分配出去了,只能给用户分配个大的id。如果这个id大于了当前层数所能管理的最高ID,我们需要加一层了。

    以上面的示意图为例,我们当前有两层结构,最多能管理32*32=1K个,我们能分配的最大id就是1023,如果用户要求我们分配大于等于1500的id,那么我们目前的两层结构是无法满足需要的,所以我们需要加一层。首先将layer++,表示我们的32叉树升级了,多了一层,从预备役分配出一个idr_layer,让新分配的new当根。p指针指向根。

    如果分配的id不够大,不需要分层,那么这个while就不执行了,直接跳到sub_alloc函数。

    	while ((layers < (MAX_LEVEL - 1)) && (id >= (1 << (layers*IDR_BITS)))) {
    		
    		layers++;
    		if (!p->count)//这个地方是应对特殊情况,比如0~31都没有分配,第一层还没有,用户                             
    						//上来要分配32或46这样明显是两层才能完成的结构
    			continue; 
    
            if (!(new = alloc_layer(idp))) {
    
            	/*
                 * The allocation failed.  If we built part of
                 * the structure tear it down.
                 */
    
                spin_lock_irqsave(&idp->lock, flags);
    			for (new = p; p && p != idp->top; new = p) {
    
    				p = p->ary[0];
    				new->ary[0] = NULL;
    				new->bitmap = new->count = 0;
    				__free_layer(idp, new);
    			}
    
    			spin_unlock_irqrestore(&idp->lock, flags);
    			return -1;
    
    		}
    
    		new->ary[0] = p;
    		new->count = 1;
    		if (p->bitmap == IDR_FULL)
    		__set_bit(0, &new->bitmap);
    		p = new;
    	}
    
    	idp->top = p;
    	idp->layers = layers;
    	v = sub_alloc(idp, &id, pa);
    	if (v == -2)
    		goto build_up;
    

    sub_alloc函数。

    还是以示意图为例讲述。我们是两层的结构,p是32叉树的根节点top

    如果用户要分配大于等于66的id,66=2*32+2,首先找到了我们要找的66是位于top->ary[2],我们需要确认 根的ary[2]这个分支是否还能分配。如果p->ary[2]对应的idr_layer 所有的槽位都分配出去了,客满,新的顾客无法入住,我们就不必白费劲去ary[2]这个分支去分配了。判断的办法就是m = find_next_bit(&bm, IDR_SIZE, n);这个函数很可爱,就是说我要找大于2 的所有分支,寻找第一个没有客满的分支。通过top层或者中间层bitmap的含义,如果某个分支全部客满,则在对应bitmap位置1 ,表示,不要去这个分支找了,找也白找。

    然后一层层往下找,知道找到叶子层,在叶子层查找大于等于2的id。
    各种情况我就不分析了,大家可以自己尝试分配一下:

    1. 从0开始,分配,累加到33,差不多就可以理解idr_get_new这种情况的分配流程
    2. 不按常理出牌,乱分配,假如我第一个就要分配 大于37的,第二次就要分配大于1500的,之类的,
      在走一遍流程,就可以理解相关的代码。
    while (1) {
    	/*
    	 * We run around this while until we reach the leaf node...
    	 */
    	n = (id >> (IDR_BITS*l)) & IDR_MASK;
    	bm = ~p->bitmap;
    	m = find_next_bit(&bm, IDR_SIZE, n);
    	if (m == IDR_SIZE) {
    		/* no space available go back to previous layer. */
    		l++;
    		oid = id;
    		id = (id | ((1 << (IDR_BITS * l)) - 1)) + 1;
    		/* if already at the top layer, we need to grow */
    
    		if (!(p = pa[l])) {
    			*starting_id = id;
    			return -2;
    		}
    	    /* If we need to go up one layer, continue the
    	     * loop; otherwise, restart from the top.
    	     */
    
    		sh = IDR_BITS * (l + 1);
    		if (oid >> sh == id >> sh)
    			continue;
    		else
    			goto restart;
    	}
    	if (m != n) {
    		sh = IDR_BITS*l;
    		id = ((id >> sh) ^ n ^ m) << sh;
    	}
    	if ((id >= MAX_ID_BIT) || (id < 0))
    		return -3;
    	if (l == 0)
    		break;
    	/*
    	 * Create the layer below if it is missing.
    	 */
    	
    	if (!p->ary[m]) {
    		if (!(new = alloc_layer(idp)))
    			return -1;
    		p->ary[m] = new;
    		p->count++;
    	}
    	pa[l--] = p;
    	
    
    	p = p->ary[m];
    } 
    

    参考文献 :IDR-integer ID management

  • 相关阅读:
    Jsp的内置标签和jstl标签
    Jsp中的EL表达式
    JSP和servlet结合案例
    Jsp:内置对象和四种域对象的理解
    编码实战Web端联系人的增删改查
    Session案例
    Cookie案例分析
    会话数据的保存——cookie
    ServletContext和ServletConfig
    Servlet(1)
  • 原文地址:https://www.cnblogs.com/yanghong-hnu/p/5699598.html
Copyright © 2020-2023  润新知