• 【转】IplImage的数据结构


    http://www.cnblogs.com/plaqin/archive/2009/05/09/1453150.html

    http://www.opencv.org.cn/forum/viewtopic.php?p=16968

    由 于OpenCV主要针对的是计算机视觉方面的处理,因此在函数库中,最重要的结构体是IplImage结构。IplImage结构来源于Intel的另外 一个函数库Intel Image Processing Library (IPL),该函数库主要是针对图像处理。IplImage结构具体定义如下:

    typedef struct _IplImage

        {

            int nSize;         /* IplImage大小 */

            int ID;            /* 版本 (=0)*/

            int nChannels;     /* 大多数OPENCV函数支持1,2,3 或 4 个通道 */

            int alphaChannel; /* 被OpenCV忽略 */

            int depth;         /* 像素的位深度,主要有以下支持格式: IPL_DEPTH_8U, IPL_DEPTH_8S, IPL_DEPTH_16U,IPL_DEPTH_16S, IPL_DEPTH_32S,

    IPL_DEPTH_32F 和IPL_DEPTH_64F */

            char colorModel[4]; /* 被OpenCV忽略 */

            char channelSeq[4]; /* 同上 */

            int dataOrder;     /* 0 - 交叉存取颜色通道, 1 - 分开的颜色通道.

                                   只有cvCreateImage可以创建交叉存取图像 */

            int origin;        /*图像原点位置: 0表示顶-左结构,1表示底-左结构 */

            int align;         /* 图像行排列方式 (4 or 8),在 OpenCV 被忽略,使用 widthStep 代替 */

            int width;        /* 图像宽像素数 */

            int height;        /* 图像高像素数*/

            struct _IplROI *roi; /* 图像感兴趣区域,当该值非空时,

    只对该区域进行处理 */

            struct _IplImage *maskROI; /* 在 OpenCV中必须为NULL */

            void *imageId;     /* 同上*/

            struct _IplTileInfo *tileInfo; /*同上*/

            int imageSize;     /* 图像数据大小(在交叉存取格式下ImageSize=image->height*image->widthStep),单位字节*/

            char *imageData;    /* 指向排列的图像数据 */

            int widthStep;     /* 排列的图像行大小,以字节为单位 */

            int BorderMode[4]; /* 边际结束模式, 在 OpenCV 被忽略*/

            int BorderConst[4]; /* 同上 */

            char *imageDataOrigin; /* 指针指向一个不同的图像数据结构(不是必须排列的),是为了纠正图像内存分配准备的 */

        } IplImage;

    IplImage结构体是整个OpenCV函数库的基础,在定义该结构变量时需要用到函数cvCreatImage,变量定义方法如下:

    IplImage* src="/cvCreateImage"(cvSize(400,300), IPL_DEPTH_8U,3);

    上句定义了一个IplImage指针变量src,图像的大小是400×300,图像颜色深度8位,3通道图像。

    常用的五个函数(I/O)
    1.     图像载入函数

    函数cvLoadImage载入指定图像文件,并返回指向该文件的IplImage指针。函数支持bmp、jpg、 png、 tiff等格式的图像。其函数原型如下:

    IplImage* cvLoadImage( const char* filename, int iscolor);

    其中,filename 是待载入图像的名称,包括图像的扩展名;iscolor是一个辅助参数项,可选正数、零和负数三种值,正数表示作为三通道图像载入,零表示该图像作为单通道图像,负数表示载入图像的通道数由图像文件自身决定。

    2.     窗口定义函数

    函数cvNamedWindow定义一个窗口,用于显示图像。其函数原型如下:

    int cvNamedWindow( const char* name, unsigned long flags );

    其中,name是窗口名,flags是窗口属性指标值,可以选择CV_WINDOW_AUTOSIZE和0两种值。CV_WINDOW_AUTOSIZE表示窗口尺寸与图像原始尺寸相同,0表示以固定的窗口尺寸显示图像。

    3.     图像显示函数

    函数cvShowImage是在指定的窗口中显示图像,其函数原型如下:

    void cvShowImage( const char* name, const CvArr* image );

    其中,name是窗口名称,image是图像类型指针,一般是IplImage指针。

    4.     图像保存函数

    函数cvSaveImage以指定的文件名保存IplImage类型的指针变量,其函数原型如下:

    int cvSaveImage( const char* filename, const CvArr* image );

    其中,filename是图像保存路径和名称,image是IplImage指针变量。

    5.     图像销毁函数

    函数cvReleaseImage销毁已定义的IplImage指针变量,释放占用内存空间。其函数原型如下:

    void cvReleaseImage( IplImage** image );

     其中,image为已定义的IplImage指针。

      IplImage类型除了继承了CvMat类的成员变量外,还定义了一些跟图像有关的成员变量。这个结构体最初是定义在Intel's Image Processing Library(IPL)中的。以下是该数据结构的定义:
    typedef struct _IplImage {
      int                  nSize;
      int                  ID;
      int                  nChannels;
      int                  alphaChannel;
      int                  depth;
      char                 colorModel[4];
      char                 channelSeq[4];
      int                  dataOrder;
      int                  origin;
      int                  align;
      int                  width;
      int                  height;
      struct _IplROI*      roi;
      struct _IplImage*    maskROI;
      void*                imageId;
      struct _IplTileInfo* tileInfo;
      int                  imageSize;
      char*                imageData;
      int                  widthStep;
      int                  BorderMode[4];
      int                  BorderConst[4];
      char*                imageDataOrigin;
    } IplImage;

    depth和nChannels是非常重要的属性。depth代表颜色深度,使用的是以下定义的宏,nChannels是通道数,为1,2,3或4。
    depth的宏定义:
    IPL_DEPTH_8U,无符号8bit整数(8u)
    IPL_DEPTH_8S,有符号8bit整数(8s)
    IPL_DEPTH_16S,有符号16bit整数(16s)
    IPL_DEPTH_32S,有符号32bit整数(32s)
    IPL_DEPTH_32F,32bit浮点数,单精度(32f)
    IPL_DEPTH_64F,64bit浮点数,双精度(64f)

    另外两个重要的成员变量是origin和dataOrder.
    origin 变量可以有两个取值:IPL_ORIGIN_TL或者IPL_ORIGIN_BL,分别代表图像坐标系原点在左上角或是左下角。相应的,在计算机视觉领 域,一个重要的错误来源就是原点位置的定义不统一。例如,图像的来源不同,操作系统不同,视频解码codec不同,存储方式不同等等,都可以造成原点位置 的变化。例如,你可能认为你正在从图像上面的脸部附近取样,但实际上你却在图像下方的裙子附近取样。最初时,就应该检查一下你的系统中图像的原点位置,这 可以通过在图像上方画个形状等方式实现。
    dataOrder的取值可以是IPL_DATA_ORDER_PIXEL或者 IPL_DATA_ORDER_PLANE,这个成员变量定义了多通道图像数据存储时颜色数据的排列方式,如果是 IPL_DATA_ORDER_PIXEL,通道颜色数据排列将会是BGRBGR...的交错排列,如果是IPL_DATA_ORDER_PLANE,则 每个通道的颜色值在一起,有几个通道,就有几个“颜色平面”。大多数情况下,通道颜色数据的排列是交错的。
    widthStep与CvMat中的step类似,是以字节数计算的图像的宽度。成员变量imageData则保存了指向图像数据区首地址的指针。
    最 后还有一个重要参数roi(region of interest 感兴趣的区域),这个参数是IplROI结构体类型的变量。IplROI结构体包含了xOffset,yOffset,height,width,coi 成员变量,其中xOffset,yOffset是x,y坐标,coi代表channel of interest(感兴趣的通道)。有时候,OpenCV图像函数不是作用于整个图像,而是作用于图像的某一个部分。这是,我们就可以使用roi成员变量 了。如果IplImage变量中设置了roi,则OpenCV函数就会使用该roi变量。如果coi被设置成非零值,则对该图像的操作就只作用于被coi 指定的通道上了。不幸的是,许多OpenCV函数忽略了coi的值。

    访问图像中的数据

    就象访问矩阵中元素一样,我们希望 用最直接的办法访问图像中的数据,例如,如果我们有一个三通道HSV图像(HSV色彩属性模式是根据色彩的三个基本属性:色相H、饱和度S和明度V来确定 颜色的一种方法),我们要将每个点的饱和度和明度设置成255,则我们可以使用指针来遍历图像,请对比一下,与矩阵的遍历有何不同:
    void saturate_sv( IplImage* img ) {

      for( int y=0; yheight; y++ ) {
        uchar* ptr = (uchar*) (
          img->imageData + y * img->widthStep
        );
        for( int x=0; xwidth; x++ ) {
          ptr[3*x+1] = 255;
          ptr[3*x+2] = 255;
        }
      }
    }


    注 意一下,3*x+1,3*x+2的方法,因为每一个点都有三个通道,所以这样设置。另外imageData成员的类型是uchar*,即字节指针类型,所 以与CvMat的data指针类型(union)不同,而不需要象CvMat那样麻烦(还记得step/4,step/8的那种情形吗)。

    对roi和widthStep的补充

    roi 和widthStep在实际工作中有很重要的作用,在很多情况下,使用它们会提高计算机视觉代码的执行速度。这是因为它们允许对图像的某一小部分进行操 作,而不是对整个图像进行运算。在OpenCV中,所有的对图像操作的函数都支持roi,如果你想打开roi,可以使用函数 cvSetImageROI(),并给函数传递一个矩形子窗口。而cvResetImageROI()是用于关闭roi的。
    void cvSetImageROI(IplImage* image,CvRect rect);
    void cvResetImageROI(IplImage* image);
    注意,在程序中,一旦使用了roi做完相应的运算,就一定要用cvResetImageROI()来关闭roi,否则,其他操作执行时还会使用roi的定义。

    #pragma comment( lib, "cxcore.lib" )
    #pragma comment( lib, "cv.lib" )
    #pragma comment( lib, "highgui.lib" )
    #include
    #include
    #include
    int main(int argc, char** argv)
    {

        IplImage* src;
        cvNamedWindow("Example3_12_pre", CV_WINDOW_AUTOSIZE);
        cvNamedWindow("Example3_12_post", CV_WINDOW_AUTOSIZE);  
        src = cvLoadImage("dog.jpg");
        int x = 150;
        int y = 300;
        int width = 200;
        int height = 200;
        int add = 150;
        cvShowImage( "Example3_12_pre", src);
        cvSetImageROI(src, cvRect(x,y,width,height));
        cvAddS(src, cvScalar(add),src);//对roi区域的每通道颜色都加上一个值
        cvResetImageROI(src);
        cvShowImage( "Example3_12_post",src);
        cvWaitKey();
       cvReleaseImage( &src );
      cvDestroyWindow("Example3_12_pre");
      cvDestroyWindow("Example3_12_post");   
        return 0;
    }
    操作结果见下图:


    在上面的程序中,如果你在使用完roi后,没有使用 cvResetImageROI来关闭,效果是这样的:


    我 们可以通过聪明地使用widthStep达到使用roi的同样的效果,这就需要创建一个子窗口,并让子窗口的图像数据指针指向主窗口中相应位置,而所做的 操作是针对子窗口而做的。创建子窗口的其他方面不用多说,但是要注意,子窗口的颜色深度,通道数,widthStep都与主窗口相同,可以看下面的画图示 意。


    #pragma comment( lib, "cxcore.lib" )
    #pragma comment( lib, "cv.lib" )
    #pragma comment( lib, "highgui.lib" )
    #include
    #include
    #include
    int main(int argc, char** argv)
    {

        IplImage *src,*sub_img;
        cvNamedWindow("Example3_13_pre", CV_WINDOW_AUTOSIZE);
        cvNamedWindow("Example3_13_post", CV_WINDOW_AUTOSIZE);  
        src = cvLoadImage("dog.jpg");
        int x = 150;
        int y = 300;
        int width = 200;
        int height = 200;
        int add = 150;
        //子窗口的初始化
        sub_img =  cvCreateImageHeader(cvSize(width, height),src->depth,src->nChannels);
        sub_img->origin = src->origin;     
        //子窗口的widthStep和主窗口的widthStep相等
        sub_img->widthStep = src->widthStep;
        //注意这个公式,子窗口的图像数据指针首地址指向了主窗口中由子窗口左上角坐标x,y指定的相应位置
        sub_img->imageData = src->imageData + y * src->widthStep  + x * src->nChannels;
        cvShowImage( "Example3_13_pre", src);    
        cvAddS(sub_img, cvScalar(add),sub_img);
        cvShowImage( "Example3_13_post",src);
        cvWaitKey();
        cvReleaseImage( &src );
        //释放子窗口的头部资源
        cvReleaseImageHeader(&sub_img);
        cvDestroyWindow("Example3_13_pre");
        cvDestroyWindow("Example3_13_post");   
        return 0;
    }

    那么,既然我们有了很方便的roi机制,但为什么要费这么大劲用创建子窗口的办法呢?这是因为,roi机制一次只能作用于图像的一个子区域,如果要同时处理图像的多个子区域,还是用创建子窗口的办法最好,否则你就要频繁连续地对子区域进行设置roi和取消roi的操作了。

  • 相关阅读:
    第七周
    跳ajax方式进行前后台交互之后台代码要怎么写
    写代码要注意细节,无谓的找前台bug
    mysql复习增删改查
    jquery获取value值
    sql查阅每一月的数据
    登录模块需要用到session留底
    前后台使用ajax传list的时候,用value[] 获取值
    Datables wrning(table id='example'):Cannot reinitialise DataTable.
    动态规划1
  • 原文地址:https://www.cnblogs.com/fzzl/p/1512022.html
Copyright © 2020-2023  润新知