• MATLAB conv2卷积的实现


    MATLAB conv2卷积的实现

    二维卷积的算法原理比较简单,参考任意一本数字信号处理的书籍,而matlab的conv2函数的滤波有个形状参数,用下面的一张图很能说明问题:

    这里给出一种最原始的实现方案。这种实现对于数据矩阵大小为1000x1000,卷积核矩阵大小为20x20,在我的机器上需要大约1秒钟的时间,而matlab采用的MKL库最快只需要将近0.1s的时间。下面的代码用到了自己目前开发的FastIV中的一些函数接口。具体代码如下:

    [cpp] view plaincopy在CODE上查看代码片派生到我的代码片
     
    1. #include "fiv_core.h"  
    2.   
    3. typedef enum{  
    4.     FIV_CONV2_SHAPE_FULL,  
    5.     FIV_CONV2_SHAPE_SAME,  
    6.     FIV_CONV2_SHAPE_VALID  
    7. }FIV_CONV_SHAPE;  
    8.   
    9.   
    10. void fIv_conv2(fIvMat** dst_mat, fIvMat* src_mat, fIvMat* kernel_mat, FIV_CONV_SHAPE shape)  
    11. {  
    12.     int src_row = src_mat->rows;  
    13.     int src_cols = src_mat->cols;  
    14.     int kernel_row = kernel_mat->rows;  
    15.     int kernel_cols = kernel_mat->cols;  
    16.     int dst_row = 0, dst_cols = 0, edge_row = 0, edge_cols = 0;  
    17.     int i,j, kernel_i,kernel_j,src_i,src_j;  
    18.     fIvMat* ptr_dst_mat = NULL;  
    19.       
    20.     switch(shape){  
    21.         case FIV_CONV2_SHAPE_FULL:    
    22.               
    23.             dst_row = src_row + kernel_row - 1;  
    24.             dst_cols = src_cols + kernel_cols - 1;        
    25.             edge_row = kernel_row - 1;  
    26.             edge_cols = kernel_cols - 1;  
    27.             break;  
    28.               
    29.         case FIV_CONV2_SHAPE_SAME:  
    30.               
    31.             dst_row = src_row;  
    32.             dst_cols = src_cols;  
    33.             edge_row = (kernel_row - 1) / 2;  
    34.             edge_cols = (kernel_cols - 1) / 2;  
    35.             break;  
    36.               
    37.         case FIV_CONV2_SHAPE_VALID:  
    38.               
    39.             dst_row = src_row - kernel_row + 1;  
    40.             dst_cols = src_cols - kernel_cols + 1;  
    41.             edge_row = edge_cols = 0;  
    42.             break;  
    43.               
    44.     }  
    45.       
    46.     ptr_dst_mat = fIv_create_mat(dst_row, dst_cols, FIV_64FC1);  
    47.     *dst_mat = ptr_dst_mat;  
    48.       
    49.     for (i = 0; i < dst_row; i++) {    
    50.         ivf64* ptr_dst_line_i = (ivf64* )fIv_get_mat_data_at_row(ptr_dst_mat, i);     
    51.         for (j = 0; j < dst_cols; j++) {       
    52.             ivf64 sum = 0;  
    53.               
    54.             kernel_i = kernel_row - 1 - FIV_MAX(0, edge_row - i);  
    55.             src_i = FIV_MAX(0, i - edge_row);  
    56.               
    57.             for (; kernel_i >= 0 && src_i < src_row; kernel_i--, src_i++) {  
    58.                   
    59.                 ivf64* ptr_src_line_i,*ptr_kernel_line_i;  
    60.                   
    61.                 kernel_j = kernel_cols - 1 - FIV_MAX(0, edge_cols - j);  
    62.                 src_j = FIV_MAX(0, j - edge_cols);  
    63.                   
    64.                 ptr_src_line_i = (ivf64*)fIv_get_mat_data_at_row(src_mat, src_i);  
    65.                 ptr_kernel_line_i = (ivf64*)fIv_get_mat_data_at_row(kernel_mat, kernel_i);  
    66.                   
    67.                 ptr_src_line_i += src_j;  
    68.                 ptr_kernel_line_i += kernel_j;  
    69.                   
    70.                 for (; kernel_j >= 0 && src_j < src_cols; kernel_j--, src_j++){  
    71.                     sum += *ptr_src_line_i++ * *ptr_kernel_line_i--;  
    72.                     }  
    73.             }             
    74.             ptr_dst_line_i[j] = sum;  
    75.         }  
    76.     }  
    77. }  
    78.   
    79.   
    80. FIV_ALIGNED(16) ivf64 ker_data[4*4] = {0.1,0.2,0.3,0.4,  
    81.                                        0.5,0.6,0.7,0.8,  
    82.                                        0.9,1.0,1.1,1.2,  
    83.                                        1.3,1.4,1.5,1.6};  
    84.   
    85.   
    86.   
    87. void test_conv2()  
    88. {  
    89.     fIvMat* src_mat = fIv_create_mat_magic(8, FIV_64FC1); // 8x8 magic matrix  
    90.     fIvMat* kernel_mat = fIv_create_mat_header(4, 4, FIV_64FC1);  
    91.   
    92.     fIvMat* dst_mat = NULL;  
    93.     fIv_set_mat_data(kernel_mat, ker_data, (sizeof(ivf64)) * 4 * 4);  
    94.   
    95.     fIv_conv2(&dst_mat, src_mat, kernel_mat, FIV_CONV2_SHAPE_FULL);  
    96.   
    97.     fIv_export_matrix_data_file(dst_mat,"dst_mat_4x4-full.txt", 1);  
    98.   
    99.   
    100.     fIv_release_mat(&src_mat);  
    101.     fIv_release_mat(&kernel_mat);  
    102.     fIv_release_mat(&dst_mat);  
    103.   
    104.   
    105.   
    106. }  
    107.   
    108. int main()  
    109. {  
    110.     test_conv2();  
    111.   
    112.     return 0;  
    113. }  

     10月24日更新:

    目前FastIV中的实现已经经过优化,最快速度在我的机器上已经超越MATLAB。

  • 相关阅读:
    测试存储过程性能
    如何修改Oracle字符集
    Hadoop学习地址
    HiveQ与传统SQL差异
    PHP7 学习笔记(十二)Stream 函数详解
    Linux 命令详解(十二)Systemd 入门教程:使用定时器发送邮件(mail)
    【坑】zsh和oh-my-zsh卸载后导致无法登陆
    Golang入门教程(十六)Goridge -高性能的 PHP-to-Golang RPC编解码器库
    Nginx 学习笔记(十)介绍HTTP / 2服务器推送(译)
    Golang入门教程(十五)指针
  • 原文地址:https://www.cnblogs.com/yymn/p/4589543.html
Copyright © 2020-2023  润新知