• C++调用HNSW实现图像配准


    HNSW

    分层的可导航小世界(Hierarchical Navigable Small World, HNSW)

    特点

    1、一种基于图的数据结构

    2、使用贪婪搜索算法的变体进行ANN搜索,每次选择最接近查询的未访问的相邻元素时,它都会从元素到另一个元素地遍历整个图,直到达到停止条件

    原理参考:

    https://blog.csdn.net/u011233351/article/details/85116719

    https://zhuanlan.zhihu.com/p/80552211?utm_source=wechat_session

    https://blog.csdn.net/qq_38156298/article/details/100085892

    一、什么特征作为输入

    1、原始特征,图像本身作为输入,显然这种情况不说效果如何,最起码数据量上就会很大,对RAM要求极大。一般不会作为输入特征

    2、SIFT特征, 图像处理中有很多特征提取方法,其中SIFT有代表性。当然也可以选择其他。这样大大的降低数据量的同时,也能起到降维的作用。将有效特征作为相似度比较的依据比较合理。

    3、DEEP特征,目前神经网络比较流行,可以利用这个方法提取特征。

    4、其他特征

    特征选择有一个原则:归一化的降维的主要特征。去除冗余点,这对我们后续的相似度检测有着很大的好处。

    二、参数M、efConstruction和max_elements

    1、M - the number of bi-directional links created for every new element during construction.

    M的合理范围在[2,200]。M越高,对于本身具有高维特征的数据集来讲,recall可能越高,性能越好;M越低,对于本身具有低维特征的数据集来讲,性能越好。

    建议M:12,16,32。因为特征已经选择过了,维度一般不会太高。

    2、efConstruction - the parameter has the same meaning as ef, but controls the index_time/index_accuracy.

    ef - the size of the dynamic list for the nearest neighbors (used during the search).

    efConstruction越大,构造时间越长,index quality越好。有时,efConstruction增加的过快并不能提升index quality。有一种方法可以检查efConstruction的选择是否可以接受。计算recall,当ef=efConstruction,在M值时,如果recall低于0.9,那么可以适当增加efConstruction的数值。

    3、max_elements - 检索的最大元素。

    这个参数取决于你创建的索引库的特征数量。如果你想要在1000,0000个特征中检测是否有相似的图像时,这个max_elements就要设置为1000,0000. 当然这也要看RAM是否支持这么多数据同时加载进来。

    三、demo

    https://github.com/pengzerong/hnsw-test

    流程

    1、读取两幅图像,分别对两张图提取SIFT特征

    Mat srcImg1 = imread("basketball1.png", 1);
    Mat srcImg2 = imread("basketball2.png", 1);
    if (srcImg1.empty() || srcImg2.empty())
        return -1;
    
    Ptr<cv::Feature2D> detector = xfeatures2d::SIFT::create(128);
    std::vector<KeyPoint> keypoints1, keypoints2;
    Mat descriptors1, descriptors2;
    // 提取图片的特征点及特征点描述
    detector->detect(srcImg1, keypoints1);
    detector->compute(srcImg1, keypoints1, descriptors1);
    rootSift(descriptors1);
    
    detector->detect(srcImg2, keypoints2);
    detector->compute(srcImg2, keypoints2, descriptors2);
    rootSift(descriptors2);

    2、特征归一化

    void rootSift(Mat &descriptors, const float eps = 1e-7)
    {
        // Compute sums for L1 Norm
        Mat sums_vec;
        descriptors = abs(descriptors); //otherwise we draw sqrt of negative vals
        reduce(descriptors, sums_vec, 1 /*sum over columns*/, CV_REDUCE_SUM, CV_32FC1);
        for (int row = 0; row < descriptors.rows; row++) {
            int offset = row * descriptors.cols;
            for (int col = 0; col < descriptors.cols; col++) {
                descriptors.at<float>(offset + col) = sqrt(descriptors.at<float>(offset + col) /
                    (sums_vec.at<float>(row) + eps) /*L1-Normalize*/);
            }
            // L2 distance
            normalize(descriptors.row(row), descriptors.row(row), 1.0, 0.0, NORM_L2);
    
        }
        return;
    }

    3、创建HNSW

    size_t maxCount = descriptors1.rows;
    int M = 32;
    int efConstruction = 100;// TestFindSelf,140以下有不能查找到自己的情况
    int vecdim = descriptors1.cols;// 特征维度
    hnswlib::InnerProductSpace *L2Space = new hnswlib::InnerProductSpace(vecdim);
    hnswlib::HierarchicalNSW<float> *hnsw = new hnswlib::HierarchicalNSW<float>(L2Space, maxCount, M, efConstruction);
    int count = 0;
    for (size_t i = 0; i < descriptors1.rows; i++)
    {
        float *mass = new float[vecdim];
        for (size_t j = 0; j < vecdim; j++)
        {
            mass[j] = descriptors1.at<float>(i, j);
        }
        hnsw->addPoint((void*)mass, count);
        ++count;
        delete[] mass;
    }

    4、匹配特征点,筛选出可以用来配准的特征点

    int nn = 3;
    std::vector<DMatch> matchPoints;
    Mat indices, dists;
    for (size_t i = 0; i < descriptors2.rows; i++)
    {
        float *mass = new float[vecdim];
        for (size_t j = 0; j < vecdim; j++)
        {
            mass[j] = descriptors2.at<float>(i, j);
        }
        std::priority_queue<std::pair<float, hnswlib::labeltype>> candidates = hnsw->searchKnn((void*)mass, nn);
        delete[] mass;
    
        for (int k = 0; k < nn; k++)
        {
            double dAngle = abs(keypoints2.at(i).angle - keypoints1.at(candidates.top().second).angle);
            if (abs(candidates.top().first) < 0.1 && dAngle < 10)
            {
                std::cout << i << " angle diff: " << dAngle << ", dist: " << candidates.top().first << " "<< candidates.top().second << std::endl;
                DMatch dmatches(candidates.top().second, i, candidates.top().first);
                matchPoints.push_back(dmatches);
            }
            candidates.pop();
        }
    }

    5、匹配效果

  • 相关阅读:
    线程 & 进程 & 协程
    redis入门
    插入排序
    java多线程(7)实现一个线程池
    java多线程(6)模拟排队叫号程序,4个线程都干活并且结果正确
    java多线程(5)模拟排队叫号程序,不能出现交替执行的结果
    java多线程(4)模拟排队叫号程序,不能出现交替执行的结果
    java多线程(3)其实本节和多线程无关,简单的模板设计模式
    java多线程(2)连续重启一个线程报错
    java多线程(1)
  • 原文地址:https://www.cnblogs.com/zerotoinfinity/p/12703634.html
Copyright © 2020-2023  润新知