• Eigen SSE兼容,内存分配,和std容器的兼容理解


    SSE支持128bit的多指令并行,但是有个要求是处理的对象必须要在内存地址以16byte整数倍的地方开始。不过这些细节Eigen在做并行化的时候会自己处理。

    但是,如果把一些Eigen的结构放到std的容器里面,比如vector,map。这些容器会把一个一个的Eigen结构在内存里面连续排放。

    可以想象,如果这些Eigen的结构本身不是16byte大小,一连续排放后,自然有很多对象就不是在16byte整数倍的地方开始了。

    Eigen提供了两种方法来解决:

    使用特别的内存分配对象

    std::map<int, Eigen::Vector4f, std::less<int>, Eigen::aligned_allocator<std::pair<const int, Eigen::Vector4f> > >

    std::vector<Eigen::Vector4f,Eigen::aligned_allocator<Eigen::Vector4f> >

    针对vector的时候,还需要额外添加头文件#include<Eigen/StdVector>

    在对象定义的时候,使用特殊的宏

    EIGEN_DEFINE_STL_VECTOR_SPECIALIZATION(Matrix2d)

    注意必须在所有Eigen对象出现前使用这个宏

    有这个问题的Eigen结构包括:

     1 Eigen::Vector2d
     2 Eigen::Vector4d
     3 Eigen::Vector4f
     4 Eigen::Matrix2d
     5 Eigen::Matrix2f
     6 Eigen::Matrix4d
     7 Eigen::Matrix4f
     8 Eigen::Affine3d
     9 Eigen::Affine3f
    10 Eigen::Quaterniond
    11 Eigen::Quaternionf

    另外如果上面提到的这些结构作为一个对象的成员,比如:

    1 class Foo
    2 {
    3   ...
    4   Eigen::Vector2d v;
    5   ...
    6 };
    7 ...
    8 Foo *foo = new Foo;

    这个时候需要在类定义里面使用另外一个宏:

     1 class Foo
     2 {
     3   ...
     4   Eigen::Vector2d v;
     5   ...
     6 public:
     7   EIGEN_MAKE_ALIGNED_OPERATOR_NEW
     8 };
     9 ...
    10 Foo *foo = new Foo;

    原因分析:对象内部的内存分配是相对与对象的地址的。如果对象的地址不是16byte对齐的,里面的成员并不会知道这个信息,所以没有办法分配16byte对其的地址。解决办法就是强制让分配对象的时候,就给一个16byte对齐的地址。

    EIGEN_MAKE_ALIGNED_OPERATOR_NEW会重载new函数。

  • 相关阅读:
    新建立了个集邮 Blog
    删除8848的mysearch
    VS2005的中国发布会
    免费的PDF生成工具
    FreeBASIC
    今天收到了WinZip发来的免费License
    简洁的 Bash 编程技巧
    benhuan039sblog.wordpress.20121111.xml_.txt
    新浪微博除掉推荐微博
    自制力也是一种力量
  • 原文地址:https://www.cnblogs.com/ybqjymy/p/16442735.html
Copyright © 2020-2023  润新知