• cuda 使用trust库计算最值


    Thrust是并行算法和数据结构的基于GPU CUDA的C++库,类似于C++标准库stl,cuda安装后自带。Trust用于求最值的函数为min_element和max_element,和stl名字一样;

    我是偶然发现原来cuda还有一个这个库,在项目中,因为中间有一个过程需要最值的索引,原本我是把数据从显存中拷贝到主机,然后使用stl的标准库计算的,因为主机与设备之间的数据交换慢,速度不是很理想,本来想自己写核函数了,突然百度冒出来一个这个库,真是久旱逢甘霖啊;

    以max_element为例,一种方法是使用容器:

     thrust :: host_vector< float> h_vec(100); 
     thrust :: generate(h_vec.begin(),h_vec.end(),rand); 
     thrust :: device_vector< float> d_vec = h_vec; 
     
     thrust :: device_vector< float> :: iterator iter = 
     thrust :: max_element(d_vec.begin(),d_vec.end()); 
     
     int position = iter - d_vec.begin(); 
     float max_val = * iter; 
     
     std :: cout<< 最大值是”< max_val<< at position”<<位置<< std :: endl;

    但是容器有个麻烦事,在cuda计算中,核函数等不可能全部用容器当参数传入,如果求最值用容器,还得把指针所对应值压入容器中,数据小无多大关系,如果太大,又是一个消耗时间的事,这时可以用device_ptr:

    假设有一个设备指针dev_ptr,长度为N:

    thrust::device_ptr<float> d_ptr=thrust::device_pointer_cast<dev_ptr>;
    thrust::device_ptr<float> iter=thrust::max_element(d_ptr,d_ptr+N);
    float maxValue=*iter;
    int pos=iter-d_ptr;

    这里主要用到了指针地址的概念,因为通过new,malloc等申请的地址为虚拟地址,虽然对应的物理地址不一定连续,但虚拟地址是一定连续的,这样通过地址相减,就可以得到索引值;

    更多Trust的详情可以参考博客:https://blog.csdn.net/yychentracy/article/details/90729326

  • 相关阅读:
    hanlp在jdk11 maven8编译后在jdk8 报错
    Linux top命令输出到文件——持续输出某个进程的信息
    maven with depend
    解决mount时发生错误wrong fs type, bad option, bad superblock
    leetcode中 01背包问题相关汇总
    leetcode刷题总结901-950
    Xgboost如何处理缺失值/
    leetcode刷题总结851-900
    leetcode刷题总结801-850
    leetcode刷题总结751-800
  • 原文地址:https://www.cnblogs.com/zzzsj/p/16075797.html
Copyright © 2020-2023  润新知