• CUDA C编程,GPU编程,GPU优化计算


    CUDA C编程,GPU编程,GPU优化计算

    CUDA编程套路格式

    根据《GPU编程与优化》的学习有:

    1.获取配置GPU设备

    1 cudaSetDevice(0); //获取GPU设备,如果只有一个默认为0,这个时候可以缺省,其他情况这不行。

    2.分配GPU显存大小

    1 cudaMalloc((void**) &d_a, sizeof(float) *n); //分配显存

    3.Host2Device数据传输

    1 cudaMemcpy(d_a,a,sizeof(float) *n,cudaMemcpyHostToDevice); //数据传输,主机到设备

    4.调用kernel function

    1 gpu_kernel<<<blocks,threads>>>(***);  //kernel function调用

    5.Device2Host数据传输

    1 cudaMemcpy(a,d_a,sizeof(float) *n, cudaMemcpyDeviceToHost);
    2 //D2H数据传输,GPU结果返回CPU

    6.释放显存

    1 cudaFree(d_a) //释放显存空间,每个变量是一个显存空间,所以每个变量都要释放

    7.释放设备

    1 cudaDeviceReset(); //重置设备,可以省略
  • 相关阅读:
    HttpInvoker GET/POST方式
    maven命令
    java内存简单描述
    零零碎碎之SPU与SKU
    ZooKeeper的ACL权限
    ZooKeeper常用命令行操作
    Zookeeper基本数据模型
    ZooKeeper的安装及部署
    ZooKeeper原理及介绍
    Shell脚本编程(一)
  • 原文地址:https://www.cnblogs.com/nanmi/p/12617524.html
Copyright © 2020-2023  润新知