如果你想开发CUDA应用软件,你可以选择
1. 努力学习CUDA开发技巧, 以及相关的并行技巧
‧ 深入掌握 SM/SP、thread、内存/显存之间关系,以及数据交换各种深层技术
‧ 针对不同状况进行 3~5 阶段的深度CUDA并行优化
‧ 当CUDA 版本更新、GPU架构改变时,需自行重新改写代码
2. 使用快速的 CUDA 开发、移植工具
‧ 只需具备 CUDA 基本知识即可
‧ 只需执行“算法优化”即可,无需花时间处理“系统优化”工作
‧ 即便CUDA或GPU底层架构改变,开发人员也无须更改代码
Quick-CUDA开发/移植工具,让您轻松实现GPU加速
1.Jacket for Matlab 快速开发/移植工具:
自2007年起,英伟达™(NVIDIA®)与AccelerEyes便一直开展合作,两家公司通过利用Jacket,从而将GPU的强大能力带给了广大MATLAB用户。 由于具有简单易用的特点、广泛的功能库以及强劲的GPU性能,Jacket编程在加速GPU平台MATLAB代码方面已经成为一种广受欢迎的方式。
2. libJacket for C/C++ & Fortran 快速开发:
LIBJACKET 使得C/C++拥有JACKET GPU函数和计算的库,其主要为加速C/C++开发,或者CUDA接口而设计的,LIBJACKET是一个简单的基于CUDA的库,可与任何C / C + +应用程序集成。
3. CULATools 线性函数库:
CULAtools是EM Photonics公司开发的在GPU上实现LAPACK数值线性代数库加速工具包,EM Photonics的CULA工具系列产品包括CULA基本版、高级版以及商业版。LAPACK是线性代数中常用函数的一个集合,被科学与工程界数以百万计的开发人员所广泛使用。他们所解决的问题通常可以由线性模型来模拟,因此这些问题就可以用线性代数例程来解决。通过利用NVIDIA的CUDATM架构,CULA可以为用户提供性能卓越的线性代数函数功能.
4. HMPP 快速移植工具:
特别针对 C/C++ 与 Fortran 开发之应用系统,快速移植到 GPU 平台
一个具有强大CUDA-OpenCL代码生成功能的混合编译器
使用HMPP™目标代码生成功能,即时对需要硬件加速的重要函数进行建模和性能评估。
代码生成器专门用来摘取C和Fortran代码中的绝大多数并行数据,并将它们转换成CUDA™和OpenCL代码。