• OpenMP入门教程(一)


    什么是OpenMP

    Open Multi-Processing的缩写,是一个应用程序接口(API),可用于显式指导多线程、共享内存的并行性。

    在项目程序已经完成好的情况下不需要大幅度的修改源代码,只需要加上专用的pragma来指明自己的意图,由此编译器可以自动将程序进行并行化,并在必要之处加入同步互斥以及通信。当选择忽略这些pragma,或者编译器不支持OpenMp时,程序又可退化为通常的程序(一般为串行),代码仍然可以正常运作,只是不能利用多线程来加速程序执行。OpenMP提供的这种对于并行描述的高层抽象降低了并行编程的难度和复杂度,这样程序员可以把更多的精力投入到并行算法本身,而非其具体实现细节。对基于数据分集的多线程程序设计,OpenMP是一个很好的选择。

    OpenMP支持的语言包括C/C++、Fortran;而支持OpenMP的编译器VS、gcc、clang等都行。可移植性也很好:Unix/Linux和Windows

      OpenMP编程模型

      内存共享模型:OpenMP是专为多处理器/核,共享内存机器所设计的。底层架构可以是UMA和NUMA。即(Uniform Memory AccessNon-Uniform Memory Access)

      基于线程的并行性

    • OpenMP仅通过线程来完成并行
    • 一个线程的运行是可由操作系统调用的最小处理单
    • 线程们存在于单个进程的资源中,没有了这个进程,线程也不存在了
    • 通常,线程数与机器的处理器/核数相匹配,然而,实际使用取决与应用程序

      明确的并行

    • OpenMP是一种显式(非自动)编程模型,为程序员提供对并行化的完全控制
    • 一方面,并行化可像执行串行程序和插入编译指令那样简单
    • 另一方面,像插入子程序来设置多级并行、锁、甚至嵌套锁一样复杂

      Fork-Join模型

    • OpenMP就是采用Fork-Join模型
    • 所有的OpenML程序都以一个单个进程——master thread开始,master threads按顺序执行知道遇到第一个并行区域
    • Fork:主线程创造一个并行线程组
    • Join:当线程组完成并行区域的语句时,它们同步、终止,仅留下主线程

      数据范围

    • 由于OpenMP时是共享内存模型,默认情况下,在共享区域的大部分数据是被共享的
    • 并行区域中的所有线程可以同时访问这个共享的数据
    • 如果不需要默认的共享作用域,OpenMP为程序员提供一种“显示”指定数据作用域的方法

      嵌套并行

    • API提供在其它并行区域放置并行区域
    • 实际实现也可能不支持

      动态线程

    • API为运行环境提供动态的改变用于执行并行区域的线程数
    • 实际实现也可能不支持

    简单使用

    在VS2017中就可以使用,具体的:新建一个C/C++程序,项目--属性--C/C++--语言--OpenMP支持,把OpenMP打开。然后编写带编译指令的并行程序,注意一定要加上<omp.h>头文件。

    写一个并行的Hello World

     1 #include <omp.h>
     2 #include <stdio.h>
     3 #include <stdlib.h>
     4 
     5 int main()
     6 {
     7     int nthreads, tid;
     8 
     9     /* Fork a team of threads giving them their own copies of variables */
    10     #pragma omp parallel private(nthreads, tid)
    11     {
    12 
    13         /* Obtain thread number */
    14         tid = omp_get_thread_num();
    15         printf("Hello World from thread = %d
    ", tid);
    16 
    17         /* Only master thread does this */
    18         if (tid == 0)
    19         {
    20             nthreads = omp_get_num_threads();
    21             printf("Number of threads = %d
    ", nthreads);
    22         }
    23 
    24     }  /* All threads join master thread and disband */
    25     return 0;
    26 }

    运行结果如下:

    注:我的电脑默认是4个线程,不同的电脑运行结果不同,就算是同一部电脑每次运行的结果也可能不同(4个线程并行执行,没有确定的先后顺序)

    也可以直接使用gcc加上-fopenmp编译,For example:

    1 g++ test.cpp -o test -fopenmp
    2 ./test

    (不知道我的gcc不行,只能用g++,枯了)

    补:直到原因了,gcc默认编译链接不会链接C++标准库,可以使用g++编译链接(如上),也可以在gcc链接时显示指定链接 -lstdc++

    gcc test.cpp -o test -fopenmp -lstdc++

    至于OpenMP详细的编写格式和意义可以看这篇博客。

    参考资料:

    1、https://blog.csdn.net/wyjkk/article/details/6612108

    2、https://blog.csdn.net/HW140701/article/details/73716363

    3、https://computing.llnl.gov/tutorials/openMP/#RunTimeLibrary

  • 相关阅读:
    如何最大限度提高.NET的性能
    Webserivce简单安全验证
    一些NLP相关的JD,作参考
    拼多多的故事
    storm的一些相关文章
    这篇文章不错,仔细读读,码农晋升为技术管理者后,痛并快乐着的纠结内心
    protobuf的反射机制
    如何清理Docker占用的磁盘空间?
    经典面试题:浏览器是怎样解析CSS的?
    代码编辑器横评:为什么 VS Code 能拔得头筹
  • 原文地址:https://www.cnblogs.com/lfri/p/10111315.html
Copyright © 2020-2023  润新知