openMP学习笔记 -编程模型

OpenMP模型

gcc编译openmp指令：gcc test.cpp -o test -fopenmp

定积分计算函数面积

给定一个定积分，计算其面积：
$\int^{1}_{0}{\frac{4.0}{(1+x^2)}dx}$

omp 概念

并行区域

并行区域用于多线程并行执行指令

#pragma omp parallel
{
    ... do lots of stuff
}//end of parallel region
1
2
3
4

临界区

临界区用于解决：内存竞争问题，该区块中的代码只能有一个线程执行，其他线程必须等待。

#pragma omp critical
{
    ... one or more lines of code
}
1
2
3
4

栅栏

栅栏用于解决线程同步问题，通过栅栏设置的锚点，必须等所有线程均执行到该位置才能继续往下执行。

#pragma omp barrier
//... continue work

1
2
3

栅栏通常用于这种情况，即必须在所有线程完成栅栏前的工作内容，才能继续往下执行。栅栏后的工作内容应当依赖所有线程栅栏前的工作全部完成才能执行，否则得不偿失。
因为栅栏所带来开销很大。这一点相当于cuda中的同步函数。

omp相关函数

int omp_get_num_threads() : 获取正在运行的线程数
int omp_get_thread_num() : 获取线程id
void omp_set_num_threads(int) : 获取要执行的线程数
double omp_get_wtime() : 返回以秒为单位的时间

串行执行

以横坐标为单位划分为指定数量的小块，取每个小块的中值作为该块的值，累加获得最终值。代码如下：

#include 
#include 
#include 
static long num_steps = 100000000;
double step;
int main(){
  int i;
  double x , pi , sum=0.0;
  double start_time , run_time;
  step = 1.0 / (double)num_steps;
  start_time = omp_get_wtime();
  for (int i=0; i

以padding的方式解决多线程计算总和问题

#include 
#include 
#include 
#include 
#include 
#define NTHREADS 12
double func(const double &x){
  return 4.0/(1.0+x*x);
}
template double Area(FunctionType func,const double &start, 
                                            const double &end, const long &num_steps){
  double width = (end-start)/num_steps;
  double hight[NTHREADS]={0.0};
  int actual_RunThreads;
  // omp_set_num_threads(NTHREADS);
  double start_time = omp_get_wtime();
  #pragma omp parallel
  {
    //获取线程id
    long thread_ID = omp_get_thread_num();
    //获取实际运行的线程数
    if(!thread_ID) actual_RunThreads = omp_get_num_threads();
    for(long i = thread_ID; i double AreaAgent(FunctionType func ,Args... args){
  return Area( func, args...);
}

int main(){
  std::function f = func;
  double area =  AreaAgent(f , 0.0 , 1.0 , 100000000);
  std::cout<<"area: "<

以临界区方式计算面积总和问题

#include 
#include 
#include 
#include 
#include 
double func(const double &x){
  return 4.0/(1.0+x*x);
}
template double Area(FunctionType func,const double &start, 
                                            const double &end, const long &num_steps){
  //获取每块的宽度
  //num_steps表示分为多少块
  double width = (end-start)/num_steps;
  double sum=0.0;
  int actual_RunThreads;
  double start_time = omp_get_wtime();
  //并行执行区域
  #pragma omp parallel
  {
    double partial_sum=0.0;
    //获取线程id
    long thread_ID = omp_get_thread_num();
    //获取实际运行的线程数
    if(!thread_ID) actual_RunThreads = omp_get_num_threads();
    //actual_RunThreads表示步长
    for(long i = thread_ID; i double AreaAgent(FunctionType func ,Args... args){
  return Area( func, args...);
}

int main(){
  std::function f = func;
  double area =  AreaAgent(f , 0.0 , 1.0 , 100000000);
  std::cout<<"area: "<

执行时间统计

线程数	串行	OMP	OMP消除伪共享	OMP临界区同步
1	0.290821	2.49737	2.51376	2.50391
2	0.290821	2.46001	2.55435	1.25341
3	0.290821	2.92166	1.90781	0.991777
4	0.290821	4.09134	1.26799	0.630626
5	0.290821	3.13144	2.53815	0.627318
6	0.290821	2.93112	1.24541	0.579776
7	0.290821	2.83655	2.95334	0.527468
8	0.290821	2.9195	0.826844	0.458585
9	0.290821	2.39431	0.852851	0.409409
10	0.290821	3.20907	0.82156	0.381328
11	0.290821	3.02943	1.91977	0.352992
12	0.290821	2.95709	0.737233	0.343221