KOBE HPC サマースクール（初級）2023 講義10

713 Views

November 21, 23

#mpi #通信関数 #MPI #並列計算 #1対1通信 #集団通信 #HPC

スライド概要

R-CCS　計算科学研究推進室

@2300203199

スライド一覧

R-CCS　計算科学研究推進室

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

ダウンロード(pdf - 1.66MB)

関連スライド

各ページのテキスト

KOBE HPC サマースクール 2023（初級） 9. 1対1通信関数，集団通信関数 2022/9/20 KOBE HPCサマースクール 2023 1

1対1通信とは：通信関数MPI_Send, MPI_Recv あるrank（例えばRank 1のプロセスから，rank 3のプロセスにデータ（メッセージ）を送る例） rank 0 rank 1 rank 2 rank 3 MPI_Send メッセージ MPI_Recv メッセージ 2022/9/20 KOBE HPCサマースクール 2023 2

１対１通信関数を用いたMPIプログラム【問題】 1から100までの整数の和を2並列で求めなさい．プログラムの方針プロセス0：プロセス1： 1から50までの和を求める． 51から100までの和を求める．プロセス1の結果をプロセス0に転送プロセス0で，自分の結果と転送された結果を足して出力する． 2022/9/20 KOBE HPCサマースクール 2023 3

[beta]

MPIプログラム（sum.c）
#include <stdio.h>
#include <mpi.h>
int main( int argc, char **argv )
{
int start, end, i, sum_local, sum_recv;
int nprocs, myrank, tag;
MPI_Init( &argc, &argv);
MPI_Comm_size( MPI_COMM_WORLD, &nprocs );
MPI_Comm_rank( MPI_COMM_WORLD, &myrank );
tag = 100;
start = myrank
*50 + 1;
end
= (myrank+1)*50;
sum_local = 0;
for( i=start; i<=end; i++ ) {
sum_local = sum_local + i;
}
if( myrank == 1) {
MPI_Send( &sum_local, 1, MPI_INT, 0, tag, MPI_COMM_WORLD );
} else {
MPI_Recv( &sum_recv, 1, MPI_INT, 1, tag, MPI_COMM_WORLD, MPI_STATUS_IGNORE );
}
if( myrank == 0 ) printf("Sum = %d¥n", sum_local+sum_recv );
MPI_Finalize();
return 0;
}

2022/9/20

KOBE HPCサマースクール 2023

4

1対1通信 – 送信関数 MPI_Send（送り出し側） int MPI_Send(void *buff, int count, MPI_Datatype datatype, int dest, int tag, MPI_Comm comm) buff: 送信するデータの変数の先頭アドレス count: 送信するデータの個数 datatype: 送信するデータの型 MPI_CHAR, MPI_INT, MPI_DOUBLE など dest: 送信先のMPIプロセス番号（destination） tag: メッセージ識別番号．送るデータを区別するための番号 comm: コミュニケータ（例えば，MPI_COMM_WORLD） ※ 関数の戻りコードは，エラーコード 2022/9/20 KOBE HPCサマースクール 2023 5

1対1通信 – 受信関数 MPI_Recv（受け取り側） int MPI_Recv(void *buff, int count, MPI_Datatype datatype, int source, int tag, MPI_Comm comm, MPI_Status *status) buff: 送信するデータの変数名（先頭アドレス） count: 送信するデータの個数 datatype: 送信するデータの型 MPI_INT, MPI_DOUBLE, MPI_CHAR など source: 送信元のMPIプロセス番号 tag: メッセージ識別番号．送るデータを区別するための番号 comm: コミュニケータ（例えば，MPI_COMM_WORLD） status: 状況オブジェクト．MPI_Send には，この引数は無いので注意． ※特に状況情報が必要ない場合は MPI_STATUS_IGNORE を指定しておくことが可能． ※ 関数の戻りコードは，エラーコード 2022/9/20 KOBE HPCサマースクール 2023 6

関数の引数に関する注意（共通） buff 送受信するデータの先頭アドレスを指定する．変数なら「&buff」，配列の要素 i が先頭なら「&buff[i]」など（C言語の場合）．Fortranなら「buff」，「buff(i)」．送信するデータは領域は，メモリ上で連続アドレスでなければならない． “先頭アドレスからｘｘバイトを送れ” という関数なので．他の通信関数でも同じ．したがって，メモリ上で離れたところにある複数の変数を，１回の通信で同時に送りたい場合は，他の変数に連続してパック（pack）させてから，送る必要がある． datatype：予約語（決まっている） MPI_INT（整数型），MPI_DOUBLE（倍精度実数型），MPI_CHAR（文字型）などが使用できる．バイト数を計算するために必要 tag 同じプロセスに対し，複数回メッセージを送るとき，メッセージを受取ったプロセスが，どのメッセージかを区別するために使用する．受取側の MPI_Recv では，メッセージに対応した tag で受け取らなければならない．複数回のメッセージでも，送受信の順番などを区別できる場合は，同じ tag でも良い． 2022/9/20 KOBE HPCサマースクール 2023 7

演習9-1 1から100までの和を2並列で求めるプログラムの実行 1 から 100 までの整数の和を2並列で求めるプログラム（sum.c）を2プロセスで実行し，結果を確認せよ．【手順】 ① /home/guest60/share/sum.c を適切なディレクトリにコピーする． ② sum.c をコンパイルする． • icc sum.c -lmpi ③ jobm.sh を必要に応じて修正して，ジョブを実行． ④ バッチジョブ出力結果（sum.onnnnnn）を確認する．正しい答え（Sum = 5050）が出力されているか？プロセス0（rank 0）だけが出力していることに注意． 2022/9/20 KOBE HPCサマースクール 2023 8

ジョブキャンセル 3分待って計算が完了しなければ，ジョブは強制終了されます．ジョブスクリプトの walltime で上限時間を変更可能です．ただし本演習の範囲では3分経っても完了しない場合，間違いがある可能性大です．バッチジョブ・スクリプトの例（プロセス数 2 の場合） #!/bin/bash #PBS –q WS #PBS -l select=1:ncpus=2:mpiprocs=2 #PBS –l walltime=00:03:00 #PBS -N hello #PBS -j oe source /etc/profile.d/modules.sh module load intel module load mpt cd ${PBS_O_WORKDIR} mpiexec_mpt -np 2 dplace –s1 ./a.out ジョブを途中で終了したい場合は「qdel ジョブ番号」でキャンセルして下さい． 2022/9/20 KOBE HPCサマースクール 2023 9

10.

演習9-2（発展）ここまで完了した人は講師・TAに知らせてください 1 から 100 までの整数の和を求めるプログラムを，4並列で実行できるように修正し，4プロセスで実行せよ．プロセス0が結果を出力する． MPI_Send，MPI_Recv 関数だけを使うこと．プログラム改良のヒント各プロセスの部分和を計算する範囲を，myrank をうまく使って求める．myrank は，0 から 3 の整数である． myrank ≠ 0 以外のプロセスから，プロセス0（myrank=0）に部分和を送信する．プロセス0（myrank=0）は，他の3つのプロセスから送られた部分和を受信（forループ）し，受信するごとに受信したデータを加え，全体の和を計算する． 2022/9/20 KOBE HPCサマースクール 2023 10

11.

集団通信関数を用いたMPIプログラム１対１通信関数の煩雑な点プロセス数が多くなると，１対１通信関数を用いたプログラムは複雑煩雑になるとバグが入りやすい．もっと簡単な方法はないのか？ → 集団通信関数 MPI_Bcast あるプロセスから，すべてのプロセスに値を一斉に配る関数 MPI_Reduce すべてのプロセスから，あるプロセス（例えば rank 0）に値を集めて，何らかの演算（+，ｘ， max，minなど）を適用する関数 2022/9/20 KOBE HPCサマースクール 2023 11

12.

[beta]

集団通信関数を用いたMPIプログラム（sum_reduction.c）
※ついでに解く問題を「1から10000まで整数の和（答えは50005000）」にする
#include <stdio.h>
#include <mpi.h>
int main( int argc, char **argv )
{
int start, end, i, sum_local, sum, n;
int nprocs, myrank;
MPI_Init( &argc, &argv);
MPI_Comm_size( MPI_COMM_WORLD, &nprocs );
MPI_Comm_rank( MPI_COMM_WORLD, &myrank );
if( myrank == 0 ) n = 10000;
MPI_Bcast( &n, 1, MPI_INT, 0, MPI_COMM_WORLD );
start = myrank
*(n/nprocs) + 1;
end
= (myrank+1)*(n/nprocs);
sum_local = 0;
for( i=start; i<=end; i++ ) {
sum_local += i;
}
sum = 0;
MPI_Reduce( &sum_local, &sum, 1, MPI_INT, MPI_SUM, 0, MPI_COMM_WORLD );
if( myrank == 0 ) printf("Sum = %d¥n", sum );
MPI_Finalize();
return 0;

}
2022/9/20

KOBE HPCサマースクール 2023

12

13.

[beta]

MPIプログラム（sum_reduction.c）
• 青：MPIプログラムのおまじない（既出）
• 緑：プロセス番号（ランク）に応じた処理
• 赤：MPI関数によるプロセス間通信

#include <stdio.h>
#include <mpi.h>
int main( int argc, char **argv )
{
int start, end, i, sum_local, sum, n;
int nprocs, myrank;

プロセス0が nの値をセットする
MPI_Init( &argc, &argv);
MPI_Comm_size( MPI_COMM_WORLD, &nprocs );
MPI_Comm_rank( MPI_COMM_WORLD, &myrank );

nの値を全プロセスに放送

if( myrank == 0 ) n = 10000;
MPI_Bcast( &n, 1, MPI_INT, 0, MPI_COMM_WORLD );
start = myrank
*(n/nprocs) + 1;
end
= (myrank+1)*(n/nprocs);
sum_local = 0;
for( i=start; i<=end; i++ ) {
sum_local += i;
}

ランクの値から自分の計算範囲を求める
各プロセスが
部分和を計算

sum = 0;
MPI_Reduce( &sum_local, &sum, 1, MPI_INT, MPI_SUM, 0, MPI_COMM_WORLD );

部分和の総和を計算
（プロセス０に集める）

if( myrank == 0 ) printf("Sum = %d¥n", sum );
MPI_Finalize();
return 0;

プロセス0だけが結果を出力

}
2022/9/20

KOBE HPCサマースクール 2023

13

14.

集団通信－ broadcast int MPI_Bcast(void *buff, int count, MPI_Datatype datatype, int root, MPI_Comm comm) ※ rootが持つbuffの値を，commで指定された他のプロセスのbuffに配布する． buff: 送り主（root）が送信するデータの変数名（先頭アドレス）他のMPIプロセスは，同じ変数名でデータを受け取る． count: データの個数 datatype: 送信するデータの型 MPI_INT, MPI_DOUBLE, MPI_CHAR など root: 送り主のMPIプロセス番号 comm: コミュニケータ（例えば，MPI_COMM_WORLD） ※ 関数の戻りコードは，エラーコードを表す． 2022/9/20 KOBE HPCサマースクール 2023 14

15.

集団通信－ broadcast ある単一のプロセスから，すべてのプロセスにデータ（メッセージ）を送る．例） Rank 0 Rank 1 Rank 2 Rank 3 MPI_Bcast MPI_Bcast MPI_Bcast MPI_Bcast メッセージ全てのプロセスで同時発行することに注意（SPMD）メッセージメッセージメッセージ 2022/9/20 KOBE HPCサマースクール 2023 15

16.

集団通信－ reduction int MPI_Reduce(void *sendbuff, void *recvbuff, int count, MPI_Datatype datatype, MPI_Op op, int root, MPI_Comm comm) ※ commで指定されたすべてのプロセスからデータをrootが集め，演算（op）を適用する． sendbuff: 送信するデータの変数名（先頭アドレス） recvbuff: 受信するデータの変数名（先頭アドレス） count: データの個数 datatype: 送信するデータの型 MPI_INT, MPI_DOUBLE, MPI_CHAR など集まってきたデータに適用する演算の種類 op: MPI_SUM（総和），MPI_PROD（掛け算），MPI_MAX（最大値）など root: データを集めるMPIプロセス番号 comm: コミュニケータ（例えば，MPI_COMM_WORLD） ※ 関数の戻りコードは，エラーコードを表す． 2022/9/20 KOBE HPCサマースクール 2023 16

17.

1つのプロセスへのリダクション：MPI_Reduce すべてのプロセスから一つのプロセスにデータを集めて，演算をする．例） Rank 0 Rank 1 Rank 2 全てのプロセスで同時発行 Rank 3 することに注意（SPMD） MPI_Reduce MPI_Reduce MPI_Reduce MPI_Reduce sendbuf sendbuf sendbuf sendbuf + Reduction演算 recvbuf 2022/9/20 KOBE HPCサマースクール 2023 17

18.

リダクション演算とはリダクション演算加算，乗算，最大値のように，複数のデータを入力として1個の出力データを求める演算 MPIで使えるリダクション演算 MPI_SUM（和），MPI_PROD（積）， MPI_MAX（最大値），MPI_MIN（最小値） ※他にも論理和などがあるベクトルに対するリダクション演算も可能ベクトルの各要素に対してリダクション演算を行い，その結果を要素とするベクトルを生成 𝑚 個のベクトル 𝒙1 , 𝒙2 , 𝒙3 , ⋯ , 𝒙𝑚 をそれぞれ長さ 𝑛 のベクトルとするとき，それらの和 𝒙 = 𝒙1 + 𝒙2 + 𝒙3 + ⋯ + 𝒙𝑚 を求める計算引数 count には，ベクトルの長さ 𝑛 を指定すればよい． 2022/9/20 KOBE HPCサマースクール 2023 18

19.

演習9-3 集団通信関数を使ったプログラムの実行プログラム sum_reduction.c を，2 MPIプロセス，4 MPIプロセスで実行し，結果を確認せよ．【手順】 ① /home/guest60/share/sum_reduction.c を適切なディレクトリにコピーする． ② sum_reduction.c をコンパイルする． • icc sum_reduction.c -lmpi ③ jobm.sh を修正して，ジョブを実行． ④ バッチジョブ出力結果（sum.onnnnnn）を確認する．出力に正しい答え（Sum = 50005000）が出力されているか？ 2022/9/20 KOBE HPCサマースクール 2023 19

20.

[beta]

演習9-4（発展1）
プロセス毎に部分和を出力した後，どこかのプロセス（例えば rank #0）で総和
を計算し，その総和をすべてのプロセスで出力をせよ.
それぞれのプロセスが出力する総和が同じであることを確認する）．
出力のイメージ
Rank: n -> Local sum = xxxx
Rank: n -> Total sum = xxxx

プログラム改良のヒント
MPI_Reduce，MPI_Bcast を順番に使う（集めてから配信）．
各プロセスで，printf で出力させる．
printf("Rank: %d -> Local sum = %d", myrank, sum_local);

同じ処理をする関数 MPI_Allreduce がある．
2022/9/20

KOBE HPCサマースクール 2023

20

21.

すべてのプロセスへのリダクション：MPI_Allreduce すべてのプロセスで，すべてのプロセスからデータを集めて，演算をする．例） Rank 0 Rank 1 Rank 2 Rank 3 全てのプロセスで同時発行することに注意（SPMD） MPI_Allreduce MPI_Allreduce MPI_Allreduce MPI_Allreduce sendbuf sendbuf sendbuf sendbuf + + + + recvbuf recvbuf recvbuf recvbuf 🐁「sendbuf」と「recvbuf」はメモリ上で重複させないこと．そうでなければ，動作は保証されない． 2022/9/20 KOBE HPCサマースクール 2023 21

22.

集団通信－ MPI_Allreduce int MPI_Allreduce( void *sendbuff, void *recvbuff, int count, MPI_Datatype datatype, MPI_Op op, MPI_Comm comm ) ※ MPI_ReduceとMPI_Bcastを同時に行える関数．すべてのプロセスで同じ結果（総和など）が得られる． sendbuff: 送信するデータの変数名（先頭アドレス） recvbuff: 受信するデータの変数名（先頭アドレス） count: データの個数 datatype: 送信するデータの型 MPI_INT, MPI_DOUBLE, MPI_CHAR など集まってきたデータに適用する演算の種類 op: MPI_SUM（総和），MPI_PROD（掛け算），MPI_MAX（最大値）など comm: コミュニケータ（例えば，MPI_COMM_WORLD） ※ 関数の戻りコードは，エラーコードを表す． 2022/9/20 KOBE HPCサマースクール 2023 22

23.

演習9-5（発展2） MPI_Reduce，MPI_Bcast の組を MPI_Allreduce で書き換えよ．出力のイメージは，書き換え前と同じ． Rank: n -> Local sum = xxxx Rank: n -> Total sum = xxxx プログラム改良のヒント MPI_Allreduceの引数である sendbuff，recvbuff をうまく指定する． 2022/9/20 KOBE HPCサマースクール 2023 23

24.

演習9-6 MPI_Allreduceの応用：ベクトルの正規化 𝑛次元ベクトル 𝒙 （double x[N]，real*8 :: x(N)）の 𝑖 番目の要素を 𝑖 とする． C言語版（配列要素番号は 0 から開始）: 𝑥 𝑖 = 𝑖 + 1 （𝑖 = 0, ⋯ , 𝑛 − 1） Fortran言語版（配列要素番号は 1 から開始） : 𝑥 𝑖 = 𝑖 （𝑖 = 1, ⋯ , 𝑛） 𝒙 を正規化したベクトル 𝒙Τ 𝒙 2 を求めるプログラム normalize.{c/f90} の逐次実行動作を確認せよ．変数は倍精度（double）とし，倍精度で計算する． 𝒙 2 は 𝒙 の各要素の2乗和の平方根である．正規化されたベクトルの要素は 𝑥෤ 𝑖 = 𝑖 + 1 Τ 𝑛(𝑛 + 1)(2𝑛 + 1)/6（C）, 𝑥෤ 𝑖 = 𝑖 Τ 𝑛(𝑛 + 1)(2𝑛 + 1)/6（Fortran）であるので（簡単に計算できる），プログラムではこの値と比較することによって，正しく計算ができている（Error = 0.0）ことを確認している． $ cp /home/guest60/share/normalize.c ./ $ icc -O3 normalize.c $ ./a.out Error = 0.000000 2022/9/20 $ cp /home/guest60/share/normalize.f90 ./ $ ifort -O3 normalize.f90 $ ./a.out Error = 0.0000 KOBE HPCサマースクール 2023 24

25.

演習9-7 normalize.{c/f90}を並列化せよ ※ここまで出来た人は今日は終了です．各プロセスが自分の担当分の要素について，2乗和を計算する．各プロセスの担当する要素（nprocs はMPIプロセス数） istart = (n/nprocs)*myrank iend = (n/nprocs)*(myrank+1)-1 プロセス0 プロセス1 プロセス2 プロセス3 ベクトルの格納方法各プロセスは長さ n の配列を持ち，そのうち自分の担当部分のみを使うプロセス0 プロセス0では，ここの部分が使われない全プロセスの総和を MPI_Allreduce 関数で求め，各プロセスはその総和を使って，自分の担当する要素について正規化を行う． n=50000 としてプロセス数を 1，2，4，8 と変えて計算せよ．結果の確認も工夫すること． 2022/9/20 KOBE HPCサマースクール 2023 25

26.

参考：Fortran版 2022/9/20 KOBE HPCサマースクール 2023 26

27.

MPIプログラム（sum.f90） program sum100_by_mpi use mpi implicit none integer :: i, istart, iend, isum_local, isum_recv integer :: nprocs, myrank, ierr call MPI_Init( ierr ) call MPI_Comm_size( MPI_COMM_WORLD, nprocs, ierr ) call MPI_Comm_rank( MPI_COMM_WORLD, myrank, ierr ) istart = myrank*50 + 1 iend = (myrank+1)*50 isum_local = 0 do i = istart, iend isum_local = isum_local + i enddo if( myrank == 1 ) then call MPI_Send( isum_local, 1, MPI_INTEGER, 0, 100, MPI_COMM_WORLD, ierr ) else call MPI_Recv( isum_recv, 1, MPI_INTEGER, 1, 100, MPI_COMM_WORLD, MPI_STATUS_IGNORE, ierr ) end if if( myrank == 0 ) print *, 'sum =', isum_local+isum_recv call MPI_Finalize( ierr ) end program sum100_by_mpi 2022/9/20 KOBE HPCサマースクール 2023 27

28.

MPIプログラム（sum.f90） program sum100_by_mpi use mpi implicit none integer :: i, istart, iend, isum_local, isum_recv integer :: nprocs, myrank, ierr • 青：MPIプログラムのおまじない（既出） • 緑：プロセス番号（ランク）に応じた処理 • 赤：MPI関数によるプロセス間通信 call MPI_Init( ierr ) call MPI_Comm_size( MPI_COMM_WORLD, nprocs, ierr ) ランクの値から自分の計算範囲を求める call MPI_Comm_rank( MPI_COMM_WORLD, myrank, ierr ) istart = myrank*50 + 1 iend = (myrank+1)*50 プロセス1はプロセス0に自分 isum_local = 0 の部分和を送信 do i = istart, iend 各プロセスが isum_local = isum_local + i 部分和を計算 enddo if( myrank == 1 ) then call MPI_Send( isum_local, 1, MPI_INTEGER, 0, 100, MPI_COMM_WORLD, ierr ) else call MPI_Recv( isum_recv, 1, MPI_INTEGER, 1, 100, MPI_COMM_WORLD, MPI_STATUS_IGNORE, ierr ) end if プロセス0はプロセス1から部 if( myrank == 0 ) print *, 'sum =', isum_local+isum_recv 分和を受信（変数名が違うこ call MPI_Finalize( ierr ) プロセス0が，総和を出力とに注意） end program sum100_by_mpi 2022/9/20 KOBE HPCサマースクール 2023 28

29.

1対1通信 – 送信関数 mpi_send（送り出し側） mpi_send( buff, count, datatype, dest, tag, comm, ierr ) ※ ランク番号destのプロセスに，変数buffの値を送信する． buff: 送信するデータの変数名（先頭アドレス） count: 送信するデータの数（整数型） datatype: 送信するデータの型 MPI_INTEGER, MPI_REAL, MPI_DOUBLE_PRECISIONなど dest: 送信先プロセスのランク番号 tag: メッセージ識別番号．送るデータを区別するための番号 comm: コミュニケータ（例えば，MPI_COMM_WORLD） ierr: 戻りコード（整数型） 2022/9/20 KOBE HPCサマースクール 2023 29

30.

1対1通信 – 受信関数 mpi_recv（受け取り側） mpi_recv( buff, count, datatype, source, tag, comm, status, ierr ) ※ ランク番号sourceのプロセスから送られたデータを，変数buffに格納する． buff: 受信するデータのための変数名（先頭アドレス） count: 受信するデータの数（整数型） datatype: 受信するデータの型 MPI_INTEGER, MPI_REAL, MPI_DOUBLE_PRECISIONなど source: 送信してくる相手プロセスのランク番号 tag: メッセージ識別番号．送られて来たデータを区別するための番号 comm: コミュニケータ（例えば，MPI_COMM_WORLD） status: 受信の状態を格納するサイズ MPI_STATUS_SIZE の配列（整数型） ierr: 戻りコード（整数型） 2022/9/20 KOBE HPCサマースクール 2023 30

31.

MPIプログラム（sum_reduction.f90） • 青：MPIプログラムのおまじない（既出） • 緑：プロセス番号（ランク）に応じた処理 • 赤：MPI関数によるプロセス間通信 program sum_by_reduction use mpi implicit none integer :: n, i, istart, iend, isum_local, isum integer :: nprocs, myrank, ierr プロセス0がｎの値をセットする call MPI_Init( ierr ) call MPI_Comm_size( MPI_COMM_WORLD, nprocs, ierr ) call MPI_Comm_rank( MPI_COMM_WORLD, myrank, ierr ) ｎの値を放送 if( myrank==0) n=10000 call MPI_Bcast( n, 1, MPI_INTEGER, 0, MPI_COMM_WORLD, ierr ) istart = (n/nprocs)*myrank + 1 ランクの値から自分の計算範囲を求める iend = (n/nprocs)*(myrank+1) isum_local = 0 do i = istart, iend 各プロセスが部分和の総和を計算 isum_local = isum_local + i 部分和を計算（プロセス０に集める） enddo call MPI_Reduce( isum_local, isum, 1, MPI_INTEGER, MPI_SUM, 0, MPI_COMM_WORLD, ierr ) if( myrank == 0 ) print *, 'sum (by reduction function) =', isum call MPI_Finalize( ierr ) end program sum_by_reduction 2022/9/20 プロセス0だけが結果を出力 KOBE HPCサマースクール 2023 31

32.

集団通信－ broadcast mpi_bcast( buff, count, datatype, root, comm, ierr ) ※ ランク番号rootのプロセスが持つbuffの値を，commで指定された他のすべてのプロセスのbuffに配布する． buff: 送り主（root）が送信するデータの変数名（先頭アドレス）他のMPIプロセスは，同じ変数名でデータを受け取る． count: データの個数（整数型） datatype: 送信するデータの型 MPI_INTEGER, MPI_REAL, MPI_DOUBLE_PRECISION , MPI_REAL8など root: 送り主のMPIプロセス番号 comm: コミュニケータ（例えば，MPI_COMM_WORLD） ierr: 戻りコード（整数型） 2022/9/20 KOBE HPCサマースクール 2023 32

33.

集団通信－ reduction mpi_reduce( sendbuff, recvbuff, count, datatype, op, root, comm, ierr ) ※ commで指定されたすべてのプロセスからデータを，ランク番号 root のプロセスに集め，演算（op）を適用した結果を recvbuffに設定する． sendbuff: 送信するデータの変数名（先頭アドレス） recvbuff: 受信するデータの変数名（先頭アドレス） count: データの個数（整数型） datatype: 送信するデータの型 MPI_INTEGER, MPI_REAL, MPI_DOUBLE_PRECISION, MPI_REAL8など集まってきたデータに適用する演算の種類 op: MPI_SUM（総和），MPI_PROD（掛け算），MPI_MAX（最大値）など root: データを集めるMPIプロセス番号 comm: コミュニケータ（例えば，MPI_COMM_WORLD） ierr: 戻りコード（整数型） 2022/9/20 KOBE HPCサマースクール 2023 33

34.

集団通信－ mpi_allreduce() mpi_allreduce( sendbuff, recvbuff, count, datatype, op, comm, ierr ) ※ mpi_reduceとmpi_bcastを同時に行える関数．すべてのプロセスで同じ結果（総和など）が得られる． sendbuff: 送信するデータの変数名（先頭アドレス） recvbuff: 受信するデータの変数名（先頭アドレス） count: データの個数（整数型） datatype: 送信するデータの型 MPI_INTEGER, MPI_REAL8, MPI_CHARACTER など集まってきたデータに適用する演算の種類 op: MPI_SUM（総和），MPI_PROD（掛け算），MPI_MAX（最大値）など comm: コミュニケータ（例えば，MPI_COMM_WORLD） ierr: 戻りコード（整数型） 2022/9/20 KOBE HPCサマースクール 2023 34

KOBE HPC サマースクール（初級）2023 講義10

R-CCS 計算科学研究推進室

関連スライド

第1回 配信講義 計算科学技術特論A （2023）

第2回 配信講義 計算科学技術特論A （2023）

第8回 配信講義 計算科学技術特論A （2023）

第6回 配信講義 計算科学技術特論A （2023）

第11回 配信講義 計算科学技術特論A （2023）

第４回 配信講義 計算科学技術特論A （2023）

各ページのテキスト

R-CCS　計算科学研究推進室

第1回配信講義　計算科学技術特論A （2023）

第2回配信講義　計算科学技術特論A （2023）

第8回配信講義　計算科学技術特論A （2023）

第6回配信講義　計算科学技術特論A （2023）

第11回配信講義　計算科学技術特論A （2023）

第４回配信講義　計算科学技術特論A （2023）