MatsuLab. Lecture Note/sougouenshu2007/round1 のバックアップ(No.7)

バックアップ一覧
差分を表示
現在との差分を表示
ソースを表示
MatsuLab. Lecture Note/sougouenshu2007/round1 へ行く。

MatsuLab. Lecture Note/sougouenshu2007

第1ラウンド解説 †

第1ラウンド解説

↑

日程 †

基本木曜日。月曜も研究室にいるので、質問があったら来てください。

11/1（木）15:00～松岡先生が研究室の紹介をしてくださる予定です。

↑

第1回目 †

10/4

課題
渡したMPI仕様書を読んで、どういった通信関数があるか調べて簡単にまとめてくること。主に一対一通信、集団通信の2グループに分かれるが、それぞれに多くの通信関数が提供されているので、関数の特徴をまとめてくること

ヒント
一対一通信

同期通信（ブロッキング通信）
非同期通信（ノンブロッキング通信）

集団通信

全対全
一対多、多対一通信
Reduction操作

↑

第2回目 †

10/11

課題確認

クイズ

同期通信、非同期通信はなぜ分類されているのか
非同期通信だと何がうれしいか
MPIではなぜ集団通信が用意されているか

MPIを使った並列プログラミング

基本

データ、問題を細かく分割し、多くのコンピュータに配分・実行させる
- マシン性能に応じて配分する問題サイズを変えること（負荷分散）も重要だけど、今回は省略
出来るだけ少ない通信量

MPIアプリケーションと、サーバ・クライアント型アプリケーションの違い

サーバ・クライアント型
- 一般にサーバとクライアントアプリケーションは異なるプログラム（MPMD: Multiple Program Multiple Data）
- WebサーバとWebブラウザ、ファイルサーバとクライアント（専攻の演習マシン）
MPI並列アプリケーション
- 全てのプロセス（マシン）が同じプログラムを実行、ただし、処理対象データは異なる（SPMD: Single Program Multiple Data）
- もちろん、MPIライブラリを用いてサーバ・クライアント型アプリケーションも書ける

MPIプログラムのサンプル
添付ファイル mpi_pi.c を参考。このファイルはモンテカルロ法を用いてPIを計算する、本当に初歩的なMPIプログラム。 MPI関数もMPI_BcastとMPI_Reduceしか用いていず、1関数での通信量も高々4バイト。

MPIアプリケーションはMPI_Init関数で始まり、MPI_Finalize関数で終わる
MPI_Comm_sizeで、アプリケーション実行に参加しているプロセス数を得る
MPI_Comm_rankでMPIアプリケーション内での自分（プロセス、マシン）の名前を得る
- 名前の範囲は0～N_PROCS-1
  - 具体的に4つのプロセスでアプリケーションを実行する場合には、0,1,2,3といった名前が割り当てられる
- 一対一通信ではこの名前で通信先プロセスを指定する
MPI_Bcastで分割した問題を各プロセスに送信
- プロットする点の数をばらまく
- 実はこのサンプルではMPI_Bcastする必要は無い
MPI_Reduceで各プロセスの計算結果を1つのプロセスに集約

mpi_pi.cのコンパイル＆実行方法

$ mpicc -c mpi_pi.c
$ mpicc -o mpi_pi mpi_pi.o -lm
$
$ mpirun -np 2 -machinefile machines ./mpi_pi  <- 実行

課題

その1 mpi_pi.cにおいて、定数N_POINTSや実行するプロセス数をさまざまに変化させて、実行時間を確認すること。

その2 以下の指示に従い「行列とベクトル積を行なうプログラム」を実装し、実行すること。シングルプロセッサ用プログラムを用意してあるので、それを参考にして良い。

行列、ベクトルデータの生成は1つのプロセス上で行い、そのプロセスからMPI通信関数を呼び出して他のプロセスに送ること
計算終了後には1つのプロセスにデータを集約すること
行数、列数、使用プロセス数をさまざまに変化させて実行すること
一対一通信のMPI_Send、MPI_Recvだけで実装できるが、集団通信のMPI_Bcast、MPI_Scatter、MPI_Gatherなどを使って実装すると良い
- なお、任意の数のプロセスに対応するにはMPI_Scatter、MPI_Gatherの変わりに、MPI_Scatterv、MPI_Gathervを使うことになる

シングルプロセッサ用プログラムのコンパイル＆実行方法

$ gcc -c vector.c    <- vector.oが既に生成されていれば実行しなくても良い
$ gcc -c mul_matrix.c
$ gcc -o mul_matrix mul_matrix.o vector.o
$ ./mul_matrix    <- 実行

MPIプログラム（例 mpi_mm.c）のコンパイル方法

$ gcc -c vector.c    <- vector.oが既に生成されていれば実行しなくても良い
$ mpicc -c mpi_mm.c
$ mpicc -o mpi_mm mpi_mm.o vector.o
$ mpirun -np 4 -machinefile machines ./mpi_mm   <- 実行

↑

課題の進め方 †

その1

演習室MACでプログラムを編集
scpコマンドでプログラムをPrestoIIIクラスタに転送（リモートコピー）
sshコマンドでPrestoIIIにログイン
PrestoIII上でプログラムをコンパイル＆実行

その2

sshコマンドでPrestoIIIにログイン
PrestoIII上でviやemacs( -nw)などでプログラムを編集、コンパイル＆実行

↑

松岡研PCクラスタPrestoIIIの使い方 †

作業には基本的にターミナルを使用する

ログイン
1. ログインノードnimbus.titech.hpcc.jpへログイン
```
$ ssh USERNAME@nimbus.titech.hpcc.jp
```
2. 実行マシンへログイン
```
$ rsh pad017
```
ファイルの転送（リモートコピー）
- 以下のコマンドを用いて、カレントディレクトリにあるファイルmpi.cをnimbus.titech.hpcc.jpに転送
```
$ scp mpi.c USERNAME@nimbus.titech.hpcc.jp:
```
- 最後の「:」を忘れない
使用するマシン
- 16台（最大32CPU）
- どのマシンを使用するかは、/home/USERNAME/sougouenshu/machinesファイルを参考に

↑

参考文献 †

MPIドキュメント集
- 初回配布資料は、この文献の前半部分（140ページまで）
TSUBAMEの構成
MPIによる並列プログラミングの基礎(PDF)
- 同志社大の先生が書かれた、非常に詳しい日本語資料