MatsuLab. Lecture Note/sougouenshu2007/round3/1 - MatsuLab. Lecture Note

[ トップ ] [ 編集 | 凍結 | 差分 | バックアップ | 添付 | リロード ] [ 新規 | 一覧 | 単語検索 | 最終更新 | ヘルプ | ログイン ]

Top / MatsuLab. Lecture Note / sougouenshu2007 / round3 / 1

Counter: 1804, today: 1, yesterday: 0

最新の20件

2019-03-22

2018-12-20

hpc2018

2018-11-07

MatsuLab. Lecture Note

2017-11-24

hpc2017

2017-11-22

RecentDeleted

2016-11-30

hpc2016

2016-11-25

compsys16

2016-02-01

hpc2015

2015-10-05

MatsuLab. Lecture Note/sougouenshu2007/round3/nbody

2015-09-10

MatsuLab. Lecture Note/compsys2015

2015-07-06

MatsuLab. Lecture Note/sougouenshu2007/round3/IM

2015-02-02

hpc2014

2014-07-25

MatsuLab. Lecture Note/sougouenshu2009/round1

2014-07-18

MatsuLab. Lecture Note/compsys2014

2014-07-10

2014-07-01

MatsuLab. Lecture Note/compsys2012/課題提出ページのエラーについて

2014-06-30

MatsuLab. Lecture Note/グリッドコンピューティング09

2014-02-06

hpc2013

第１回 †

概要 †

内容は参考文献参照のこと

Cell B.E. とは
MPI と SIMD 演算 + SPE
N体問題課題説明
次回は1/10(木)

課題 †

N体問題課題説明
- N体パッケージについてはこちらで
- テストパッケージもSIMDに関してはもしかしたら参考になるかも、こちらで
- 問題の概要はこんな感じ
- シリアルプログラムを与えるので、MPI化、SIMD+SPE化してください
- 各プロセス(or SPE)が計算する点数を分割すればいいです。
  - 加速度計算部分がO(n^2)なので、すごく時間がかかる計算です。なので、並列プログラムで早くします。といっても点数を分割して処理すると O(n^2) / O(1) なので根本的解決にはなりませんけどね
  - O(n^2) を何とかする方法については最終回の最適化で考えてもらいたいです

MPI化 †

参考文献参照
各プロセスにすべての点データを持たせて、forループを適当に分割してやる方針
大まかには以下の流れになる
1. MPI_Init: 初期化
2. 問題の読み込み
3. MPI_Comm_rank : ランクの取得
4. MPI_Comm_size : 参加しているプロセス数の取得
5. 各ランクが受け持つ点の範囲を計算
6. 受け持った点の加速度計算、速度計算、位置計算
7. MPI 通信関数による速度・位置データの同期
8. 5へ戻ってループ
9. 規定ステップ実行したら MPI_Finalize および fini_plots_maps とかの終了処理
通信関数のヒントとして
- MPI_Send, MPI_Recv, MPI_Bcast, MPI_Gather, MPI_Gatherv, MPI_Allgater, MPI_Allgatherv
  あたりを適当に調べて使ってみたらいいんじゃない？

SIMD+SPE化 †

参考文献参照, 特にsony の公開情報の仕様書とFIXSTARSのチュートリアルを見るべし
TESTパッケージのreuse を骨組みにして改造するとうまくいくかもしれない
データを6つのSPEに配分してSIMD(Single Instruction Multiple Data)演算させる
PPEのSIMDをやらないように注意
まず、SPE1個で動かすことを考える→6個に拡張
大まかには以下の流れになる
1. 問題の読み込み
2. 各SPEが受け持つ点の範囲を計算
3. spe_context_create : SPE に行わせる仕事の情報を作成
4. spe_image_open : SPE に行わせるプログラムファイルを開く
5. spe_program_load : SPE に行わせるプログラムの読み込み
6. spe_context_run : SPE プログラム実行開始
7. SPE がデータをメインメモリから読み込む
8. SPE がプログラムを実行し、結果をメインメモリへ書き込む
9. すべての SPE プログラムが終了後 6に戻ってループ
10. 規定ステップ終了後、spe_context_destroy で仕事情報を破棄する、そのた終了処理

Last-modified: 2018-05-29 (火) 19:12:57 (2149d)