表題に”実時間”という文字を入れたいので高速化に励む日々。
そんな時 ”それGPUで” のお言葉。
良いアルゴリズムをひねり出す頭がないので機械に頼ります。
ただ、今度は別のことで頭をひねることになりそうですが;
ついこのあいだGeForce 9600 GTに変えたので、デバイスクエリとバンド幅のテスト。
・環境
Core2Quad Q9650 3.00GHz, DDR2-800 2GB, GeForce 9600 GT, PCI Express 2.0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 |
// Device Query There is 1 device supporting CUDA Device 0: "GeForce 9600 GT" Major revision number: 1 Minor revision number: 1 Total amount of global memory: 536543232 bytes Number of multiprocessors: 8 Number of cores: 64 Total amount of constant memory: 65536 bytes Total amount of shared memory per block: 16384 bytes Total number of registers available per block: 8192 Warp size: 32 Maximum number of threads per block: 512 Maximum sizes of each dimension of a block: 512 x 512 x 64 Maximum sizes of each dimension of a grid: 65535 x 65535 x 1 Maximum memory pitch: 262144 bytes Texture alignment: 256 bytes Clock rate: 1.60 GHz Concurrent copy and execution: Yes Test PASSED // Bandwidth Test Running on...... device 0:GeForce 9600 GT Quick Mode Host to Device Bandwidth for Pageable memory . Transfer Size (Bytes) Bandwidth(MB/s) 33554432 2314.8 Quick Mode Device to Host Bandwidth for Pageable memory . Transfer Size (Bytes) Bandwidth(MB/s) 33554432 2148.7 Quick Mode Device to Device Bandwidth . Transfer Size (Bytes) Bandwidth(MB/s) 33554432 38671.6 &&&& Test PASSED |
CUDA2.1ならVS2008でビルドできるらしいんですが、まだベータ版のようです。
とりあえずCUDA2.0+VS2005でしばらくやってみることにします。