表題に”実時間”という文字を入れたいので高速化に励む日々。
そんな時 ”それGPUで” のお言葉。
良いアルゴリズムをひねり出す頭がないので機械に頼ります。
ただ、今度は別のことで頭をひねることになりそうですが;
ついこのあいだGeForce 9600 GTに変えたので、デバイスクエリとバンド幅のテスト。
・環境
Core2Quad Q9650 3.00GHz, DDR2-800 2GB, GeForce 9600 GT, PCI Express 2.0
// Device Query
There is 1 device supporting CUDA
Device 0: "GeForce 9600 GT"
Major revision number: 1
Minor revision number: 1
Total amount of global memory: 536543232 bytes
Number of multiprocessors: 8
Number of cores: 64
Total amount of constant memory: 65536 bytes
Total amount of shared memory per block: 16384 bytes
Total number of registers available per block: 8192
Warp size: 32
Maximum number of threads per block: 512
Maximum sizes of each dimension of a block: 512 x 512 x 64
Maximum sizes of each dimension of a grid: 65535 x 65535 x 1
Maximum memory pitch: 262144 bytes
Texture alignment: 256 bytes
Clock rate: 1.60 GHz
Concurrent copy and execution: Yes
Test PASSED
// Bandwidth Test
Running on......
device 0:GeForce 9600 GT
Quick Mode
Host to Device Bandwidth for Pageable memory
.
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 2314.8
Quick Mode
Device to Host Bandwidth for Pageable memory
.
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 2148.7
Quick Mode
Device to Device Bandwidth
.
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 38671.6
&&&& Test PASSED
CUDA2.1ならVS2008でビルドできるらしいんですが、まだベータ版のようです。
とりあえずCUDA2.0+VS2005でしばらくやってみることにします。
