GPU

表題に”実時間”という文字を入れたいので高速化に励む日々。
そんな時 ”それGPUで” のお言葉。
良いアルゴリズムをひねり出す頭がないので機械に頼ります。
ただ、今度は別のことで頭をひねることになりそうですが;

ついこのあいだGeForce 9600 GTに変えたので、デバイスクエリとバンド幅のテスト。

・環境
Core2Quad Q9650 3.00GHz, DDR2-800 2GB, GeForce 9600 GT, PCI Express 2.0

// Device Query

There is 1 device supporting CUDA

Device 0: "GeForce 9600 GT"
  Major revision number:                         1
  Minor revision number:                         1
  Total amount of global memory:                 536543232 bytes
  Number of multiprocessors:                     8
  Number of cores:                               64
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       16384 bytes
  Total number of registers available per block: 8192
  Warp size:                                     32
  Maximum number of threads per block:           512
  Maximum sizes of each dimension of a block:    512 x 512 x 64
  Maximum sizes of each dimension of a grid:     65535 x 65535 x 1
  Maximum memory pitch:                          262144 bytes
  Texture alignment:                             256 bytes
  Clock rate:                                    1.60 GHz
  Concurrent copy and execution:                 Yes

Test PASSED

// Bandwidth Test

Running on......
      device 0:GeForce 9600 GT
Quick Mode
Host to Device Bandwidth for Pageable memory
.
Transfer Size (Bytes)   Bandwidth(MB/s)
 33554432               2314.8

Quick Mode
Device to Host Bandwidth for Pageable memory
.
Transfer Size (Bytes)   Bandwidth(MB/s)
 33554432               2148.7

Quick Mode
Device to Device Bandwidth
.
Transfer Size (Bytes)   Bandwidth(MB/s)
 33554432               38671.6

&&&& Test PASSED

CUDA2.1ならVS2008でビルドできるらしいんですが、まだベータ版のようです。
とりあえずCUDA2.0+VS2005でしばらくやってみることにします。

あわせて読む:

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です