GeForce TITANでCUDAを動かしてみた。
Bandwidth Test
Device 0: GeForce GTX TITAN
Quick Mode
Host to Device Bandwidth, 1 Device(s)
PINNED Memory Transfers
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 5815.1
Device to Host Bandwidth, 1 Device(s)
PINNED Memory Transfers
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 6282.0
Device to Device Bandwidth, 1 Device(s)
PINNED Memory Transfers
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 220126.1
実行性能でメモリバンド幅が約220GB/s・・・
速い・・・。
ちなみにDevice to Hostでは 6.3GB/sとえらく遅くなってるが、これはPCIe2.0x16の限界だろう。
PCIe3.0x16で単純計算で12GB/s付近までは伸びてくると思う。
うーむ、この暴力スペックで面白いアルゴリズムを動かしてみたいなぁ。
0 件のコメント:
コメントを投稿