CUDA

CUDA Memory

공유범위 메모리 종류 지원 연산 접근 속도 캐시지원 크기
Thread Register Read, Write Fastest X Smallest
Local Mem. Read, Write Slow *
Block Shared Mem. Read, Write Fast X Small
Grid(global) Global Mem. Read, Write Slow Largest
Constant Mem. Read-Only Fast ◯(전용캐시) Small
Texture Mem. Read-Only Fast ◯(전용캐시) Small

’ △ ‘ : Compute capability 및 캐시 설정에 따라 달라질 수 있음 ‘ * ‘ : 디바이스 메모리 영역을 사용함

출처

출처 - CUDA기반 GPU병렬처리 프로그래밍 (김덕수 저자(글))