This shows you the differences between two versions of the page.
|
asc:laboratoare:06 [2026/04/08 07:25] alexandru.bala [Ierarhia de memorie] |
asc:laboratoare:06 [2026/04/08 08:14] (current) alexandru.bala [Ierarhia de memorie] |
||
|---|---|---|---|
| Line 59: | Line 59: | ||
| *In functie de implementarea hardware, 100GB/sec -> 300TB/sec | *In functie de implementarea hardware, 100GB/sec -> 300TB/sec | ||
| *Pentru GPU o memorie rapida, actioneaza ca un cache L1/alt register file, la CPU de regula este doar o portiune din RAM | *Pentru GPU o memorie rapida, actioneaza ca un cache L1/alt register file, la CPU de regula este doar o portiune din RAM | ||
| - | *Spre deosebire de regiștri, este accesibilă tuturor thread-urilor din același bloc (work-group). Asta permite thread-urilor să comunice între ele | + | *Ca si in cazul registrilor, este accesibila doar de catre thread, iar durata de viata este aceeasi ca si a threadului |
| **Shared Memory** | **Shared Memory** | ||
| Line 75: | Line 75: | ||
| </code> | </code> | ||
| * In functie de implementarea hardware, 100GB/sec -> 100TB/sec | * In functie de implementarea hardware, 100GB/sec -> 100TB/sec | ||
| - | * In general performanta foarte buna, (cache L1/L2, zona dedicata), | + | * In general performanta foarte buna, (cache L1/L2, zona dedicata) |
| * Are durata de viata a aplicatiei kernel | * Are durata de viata a aplicatiei kernel | ||
| Line 97: | Line 97: | ||
| | Constant | Grid | Application | Device (VRAM, cached) | | | Constant | Grid | Application | Device (VRAM, cached) | | ||
| | Shared | Block | Kernel | SM (on-chip SRAM) | | | Shared | Block | Kernel | SM (on-chip SRAM) | | ||
| - | | Local | Thread | Kernel | Device (VRAM) | | + | | Local CUDA* | Thread | Kernel | Device (VRAM) | |
| | Register | Thread | Kernel | SM (Register File) | | | Register | Thread | Kernel | SM (Register File) | | ||
| + | |||
| + | *A nu se confunda cu Local din OpenCL. | ||
| Caracteristici GPU K40m (coada hpsl), via query device properties CUDA | Caracteristici GPU K40m (coada hpsl), via query device properties CUDA | ||