Show page

Differences

This shows you the differences between two versions of the page.

--- asc:laboratoare:06 [2026/04/08 07:25]
alexandru.bala [Ierarhia de memorie]
+++ asc:laboratoare:06 [2026/04/08 08:14] (current)
alexandru.bala [Ierarhia de memorie]
@@ Line 59: / Line 59: @@
   *In functie de implementarea hardware, 100GB/sec -> 300TB/sec
   *Pentru GPU o memorie rapida, actioneaza ca un cache L1/alt register file, la CPU de regula este doar o portiune din RAM
-  *Spre deosebire de regiștri, este accesibilă tuturor thread-urilor din același bloc (work-group). Asta permite thread-urilor să comunice între ele
+  *Ca si in cazul registrilor, este accesibila doar de catre thread, iar durata de viata este aceeasi ca si a threadului
 **Shared Memory**
@@ Line 75: / Line 75: @@
 </code>
   * In functie de implementarea hardware, 100GB/sec -> 100TB/sec
-  * In general performanta foarte buna, (cache L1/L2, zona dedicata),
+  * In general performanta foarte buna, (cache L1/L2, zona dedicata)
   * Are durata de viata a aplicatiei kernel
@@ Line 97: / Line 97: @@
 | Constant    | Grid  | Application | Device (VRAM, cached) |
 | Shared      | Block | Kernel      | SM (on-chip SRAM) |
-| Local       | Thread | Kernel     | Device (VRAM) |
+| Local CUDA*      | Thread | Kernel     | Device (VRAM) |
 | Register    | Thread | Kernel     | SM (Register File) |
+*A nu se confunda cu Local din OpenCL.
 Caracteristici GPU K40m (coada hpsl), via query device properties CUDA