# === Submitere și rulare === sbatch hello_cuda.sh # submitere job; returnează un job_id sbatch --partition=ucsx hello_cuda.sh # override partiție din linia de comandă srun --partition=ucsx --gres=gpu:1 ./hello_cuda # rulare interactivă simplă srun --partition=ucsx --gres=gpu:1 --pty bash # sesiune interactivă pe nodul de calcul srun --partition=haswell -w haswell-wnxx --pty bash # rulare interactivă simplă pe un anumit nod (xx se inlocuieste cu un numar anume de sistem) de pe partitia haswell # === Informații despre cluster === sinfo # afișare simplă a partițiilor sinfo -o "%20P %6a %8D %8c %10m %20G %10l %8t %N" # format detaliat sinfo -o '%9P %4c %8z %8X %8Y %8Z' # distribuție sockets/cores/threads per partiție # === Monitorizare joburi === squeue # afișare toate joburile squeue --me # afișare doar joburile tale squeue -p ucsx --state=R --format="%.8i %.10P %.15u %.10T %.10M %.8C %.10m %.5b %.20R" # joburi active pe o partiție # === Oprire joburi === scancel # oprește un job specific scancel --me # oprește TOATE joburile tale # === Detalii despre resurse === scontrol show partition # detalii complete despre o partiție scontrol show node # detalii despre un nod specific scontrol show job # detalii și stare completă a unui job # === Account și limite === sacctmgr show user $USER withassoc format=user%20,account,partition,MaxWallDurationPerJob