Table of Contents

Tema de casă 2 - Alocator de memorie

În această temă veţi implementa un alocator simplu de memorie, similar sistemului malloc/free.

Responsabil: Relu Dragan

Autor inițial: Stefan Bucur

Deadline hard: 12.12.2017 23:55

Menționăm că pentru testare (pe vmchecker) se folosește o mașină virtuală pe 32 de biți. În caz că sistemul vostru de operare de pe mașina fizică este pe 64 de biți, aveti grija la eventualele probleme de compatibilitate (de exemplu, pe un sistem de 64 de biti sizeof(void*) este 8, iar pe un sistem de 32 de biti sizeof(void*) este 4).

Va recomandam sa cititi intregul enunt al temei inainte de a va apuca sa implementati. Desi este lung, contine foarte multe precizari esentiale in evitarea anumitor bug-uri. Inainte de a pune o intrebare pe forum, asigurati-va ca raspunsul acesteia nu este continut in enuntul temei.

Actualizari

Obiective

În urma realizării acestei teme, studentul va fi capabil:

Enunţul temei

Mihai s-a oferit să o ajute pe sora sa, Ilinca, să înțeleagă cum funcționează alocarea de memorie dinamică. Primul impuls a fost să îi arate codul sursa al funcțiilor de alocare din glibc. Când a văzut însă cum arată codul pentru malloc(), s-a lăsat păgubaş considerându-l prea greu de urmărit. Astfel, Mihai s-a decis să proiecteze singur un sistem de alocare de memorie, simplu şi pe înţelesul tuturor.

Cerința temei

Programul vostru va trebui să realizeze o simulare a unui sistem de alocare de memorie. Programul va primi la intrare comenzi de alocare, alterare, afişare şi eliberare de memorie, şi va trebui să furnizaţi la ieşire rezultatele fiecărei comenzi. Nu veţi înlocui sistemul standard malloc() şi free(), ci vă veţi baza pe el, alocând la început un bloc mare de memorie, şi apoi presupunând că acela reprezintă toată “memoria” voastră, pe care trebuie s-o gestionaţi.

Funcţiile unui alocator de memorie

Un alocator de memorie poate fi descris, în termenii cei mai simpli, în felul următor:

O problemă pe care o are orice alocator de memorie este cum este ţinută evidenţa blocurilor alocate, a porţiunilor libere şi a dimensiunilor acestora. Pentru această problemă există în general două soluţii:

Există mai multe metode prin care se poate ţine evidenţa blocurilor alocate în arenă, în funcţie de performanţele dorite. Voi va trebui să implementaţi un mecanim destul de simplu, care va fi prezentat în secţiunea următoare. Deşi nu este extrem de performant, se va descurca destul de bine pe dimensiuni moderate ale arenei (de ordinul MB).

Structura arenei

În continuare vom considera arena ca pe o succesiune (vector) de N octeţi (tipul de date unsigned char). Fiecare octet poate fi accesat prin indexul său (de la 0 la N-1). Vom considera că un index este un întreg fara semn pe 32 de biţi (tipul de date uint32_t din libraria stdint.h). De asemenea, va fi nevoie câteodată să considerăm 4 octeţi succesivi din arenă ca reprezentând valoarea unui index. În această situaţie, vom considera că acel index este reprezentat în format 'little-endian' (revedeţi exercitiile de la laboratorul de pointeri pentru mai multe detalii şi citiţi acest articol mult mai descriptiv), şi astfel vom putea face cast de la un pointer de tip unsigned char * la unul de tip uint32_t*, pentru a accesa valoarea indexului, stocată în arenă.

Figura de mai jos ilustrează structura detaliată a arenei, în decursul execuţiei programului:

Structura unui bloc

Se poate observa că fiecare bloc alocat de memorie (marcat cu un chenar îngroşat) constă din două secţiuni:

Daca folositi uint32_t pentru memorarea indecsilor, aveti grija la UNDERFLOW! In acest sens, nu lucrati cu valori negative in acesti indecsi.

Daca totusi aveti nevoie sa folositi valori negative pentru indecsi in logica implementarii voastre, puteti folosi int32_t, sau int daca pe arhitectura voastra sizeof(int) este 4. Si aceste tipuri de date se incadreaza in restrictiile temei (testele vor fi de asa natura incat indecsii vostrii ar trebui sa se incadreze in [0 .. 2 ^ 31 - 1]).

Înlănţuirea blocurilor

Indicele de start reprezinta indicele primului bloc (cel mai “din stânga”) din arenă. Acesta trebuie stocat de voi intr-o variabila separata. Dacă arena nu conţine niciun bloc (de exemplu, imediat după iniţializare), acest indice este 0.

Indicele de start marchează începutul lanţului de blocuri din arenă: din acest indice putem ajunge la începutul primului bloc, apoi folosind secţiunea de gestiune a primului bloc putem găsi începutul celui de-al doilea bloc, şi asa mai departe, până când ajungem la blocul care are indexul blocului următor 0 (este ultimul bloc din arenă). În acest mod putem traversa toate blocurile din arenă, şi de asemenea să identificăm spaţiile libere din arenă, care reprezintă spaţiile dintre două blocuri succesive.

Primul bloc din arena trebuie sa aiba octetii indexului blocului anterior setati pe 0. Ultimul bloc din arena trebuie sa aiba octetii indexului blocului urmator setati pe 0.

Daca arena contine un singur bloc, atunci atat indexul blocului urmator cat si indexul blocului anterior vor fi 0.

Este de remarcat faptul că lanţul poate fi parcurs în ambele sensuri: dintr-un bloc putem ajunge atât la vecinul din dreapta, cât şi la cel din stânga.

De asemenea, atunci când este alocat un bloc nou sau este eliberat unul vechi, 'lanţul de blocuri trebuie modificat'. Astfel, la alocarea unui nou bloc de memorie, trebuie să ţineţi cont de următoarele:

La eliberarea unui bloc, trebuie modificate secţiunile de gestiune a vecinilor într-o manieră similară ca la adăugare.

Funcţionarea programului

Programul vostru va trebui să implementeze o serie de operaţii de lucru cu arena, care vor fi lansate în urma comenzilor pe care le primeşte la intrare. Fiecare comandă va fi dată pe câte o linie, şi rezultatele vor trebui afişate pe loc. Secţiunea următoare prezintă sintaxa comenzilor posibile şi formatul de afişare al rezultatelor.

Întrucât pentru testare comenzile vor fi furnizate prin redirectare dintr-un fişier de intrare, iar rezultatele vor fi stocate prin redirectare într-un alt fişier, programul vostru nu va trebui să afişeze nimic altceva în afara formatului specificat (de exemplu, nu trebuie să afişati mesaje de tipul “Introduceţi comanda: ”).

Folosiţi funcţiile de manipulare a şirurilor de caractere pentru a citi şi interpreta comenzile date la intrare. Este recomandată combinaţia getline() şi strtok() pentru o implementare elegantă.

Pentru o mai bună organizare a codului vostru, implementaţi execuţia fiecărei comenzi într-o funcţie separată. De asemenea, gândiţi-vă ce variabile trebuie păstrate globale, iar pe restul declaraţi-le local. Puteti folosi variabile globale in aceasta tema.

Formatul comenzilor

Fiecare comanda trebuie afisata pe cate o linie separata, exact cum este citita de la input. Programul vostru va trebui să accepte următoarele comenzi la intrare:

  1. INITIALIZE <N>
    • Această comandă va trebui să realizeze iniţializarea unei arene de dimensiune N octeţi. Prin iniţializare se înţelege alocarea dinamică a memoriei necesare stocării arenei, setarea fiecărui octet pe 0, şi iniţializarea lanţului de blocuri (setarea indicelui de start pe 0).
    • Comanda nu va afişa niciun rezultat.
  2. FINALIZE
    • Această comandă va trebui să elibereze memoria alocată la iniţializare.
    • Comanda nu va afişa niciun rezultat.
  3. DUMP
    • Această comandă va afişa întreaga hartă a memoriei, aşa cum se găseşte în acel moment, octet cu octet. Vor fi afişaţi câte 16 octeţi pe fiecare linie, în felul următor:
      • La începutul liniei va fi afişat indicele curent, în format hexazecimal, cu 8 cifre hexa majuscule.
      • Apoi este afişat un TAB (\t) , urmat de 16 octeţi, afişati separaţi printr-un spaţiu şi în format hexazecimal, cu 2 cifre hexa majuscule fiecare. Între cel de-al 8-lea şi cel de-al 9-lea octet se va afişa un spaţiu suplimentar.
      • Daca dimensiunea arenei nu este multiplu de 16, atunci pe ultima linie se vor afisa ultimii ARENA_SIZE % 16 octeti.
      • Nu este necesar sa realizati conversii de la zecimal la hexazecimal, puteti folosi printf(”%02X”) si printf(”%08X”) pentru afisare.
  4. ALLOC <SIZE>
    • Comanda va aloca SIZE octeţi de memorie din arenă, unde SIZE e o valoare strict pozitiva. Ea va trebui să găsească o zonă liberă suficient de mare (care să încapă SIZE octeţi + secţiunea de gestiune), şi să rezerve un bloc 'la începutul' zonei (nu în mijloc, nu la sfârşit). Va trebui folosită prima zonă liberă validă, într-o căutare de la stânga la dreapta.
    • Comanda va afişa, în format zecimal, indexul de început al blocului alocat în arenă, sau 0 dacă nu a fost găsită nici o zonă liberă suficient de mare în arenă. Atenţie: Va trebui să afişaţi indexul secţiunii de date din noul bloc, şi nu al secţiunii de gestiune.
  5. FREE <INDEX>
    • Comanda va elibera blocul de memorie al cărei secţiuni de date începe la poziţia INDEX în arenă. Practic, INDEX va fi o valoare care a fost întoarsă în prealabil de o comandă 'ALLOC'. În urma execuţiei acestei comenzi, octetii vechiului bloc (octeti gestiune + octeti date) vor fi setati pe 0, iar spaţiul de arenă ocupat va redeveni disponibil pentru alocări ulterioare.
    • Comanda nu va afişa niciun rezultat.
  6. FILL <INDEX> <SIZE> <VALUE>
    • Comanda va seta SIZE octeţi din arenă la valoarea VALUE, cuprinsă între 0 şi 255 inclusiv, si va modifica octetii blocurilor începând cu blocul cu indexul INDEX. Atenție, această comandă NU modifica octeți de gestiune, ci doar octeți de date. Se vor seta octeti de date pana cand s-au setat SIZE octeti sau pana cand s-au parcurs toate blocurile de dupa blocul INDEX si s-au setat toti octetii de date ale acestora. Cu alte cuvinte,
    • NR_OCTETI_SETATI = min(SIZE, SIZE(block(INDEX)) + SIZE(next(block(INDEX))) + SIZE(next(next(block(INDEX)))) + … ).
    • Comanda nu va afişa niciun rezultat.

Va este garantat ca atat comanda FREE cat si comanda FILL vor primi cate un index VALID (adica un index returnat inainte de un apel ALLOC).

Nu este nevoie să vă preocupaţi de eventualele comenzi invalide. Veţi presupune că toate comenzile introduse vor fi corecte. Nu trebuie să verificaţi semantica operaţiilor cerute programului vostru. Executati comenzile EXACT cum le primiti la input.

Programul vostru va trebui sa functioneze corect daca dupa FINALIZE se apeleaza din nou INITIALIZE urmat de FINALIZE.

Primul bloc din arena nu incepe intotdeauna de la indexul 0! Pastrati indexul primului block din arena intr-o variabila si aveti grija sa verificati daca trebuie sa o modificati atunci cand faceti ALLOC sau FREE.

Exemple

În această secţiune sunt ilustrate câteva exemple de rulare a programului, pentru a înţelege mai bine modul în care programul vostru trebuie să se comporte. Fiecare exemplu este urmat apoi de câteva explicaţii. }

Exemplul 1

Observaţii:

Exemplul 2

Observaţii:

BONUS

Se va acorda un bonus de 150/1150 puncte (pe lângă faimă şi respect :) ), dacă se vor implementa, pe lângă comenzile standard prezentate mai devreme, şi următoarele comenzi:

  1. ALLOCALIGNED <SIZE> <ALIGN>
    • Această comandă va funcţiona ca ALLOC, cu excepţia faptului că indexul returnat va trebui să fie aliniat la ALIGN octeţi, unde ALIGN este o putere a lui 2 (poate fi 1, 2, 4, 8, etc.). Un index INDEX este aliniat la ALIGN octeţi dacă INDEX % ALIGN == 0.
  2. REALLOC <INDEX> <SIZE>
    • Această comandă va realoca o zonă de memorie întoarsă în prealabil la adresa INDEX într-un nou spaţiu de memorie de dimensiune SIZE şi va afişa indexul secţiunii de date a noului bloc alocat. De asemenea, va copia datele aflate în vechiul bloc în noul bloc. Daca SIZE este mai mic decât dimensiunea originală, vor fi copiaţi numai SIZE octeţi (va avea loc o trunchiere).
    • In cazul in care SIZE este prea mare si alocarea unei noi zone de memorie de dimensiune SIZE nu este posibila, se realizeaza doar eliberarea memoriei blocului cu indexul de date INDEX si se intoarce 0.
    • Atenţie: Pentru găsirea unei zone de memorie libere va trebui să reluaţi procedura de căutare de la stânga la dreapta. Nu este valid să verificaţi că în locul curent există deja spaţiu pentru expansiune / micşorare.

Exemplu REALLOC

Observatii:

Se doreste realocarea primului bloc la o dimensiune de 20. Spatiul gasit in arena este aflat in continuarea blocului 2, mai exact octetii 46-77.

Exemplu ALLOCALIGNED

Observatii:

Restrictii

0 < ARENA_SIZE ⇐ 2 ^ 16

0 < NUMAR_COMENZI < 5000

Timp de executie per test: 10 sec

Testare

Puteti descarca arhiva cu testele, checker-ul si scheletul de aici:

Instrucţiuni de utilizare

Alte precizări

Barem corectare

Mențiuni suplimentare:

FAQ

1) De ce imi trec testele pe checkerul local dar nu si pe vmchecker?

R: Cel mai probabil este o problema de undefined behaviour. Aveti grija sa nu faceti citiri din zone de memorie neinitializate, sa nu faceti apeluri recursive care pot conduce la un STACK OVERFLOW pe masina virtuala (dimensiunea stivei pe vmchecker este undeva la 8 MB), sa nu cititi/scrieti dintr-o zona de memorie pe care ati apelat anterior free.

2) Am primit SEGMENTATION FAULT… Ce fac mai departe?

R: Incercati sa depistati linia de cod ce genereaza seg fault. Puteti pune printf-uri in cod cu '\n' la finalul oricarui mesaj, altfel mesajul va fi suprascris de mesajul de eroare “Segmentation fault” si nu se va afisa la stdout. O alta modalitate este folosirea debugger-ului gdb.

user@machine> gdb ./alocator

gdb> run < input/test0.in

gdb> backtrace