This shows you the differences between two versions of the page.
sda-aa:laboratoare:03 [2021/02/28 23:31] 127.0.0.1 external edit |
sda-aa:laboratoare:03 [2021/03/16 21:25] (current) cristian.rusu |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ===== Laboratorul 2: Algoritmi de cautare si sortare ===== | + | ===== Laboratorul 2: Liste ===== |
- | ====== 1. Obiectivele laboratorului ====== | + | ==== 1. Obiectivele laboratorului ==== |
+ | * Intelegerea conceptului de functionare si implementarea unor liste dublu inlantuite si circulare | ||
+ | * Implementarea unor functii individuale de lucru cu aceste structuri de date. | ||
+ | ==== 2. Ce este o lista? ==== | ||
- | Propunem studierea următorilor algoritmi de sortare: | + | === A. Definitie === |
- | * Bubble Sort | + | Listele sunt cele mai bune si cele mai simple exemple a unei structuri de date dinamice care foloseste pointeri la implementarea sa. In mod esential, trebuie inteles ca listele functioneaza ca un vector care se poate mari sau micsora dupa nevoie, din orice punct al multimii sale de elemente. |
- | * Selection Sort | + | |
- | * Insertion Sort | + | |
- | * Merge Sort | + | |
- | * Quick Sort | + | |
- | Structura laboratorului se gaseste in **[[http://gooogle.com|acest link.]]** | + | {{:sda-aa:laboratoare:array_vs_list.png?600|}} |
- | ====== 2. Introducere ====== | + | Avantaje ale utilizarii listelor: |
+ | * Elementele pot fi adaugate sau sterse din mijlocul listei. | ||
+ | * Nu trebuie definita o marime initiala, iar memoria se aloca pe rand, odata cu fiecare element adaugat. | ||
- | **Structura de date** - un mod de a organiza si stoca o colectie de date pentru a facilita manipularea lor (eg. accesul/modificarea, adaugarea, stergerea, gasirea unui element, sortarea colectiei). | + | Definirea nodului unei liste: |
- | + | <code C> | |
- | **Algoritm** - o procedura / o secventa de pasi care rezolva o problema data intr-un mod repetabil si cu resurse (timp si memorie) finite; primeste un set de date de intrare si returneaza o solutie – set de date de iesire | + | typedef struct { |
- | + | int val; | |
- | + | node_t *next; | |
- | [[https://en.citizendium.org/wiki/Complexity_of_algorithms]] | + | } node_t; |
- | ====== 2.1 Calculul complexităţii algoritmilor ====== | + | |
- | + | ||
- | Analiza complexității unui algoritm are ca scop estimarea volumului de resurse de calcul necesare pentru execuția algoritmului. Prin resurse se înțelege: | + | |
- | * Spațiul de memorie necesar pentru stocarea datelor pe care le prelucrează algoritmul. | + | |
- | * Timpul necesar pentru execuția tuturor prelucrărilor specificate în algoritm. | + | |
- | + | ||
- | Această analiză este utilă pentru a stabili dacă un algoritm utilizează un volum acceptabil de resurse pentru rezolvarea unei probleme. In acest fel timpul de executie va fi exprimat prin numarul de operatii elementare executate. Sunt considerate operatii elementare cele aritmetice (adunare, scadere, ınmulțire, ımpartire), comparatiile si cele logice (negatie, conjuncte și disjunctie). | + | |
- | + | ||
- | Este așadar suficient sa se contorizeze doar anumite tipuri de operații elementare, numite operații de bază. Timpul de executie al ıntregului algoritm se obtine ınsumand timpii de executie ai prelucrarilor componente. | + | |
- | + | ||
- | **Exemplul 1 - __Suma a n numere__** | + | |
- | + | ||
- | Consideram problema calculului sumei. Dimensiunea acestei probleme poate fi considerata n. Algoritmul si tabelul cu costurile corespunzatoare prelucrărilor sunt prezentate ın Tabel. Insumand timpii de executie ai prelucrarilor elementare se obtine prin T(n)=n(c3 + c4 + c5) + c1 + c2 + c3 deci T(n)=k1n + k2, adica timpul de executie depinde liniar de dimensiunea problemei. Costurile operatiilor elementare influenteaza doar constantele ce intervin ın functia T(n). | + | |
- | {{ :sda-aa:laboratoare:complexitati1.png?550 |}} | + | |
- | + | ||
- | **Exemplul 2 - __Înmulțirea a 2 matrici__** | + | |
- | Consideram problema determinarii produsului a doua matrici: A de dimensiune m×n si B de dimensiune n×p. In acest caz dimensiunea problemei este determinata de trei valori: (m, n, p). | + | |
- | In practica nu este necesara o analiza atat de detaliata ci este suficient sa se identifice operatia dominantă si sa se estimeze numarul de repetari ale acesteia. Prin operatie dominanta se ıntelege operatia care contribuie cel mai mult la timpul de executie a algoritmului si de regulă este operatia ce apare ın ciclul cel mai interior. În exemplul ar putea fi considerata ca operatie dominanta, operatia de ınmultire. In acest caz costul executiei algoritmului ar fi T(m, n, p)=mnp. | + | |
- | {{ :sda-aa:laboratoare:complexitati2.png?450 |}} | + | |
- | + | ||
- | + | ||
- | ====== 2.2 Caracterizarea unui algoritm ====== | + | |
- | + | ||
- | + | ||
- | ====== Algoritmi de căutare ====== | + | |
- | * implica gasirea unui element cu o anumita proprietate intr-o colectie cu elemente de acel tip | + | |
- | * elementele pot sa fie inregistrari intr-o baza de date, elemente intr-un vector, text in fisiere, noduri intr-un arbore, muchii sau noduri intr-un graf sau elemente in alte spatii de cautare | + | |
- | * sunt algoritmi de baza, foarte utilizati | + | |
- | + | ||
- | **Tipuri de cautari** | + | |
- | * Cautare liniara intr-o multime neordonata ( Unordered Linear Search) | + | |
- | * Cautare liniara intr-o multime ordonata ( Sorted/Ordered Linear Search) | + | |
- | * Cautare binara ( Binary search) | + | |
- | * Tabele de dispersie | + | |
- | * Cautare specializata pentru siruri de caractere (tries, arbori de sufixe, etc) | + | |
- | + | ||
- | **Cautare liniara/secventiala intr-o multime neordonata** | + | |
- | + | ||
- | Se presupune dat un vector neordonat. Este necesara parcurgerea intregului vector pentru a verifica unde se gaseste elementul. | + | |
- | + | ||
- | <code> | + | |
- | int search(int v[], int n, int data) | + | |
- | { int i; | + | |
- | for (i=0; i<n; i++) | + | |
- | if (v[i] == data) return i; | + | |
- | return -1; | + | |
- | } | + | |
</code> | </code> | ||
+ | === B. Clasificare === | ||
- | <note>cazul cel mai nefavorabil - algoritmul examineaza n numere pentru cautare (fara succes); | + | * Liste simplu inlantuite - Elementele au o singura legatura catre urmatorul element introdus, iar ultimul element pointeaza catre NULL. |
- | cazul mediu - sunt evaluate aproximativ n/2 numere pentru cautarea cu succes; | + | |
- | Complexitatea din punct de vedere al duratei este O(n); | + | |
- | Complexitatea din punct de vedere al memoriei este O(1) – nu mai trebuie alte resurse fata de datele initiale </note> | + | |
- | + | ||
- | + | ||
- | **Cautare binara** | + | |
- | Se considera vectorul sortat. Cautarea se face impartind, la fiecare pas, domeniul de cautare in doua parti si se selecteaza cel care contine elementul de interes | + | |
- | + | ||
- | <code> | + | |
- | nt search_bin(int v[], int n, int data) | + | |
- | {int r=n-1, l=0; | + | |
- | while (r >= l) { | + | |
- | int m = (l+r)/2; | + | |
- | if (v[m]==data) return m; | + | |
- | if (v[m]>data) r=m-1; | + | |
- | else l=m+1; | + | |
- | } | + | |
- | return -1; | + | |
- | } | + | |
- | </code> | + | |
- | + | ||
- | + | ||
- | <note>Cel mai nefavorabil caz - nu se examineaza mai mult de logn+1 numere acest lucru duce catre o complexitate de O(logN) | + | |
- | Complexitatea spatiala este O(1) | + | |
- | </note> | + | |
- | + | ||
- | + | ||
- | ====== 3. Algoritmi de sortare ====== | + | |
- | Numim **sortare** orice aşezare a unor elemente date în aşa fel încât, după aşezare, să existe o ordine completă în funcţie de un atribut(numit cheie) al elementelor. | + | |
- | + | ||
- | Pentru a exista o ordine completă, trebuie să alegem o relaţie pe care vrem sa o impunem. Dacă relaţia este valabilă între oricare două elemente pentru care primul element este aşezat la stânga celui de-al doilea, atunci avem o ordine completă. | + | |
- | + | ||
- | Exemplu: dacă alegem drept cheie un atribut număr întreg şi relaţia mai mic sau egal(⇐), obţinem ordinea crescătoare. | + | |
- | + | ||
- | Vom descrie un algoritm de sortare prin: | + | |
- | + | ||
- | * timp mediu - timpul de execuţie la care ne aşteptăm, în medie, pentru sortare | + | |
- | * timp la limită- timpul de execuţie pentru cel mai rău caz posibil | + | |
- | * memorie - memoria maximă de care are nevoie algoritmul pentru sortare(excludem memoria deja alocată înainte de algoritm → vectorul efectiv ce va fi sortat) | + | |
- | * stabilitate - un algoritm stabil păstrează ordinea în care apar două elemente cu aceeaşi cheie(atributul după care sortăm) | + | |
- | + | ||
- | Folosim notaţia O(n) pentru a indica: | + | |
- | + | ||
- | * un număr de operaţii de ordinul lui n. În acest caz, spunem că avem „complexitate de timp de ordinul lui n“ | + | |
- | * o dimensiune de ordinul lui n pentru memoria alocată. În acest caz, spunem că avem „complexitate de spaţiu de ordinul lui n“ | + | |
- | + | ||
- | Fiecare algoritm se bazează pe o metodă de sortare: | + | |
- | + | ||
- | * Bubble sort - interschimbare | + | |
- | * Selection sort - selecţie | + | |
- | * Insertion sort - inserare | + | |
- | * Merge sort - interclasare | + | |
- | * Quick sort - partiţionare | + | |
- | + | ||
- | + | ||
- | **3.1 Bubble sort** | + | |
- | * timp mediu: O(N^2) | + | |
- | * timp la limită: O(N^2) | + | |
- | * memorie: O(1) | + | |
- | * Stabil: DA | + | |
- | + | ||
- | **Descriere** : | + | |
- | Sortarea prin metoda bulelor se consideră drept una din cele mai puţin efective metode de sortare, dar cu un algoritm mai simplu. | + | |
- | + | ||
- | Ideea de bază a sortării prin metoda bulelor este în a parcurge tabloul, de la stânga spre dreapta, fiind comparate elementele alăturate a[i] si a[i+1]. Dacă vor fi găsite 2 elemente neordonate, valorile lor vor fi interschimbate. | + | |
- | Parcurgerea tabloului de la stânga spre dreapta se va repeta atât timp cât vor fi întâlnite elemente neordonate. | + | |
- | + | ||
- | **Implementare** | + | |
- | + | ||
- | <code > | + | |
- | //sortare descrescatoare | + | |
- | void bubble(int a[],int n) | + | |
- | { | + | |
- | int i,schimbat,aux; | + | |
- | do { | + | |
- | schimbat = 0; | + | |
- | // parcurgem vectorul | + | |
- | for(i = 0; i < n-1; i++) { | + | |
- | // daca valoarea i din vectorul a este mai mica decat cea de pe pozitia i+1 | + | |
- | if (a[i] < a[i+1]) { | + | |
- | // interschimbare | + | |
- | aux = a[i]; | + | |
- | a[i] = a[i+1]; | + | |
- | a[i+1] = aux; | + | |
- | schimbat = 1; | + | |
- | } | + | |
- | } | + | |
- | } while(schimbat); | + | |
- | } | + | |
- | </code> | + | |
- | + | ||
- | + | ||
- | **3.2 Selection sort** | + | |
- | * timp mediu: O(N^2) | + | |
- | * timp la limită: O(N^2) | + | |
- | * memorie: O(1) | + | |
- | * Stabil: DA | + | |
- | + | ||
- | **Descriere :** | + | |
- | Acest algoritm selectează, la fiecare pas i, cel mai mic element din vectorul nesortat(de la poziţia i până la n). Valoarea minimă găsită la pasul i este pusă în vector la poziţia i, facându-se intereschimbarea cu poziţia actuală a minimului. Nu este un algoritm indicat pentru vectorii mari, în majoritatea cazurilor oferind rezultate mai slabe decât insertion sort şi bubble sort. | + | |
- | + | ||
- | **Implementare** | + | |
- | + | ||
- | <code> | + | |
- | void selectionSort(int a[],int n) | + | |
- | { | + | |
- | int i,j,aux,min,minPoz; | + | |
- | for(i = 0; i < n - 1;i++) | + | |
- | { | + | |
- | minPoz = i; | + | |
- | min = a[i]; | + | |
- | for(j = i + 1;j < n;j++) //selectam minimul | + | |
- | //din vectorul ramas( de la i+1 la n) | + | |
- | { | + | |
- | if(min > a[j]) //sortare crescatoare | + | |
- | { | + | |
- | minPoz = j; //pozitia elementului minim | + | |
- | min = a[j]; | + | |
- | } | + | |
- | } | + | |
- | aux = a[i] ; | + | |
- | a[i] = a[minPoz]; //interschimbare | + | |
- | a[minPoz] = aux; | + | |
- | } | + | |
- | } | + | |
- | </code> | + | |
- | + | ||
- | + | ||
- | **3.3 Insertion sort** | + | |
- | * timp mediu: O(N^2) | + | |
- | * timp la limită: O(N^2) | + | |
- | * memorie: O(1) | + | |
- | * Stabil: DA | + | |
- | + | ||
- | Descriere : | + | |
- | Spre deosebire de alţi algoritmi de sortare, sortarea prin inserţie este folosită destul de des pentru sortarea tablourilor cu număr mic de elemente. | + | |
- | + | ||
- | Sortarea prin inserţie seamană oarecum cu sortarea prin selecţie. Tabloul este împărţit imaginar în două părţi - o parte sortată şi o parte nesortată. La început, partea sortată conţine primul element al tabloului şi partea nesortată conţine restul tabloului. | + | |
- | La fiecare pas, algoritmul ia primul element din partea nesortată şi il inserează în locul potrivit al părţii sortate. | + | |
- | Când partea nesortată nu mai are niciun element, algoritmul se opreste. | + | |
- | + | ||
- | **Implementare** | + | |
- | + | ||
- | <code> | + | |
- | void insertionSort(int a[], int n) | + | |
- | { | + | |
- | int i, j, aux; | + | |
- | for (i = 1; i < n; i++) | + | |
- | { | + | |
- | j = i; | + | |
- | while (j > 0 && a[j - 1] > a[j]) | + | |
- | { //cautam pozitia pe care sa mutam a[i] | + | |
- | aux = a[j]; //interschimbare | + | |
- | a[j] = a[j - 1]; | + | |
- | a[--j] = aux; | + | |
- | } | + | |
- | } | + | |
- | } | + | |
- | </code> | + | |
- | + | ||
- | **3.4 Merge sort** | + | |
- | * timp mediu: O(N log N) | + | |
- | * timp la limită: O(N log N) | + | |
- | * memorie: O(N) | + | |
- | * Stabil: DA | + | |
- | + | ||
- | + | ||
- | **Descriere :** | + | |
- | În cazul sortării prin interclasare, vectorii care se interclasează sunt două secvenţe ordonate din acelaşi vector. Sortarea prin interclasare utilizează metoda Divide et Impera: se împarte vectorul în secvenţe din ce în ce mai mici, astfel încât fiecare secvenţă să fie ordonată la un moment dat şi interclasată cu o altă secvenţă din vector corespunzătoare. Practic, interclasarea va începe când se ajunge la o secvenţă formată din două elemente. Aceasta, odată ordonată, se va interclasa cu o alta corespunzătoare(cu 2 elemente). Cele două secvenţe vor alcătui un subşir ordonat din vector mai mare(cu 4 elemente) care, la rândul lui, se va interclasa cu un subşir corespunzător(cu 4 elemente) ş.a.m.d. | + | |
+ | {{:sda-aa:laboratoare:simplelist.png?600|}} | ||
- | Subvectorii sortaţi sunt interclasaţi succesiv, ı̂n ordinea inversă divizarii, obţinând ı̂n final vectorul sortat. | ||
- | Iată un exemplu pentru vectorul [38, 27, 43, 3, 9, 82, 10]: | ||
- | {{ :sda-aa:laboratoare:screenshot_from_2021-01-12_21-59-59.png?450 |}} | + | * Liste dublu inlantuite - Elementele au dubla legatura catre precedentul si antecedentul, capul listei pointand spre NULL si ultimul element de asemenea. |
- | **3.5 Quick sort** | + | {{:sda-aa:laboratoare:doublelist.jpg?600|}} |
- | * timp mediu: O(N log N) | + | |
- | * timp la limită: O(N^2) | + | |
- | * memorie: O(log N) | + | |
- | * Stabil: NU | + | |
- | **Descriere :** | + | * Liste circulare - Pot fi simplu sau dublu inlantuite cu proprietatea ca ultimul element pointeaza spre primul. |
- | Quick Sort este unul dintre cei mai rapizi şi mai utilizaţi algoritmi de sortare până în acest moment, bazându-se pe tehnica „Divide et impera“. Deşi cazul cel mai nefavorabil este O(N^2), în practică, QuickSort oferă rezultate mai bune decât restul algoritmilor de sortare din clasa „O(N log N)“. | + | |
- | Algoritmul se bazează pe următorii paşi: | + | {{:sda-aa:laboratoare:circularlist.png?600|}} |
- | * alegerea unui element pe post de pivot | + | === C. Operatii cu liste === |
- | * parcurgerea vectorului din două părţi(de la stânga la pivot, de la dreapta la pivot, ambele în acelaşi timp) | + | |
- | * interschimbarea elementelor care se află pe „partea greşită“ a pivotului(mutăm la dreapta pivotului elementele mai mari, la stânga pivotului elementel mai mici) | + | |
- | * divizarea algoritmului: după ce mutăm elementele pe „partea corectă“ a pivotului, avem 2 subşiruri de sortat, iar pivotul se află pe poziţia bună. | + | |
+ | * Adaugare la inceputul listei. | ||
+ | * Adaugare la sfarsitul listei. | ||
+ | * Adaugarea inainte sau dupa un element dat. | ||
+ | * Stergerea capului de lista. | ||
+ | * Stergerea unui element oarecare din lista. | ||
- | ====== 4. Exercitii propuse====== | + | ==== 3. Exercitii ==== |
- | 1. Alegeţi un algoritm A(dintre Bubble, Insertion şi Selection) şi un algoritm B(dintre Merge şi Quick). Introduceţi variabile globale cu care să contorizaţi numărul de comparaţii pentru algoritmii A şi B. Comparaţi rezultatele pentru un vector de întregi de lungime n = 20. | + | |
- | 2. Implementaţi un algoritm(dintre Bubble, Insertion şi Selection) pentru sortarea unui vector cu n cuvinte de maxim 4 litere fiecare. | + | - Creati o lista circulara, dublu inlantuita cu 6 angajati ai unei companii, care sa contina urmatoarele referinte: nume, nr de telefon, post. |
+ | * Scrieti functiile care sa scrie urmatoarele: | ||
+ | * Sa introduca un nou angajat dupa al treilea. | ||
+ | * Sa introduca un nou angajat inainte de cel care e „mecanic“. | ||
+ | * Sa stearga angajatul cu un anumit numar de telefon introdus. | ||
+ | - Sa se creeze o lista liniara simplu inlantuita care contine elemente intregi citite dintr-ul fisier text. Se citeste apoi o valoare intreaga x. Sa se stearga primul nod care contine valoarea x. Fisierul se va da ca parametru In linia de comanda. | ||
+ | - Sa se construiasca o lista liniara simplu inlantuita cu elemente numere intregi. Sa se afiseze si apoi sa se stearga din lista elementele pare. | ||
+ | - Adunati 2 polinoame rare, reprezentand fiecare polinom printr-o lista Inlantuita, unde fiecare nod va contine datele pentru un coeficient şi o putere (de exemplu: 5x3, coeficient = 5, putere = 3). | ||
+ | - Pentru laboratorul de liste inlantuite vom porni de la o arhiva cu un schelet de laborator. Nu veti scrie codul de la zero ci veti implementa cateva functii in fisierul list.c. | ||
- | 3. Implementaţi un algoritm(dintre Merge şi Quick) pentru sortarea unui vector de structuri, unde fiecare structură reprezintă un moment de timp(int ora,min,sec). | + | **Nota:** Template pentru codul sursa {{:sda-aa:laboratoare:list-lab2.zip|}}. |
- | 4. Considerăm un pachet de cărţi. Extragem random n cărţi. Sortaţi aceste cărţi folosind metoda inserţiei. | + | ==== 4. Probleme optionale, de interviu==== |
- | 5. Scrieţi un program eficient care să afişeze primele k cele mai mari elemente dintr-un vector. Elementele nu | + | - Se da o lista simplu inlantuita (primiti doar un pointer catre primul element). Verificati daca lista contine o bucla. (o lista simplu Inlantuita contine o bucla ⇒ niciun element nu are legatura NULL) |
- | sunt ordonate, ci ordinea lor este una aleatoare. De exemplu dat vectorul v = [1, 23, 12, 9, 30, 2, 50], dacă k = 3, vrem cele mai mari 3 elemente care sunt | + | - Se dau doua liste(pentru fiecare lista - pointer catre primul element) in forma de Y (listele se intersecteaza, ultimele k elemente sunt comune). Aflati valoarea lui k. |
- | 50, 30, 23 | + | - Se da o lista cu 2n+1 elemente, fiecare element contine cate un intreg. Toate valorile intregi apar de doua ori in lista, exceptie facand una singura. Aflati acea valoare. |