Laboratorul 2: Algoritmi de cautare si sortare

1. Obiectivele laboratorului

Propunem studierea următorilor algoritmi de sortare:

  • Bubble Sort
  • Selection Sort
  • Insertion Sort
  • Merge Sort
  • Quick Sort

Cerinta si structura laboratorului se gaseste in acest link.

2. Introducere

Structura de date - un mod de a organiza si stoca o colectie de date pentru a facilita manipularea lor (eg. accesul/modificarea, adaugarea, stergerea, gasirea unui element, sortarea colectiei).

Algoritm - o procedura / o secventa de pasi care rezolva o problema data intr-un mod repetabil si cu resurse (timp si memorie) finite; primeste un set de date de intrare si returneaza o solutie – set de date de iesire

https://en.citizendium.org/wiki/Complexity_of_algorithms

2.1 Calculul complexităţii algoritmilor

Analiza complexității unui algoritm are ca scop estimarea volumului de resurse de calcul necesare pentru execuția algoritmului. Prin resurse se înțelege:

  • Spațiul de memorie necesar pentru stocarea datelor pe care le prelucrează algoritmul.
  • Timpul necesar pentru execuția tuturor prelucrărilor specificate în algoritm.

Această analiză este utilă pentru a stabili dacă un algoritm utilizează un volum acceptabil de resurse pentru rezolvarea unei probleme. In acest fel timpul de executie va fi exprimat prin numarul de operatii elementare executate. Sunt considerate operatii elementare cele aritmetice (adunare, scadere, ınmulțire, ımpartire), comparatiile si cele logice (negatie, conjuncte și disjunctie).

Este așadar suficient sa se contorizeze doar anumite tipuri de operații elementare, numite operații de bază. Timpul de executie al ıntregului algoritm se obtine ınsumand timpii de executie ai prelucrarilor componente.

Exemplul 1 - Suma a n numere

Consideram problema calculului sumei. Dimensiunea acestei probleme poate fi considerata n. Algoritmul si tabelul cu costurile corespunzatoare prelucrărilor sunt prezentate ın Tabel. Insumand timpii de executie ai prelucrarilor elementare se obtine prin T(n)=n(c3 + c4 + c5) + c1 + c2 + c3 deci T(n)=k1n + k2, adica timpul de executie depinde liniar de dimensiunea problemei. Costurile operatiilor elementare influenteaza doar constantele ce intervin ın functia T(n).

Exemplul 2 - Înmulțirea a 2 matrici Consideram problema determinarii produsului a doua matrici: A de dimensiune m×n si B de dimensiune n×p. In acest caz dimensiunea problemei este determinata de trei valori: (m, n, p). In practica nu este necesara o analiza atat de detaliata ci este suficient sa se identifice operatia dominantă si sa se estimeze numarul de repetari ale acesteia. Prin operatie dominanta se ıntelege operatia care contribuie cel mai mult la timpul de executie a algoritmului si de regulă este operatia ce apare ın ciclul cel mai interior. În exemplul ar putea fi considerata ca operatie dominanta, operatia de ınmultire. In acest caz costul executiei algoritmului ar fi T(m, n, p)=mnp.

2.2 Caracterizarea unui algoritm

Algoritmi de căutare

  • implica gasirea unui element cu o anumita proprietate intr-o colectie cu elemente de acel tip
  • elementele pot sa fie inregistrari intr-o baza de date, elemente intr-un vector, text in fisiere, noduri intr-un arbore, muchii sau noduri intr-un graf sau elemente in alte spatii de cautare
  • sunt algoritmi de baza, foarte utilizati

Tipuri de cautari

  • Cautare liniara intr-o multime neordonata ( Unordered Linear Search)
  • Cautare liniara intr-o multime ordonata ( Sorted/Ordered Linear Search)
  • Cautare binara ( Binary search)
  • Tabele de dispersie
  • Cautare specializata pentru siruri de caractere (tries, arbori de sufixe, etc)

Cautare liniara/secventiala intr-o multime neordonata

Se presupune dat un vector neordonat. Este necesara parcurgerea intregului vector pentru a verifica unde se gaseste elementul.

int search(int v[], int n, int data) 
{ int i; 
  for (i=0; i<n; i++) 
  	if (v[i] == data) return i; 
  return -1; 
} 

cazul cel mai nefavorabil - algoritmul examineaza n numere pentru cautare (fara succes); cazul mediu - sunt evaluate aproximativ n/2 numere pentru cautarea cu succes; Complexitatea din punct de vedere al duratei este O(n); Complexitatea din punct de vedere al memoriei este O(1) – nu mai trebuie alte resurse fata de datele initiale

Cautare binara Se considera vectorul sortat. Cautarea se face impartind, la fiecare pas, domeniul de cautare in doua parti si se selecteaza cel care contine elementul de interes

nt search_bin(int v[], int n, int data) 
{int r=n-1, l=0; 
while (r >= l) { 
	int m = (l+r)/2; 
	if (v[m]==data) return m; 
	if (v[m]>data) r=m-1; 
		 else l=m+1; 
} 
return -1; 
} 

Cel mai nefavorabil caz - nu se examineaza mai mult de logn+1 numere acest lucru duce catre o complexitate de O(logN) Complexitatea spatiala este O(1)

3. Algoritmi de sortare

Numim sortare orice aşezare a unor elemente date în aşa fel încât, după aşezare, să existe o ordine completă în funcţie de un atribut(numit cheie) al elementelor.

Pentru a exista o ordine completă, trebuie să alegem o relaţie pe care vrem sa o impunem. Dacă relaţia este valabilă între oricare două elemente pentru care primul element este aşezat la stânga celui de-al doilea, atunci avem o ordine completă.

Exemplu: dacă alegem drept cheie un atribut număr întreg şi relaţia mai mic sau egal(⇐), obţinem ordinea crescătoare.

Vom descrie un algoritm de sortare prin:

  • timp mediu - timpul de execuţie la care ne aşteptăm, în medie, pentru sortare
  • timp la limită- timpul de execuţie pentru cel mai rău caz posibil
  • memorie - memoria maximă de care are nevoie algoritmul pentru sortare(excludem memoria deja alocată înainte de algoritm → vectorul efectiv ce va fi sortat)
  • stabilitate - un algoritm stabil păstrează ordinea în care apar două elemente cu aceeaşi cheie(atributul după care sortăm)

Folosim notaţia O(n) pentru a indica:

  • un număr de operaţii de ordinul lui n. În acest caz, spunem că avem „complexitate de timp de ordinul lui n“
  • o dimensiune de ordinul lui n pentru memoria alocată. În acest caz, spunem că avem „complexitate de spaţiu de ordinul lui n“

Fiecare algoritm se bazează pe o metodă de sortare:

  • Bubble sort - interschimbare
  • Selection sort - selecţie
  • Insertion sort - inserare
  • Merge sort - interclasare
  • Quick sort - partiţionare

3.1 Bubble sort

  • timp mediu: O(N^2)
  • timp la limită: O(N^2)
  • memorie: O(1)
  • Stabil: DA

Descriere : Sortarea prin metoda bulelor se consideră drept una din cele mai puţin efective metode de sortare, dar cu un algoritm mai simplu.

Ideea de bază a sortării prin metoda bulelor este în a parcurge tabloul, de la stânga spre dreapta, fiind comparate elementele alăturate a[i] si a[i+1]. Dacă vor fi găsite 2 elemente neordonate, valorile lor vor fi interschimbate. Parcurgerea tabloului de la stânga spre dreapta se va repeta atât timp cât vor fi întâlnite elemente neordonate.

Implementare

//sortare descrescatoare
void bubble(int a[],int n)
{
    int i,schimbat,aux;
    do {
        schimbat = 0;
        // parcurgem vectorul
        for(i = 0; i < n-1; i++) {
	    // daca valoarea i din vectorul a este mai mica decat cea de pe pozitia i+1
            if (a[i] < a[i+1]) { 
                // interschimbare
	        aux = a[i];
		a[i] = a[i+1];
		a[i+1] = aux;
		schimbat = 1;
	    }
        }
    } while(schimbat);
}

3.2 Selection sort

  • timp mediu: O(N^2)
  • timp la limită: O(N^2)
  • memorie: O(1)
  • Stabil: DA

Descriere : Acest algoritm selectează, la fiecare pas i, cel mai mic element din vectorul nesortat(de la poziţia i până la n). Valoarea minimă găsită la pasul i este pusă în vector la poziţia i, facându-se intereschimbarea cu poziţia actuală a minimului. Nu este un algoritm indicat pentru vectorii mari, în majoritatea cazurilor oferind rezultate mai slabe decât insertion sort şi bubble sort.

Implementare

void selectionSort(int a[],int n)
{
	int i,j,aux,min,minPoz;
	for(i = 0; i < n - 1;i++)
	{
		minPoz = i;
		min = a[i];
		for(j = i + 1;j < n;j++) //selectam minimul
		//din vectorul ramas( de la i+1 la n)
		{
			if(min > a[j]) //sortare crescatoare
			{
				minPoz = j; //pozitia elementului minim
				min = a[j];
			}
		}
		aux = a[i] ;
		a[i] = a[minPoz]; //interschimbare
		a[minPoz] = aux;
	}
}

3.3 Insertion sort

  • timp mediu: O(N^2)
  • timp la limită: O(N^2)
  • memorie: O(1)
  • Stabil: DA

Descriere : Spre deosebire de alţi algoritmi de sortare, sortarea prin inserţie este folosită destul de des pentru sortarea tablourilor cu număr mic de elemente.

Sortarea prin inserţie seamană oarecum cu sortarea prin selecţie. Tabloul este împărţit imaginar în două părţi - o parte sortată şi o parte nesortată. La început, partea sortată conţine primul element al tabloului şi partea nesortată conţine restul tabloului. La fiecare pas, algoritmul ia primul element din partea nesortată şi il inserează în locul potrivit al părţii sortate. Când partea nesortată nu mai are niciun element, algoritmul se opreste.

Implementare

void insertionSort(int a[], int n)
{
    int i, j, aux;
    for (i = 1; i < n; i++)
    {
        j = i;
        while (j > 0 && a[j - 1] > a[j])
        { //cautam pozitia pe care sa mutam a[i]
            aux = a[j]; //interschimbare
            a[j] = a[j - 1];
            a[--j] = aux;
        }
    }
}

3.4 Merge sort

  • timp mediu: O(N log N)
  • timp la limită: O(N log N)
  • memorie: O(N)
  • Stabil: DA

Descriere : În cazul sortării prin interclasare, vectorii care se interclasează sunt două secvenţe ordonate din acelaşi vector. Sortarea prin interclasare utilizează metoda Divide et Impera: se împarte vectorul în secvenţe din ce în ce mai mici, astfel încât fiecare secvenţă să fie ordonată la un moment dat şi interclasată cu o altă secvenţă din vector corespunzătoare. Practic, interclasarea va începe când se ajunge la o secvenţă formată din două elemente. Aceasta, odată ordonată, se va interclasa cu o alta corespunzătoare(cu 2 elemente). Cele două secvenţe vor alcătui un subşir ordonat din vector mai mare(cu 4 elemente) care, la rândul lui, se va interclasa cu un subşir corespunzător(cu 4 elemente) ş.a.m.d.

Subvectorii sortaţi sunt interclasaţi succesiv, ı̂n ordinea inversă divizarii, obţinând ı̂n final vectorul sortat. Iată un exemplu pentru vectorul [38, 27, 43, 3, 9, 82, 10]:

3.5 Quick sort

  • timp mediu: O(N log N)
  • timp la limită: O(N^2)
  • memorie: O(log N)
  • Stabil: NU

Descriere : Quick Sort este unul dintre cei mai rapizi şi mai utilizaţi algoritmi de sortare până în acest moment, bazându-se pe tehnica „Divide et impera“. Deşi cazul cel mai nefavorabil este O(N^2), în practică, QuickSort oferă rezultate mai bune decât restul algoritmilor de sortare din clasa „O(N log N)“.

Algoritmul se bazează pe următorii paşi:

  • alegerea unui element pe post de pivot
  • mutarea elementelor cu valori mai mici decat pivotul inaintea acestuia si a celor mai mari dupa pivot; stabilirea pozitiei finale a pivotului
  • după ce mutăm elementele pe „partea corectă“ a pivotului, avem 2 subşiruri de sortat, pentru fiecare repetam procedura de mai sus.

4. Exercitii propuse

1. Alegeţi un algoritm A(dintre Bubble, Insertion şi Selection) şi un algoritm B(dintre Merge şi Quick). Introduceţi variabile globale cu care să contorizaţi numărul de comparaţii pentru algoritmii A şi B. Comparaţi rezultatele pentru un vector de întregi de lungime n = 20.

2. Implementaţi un algoritm(dintre Bubble, Insertion şi Selection) pentru sortarea unui vector cu n cuvinte de maxim 4 litere fiecare.

3. Implementaţi un algoritm(dintre Merge şi Quick) pentru sortarea unui vector de cu inregistrari de tip ora_exacta, unde structura ora_exacta are campurile intregi: ora, min,sec.

4. Considerăm un pachet de cărţi. Extragem random n cărţi. Sortaţi aceste cărţi folosind metoda inserţiei.

5. Scrieţi un program eficient care să afişeze primele k cele mai mari elemente dintr-un vector. Elementele nu sunt ordonate, ci ordinea lor este una aleatoare. De exemplu dat vectorul v = [1, 23, 12, 9, 30, 2, 50], dacă k = 3, vrem cele mai mari 3 elemente care sunt 50, 30, 23

sda-ab/laboratoare/03.txt · Last modified: 2021/03/08 12:46 by andreea.udrea
CC Attribution-Share Alike 3.0 Unported
www.chimeric.de Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0