Table of Contents

Laborator 12 - Arbori binari de căutare echilibrați. Treapuri.

Responsabili:

Obiective

În urma parcurgerii acestui laborator studentul va:

Necesitatea structurii de arbore binar de căutare echilibrat

O structură de date este o metodă de a reține anumite date astfel încât operațiile cu acestea (căutare, inserare, ștergere) să fie făcute cât mai eficient și să respecte cerințele programatorului. De multe ori, o anumită structură de date se află la baza unui algoritm sau sistem, iar o performanță bună a acesteia (complexitate spațială și temporală cât mai mică) influențează performanța întregului sistem.

În laboratoarele precedente am observat că un arbore binar de căutare de înălțime h implementează operațiile descrise mai sus într-o complexitate de O(h). Dacă acest arbore binar nu este capabil să gestioneze elementele ce sunt inserate pentru a își menține o structura echilibrată atunci complexitatea pe operațiile de bază va crește.

Exemplu: Să presupunem ca avem de introdus n numere într-un arbore binar de căutare. Întâmplarea face ca numerele să fie sortate, de unde rezultă că arborele format va avea o structură liniară → fiecare nod va avea un singur vecin. Astfel, complexitatea pe operaţiile de bază va fi O(n), la fel ca în cazul folosirii unui simplu vector.

Noțiuni de bază despre treapuri

Treapurile sunt un bun exemplu de arbori de căutare echilibrați, cel mai des folosiți datorită implementării relativ ușoare (comparativ cu alte structuri similare cum ar fi Red-Black Trees, AVL-uri sau B-Trees), dar și a modului de operare destul de intuitiv. Fiecare nod din treap va reţine două câmpuri:

Această structură trebuie să respecte doi invarianți:

Se poate observa că numele structurii de date provine din acești doi invarianți: tr-eap.

Cum se menține echilibrul structurii?

De fiecare dată când un nod este inserat în arbore prioritatea lui este generată aleator (metodă similară cu cea folosită la randomized quick sort, în care la fiecare pas pivotul este generat aleator). Arborele va fi aranjat într-un mod aleator, bineînțeles, respectând cei doi invarianți. Cum numărul arborilor echilibrați este mai mare decât cel al arborilor rău echilibrați, șansa este destul de mică ca prioritățile generate aleator să nu mențină arborele echilibrat.

Demonstraţia complet teoretică asupra faptului că operațiile de bază au complexitatea O(logN) se poate găsi în [2].

Structura unui nod

Mai jos avem codul pentru structura nodului unui treap; se pot observa asemănările cu structura de arbore binar și cu cea de heap.

template <typename T> struct Treap {
  T key;
  int priority;
  Treap<T> *left, *right;
};

Bineînțeles, tipul de date trebuie să permită o relație de ordine totală astfel încât oricare două elemente să poată fi comparate.

Operații de bază

Mai jos este descris pseudocodul pentru operațiile de bază făcute cu treapuri.

Pentru exemplificarea operațiilor am folosit un nod special, numit nil, care reprezintă un nod fictiv, ce nu reține date şi folosit pentru a arăta că nu există un nod efectiv în treap. De exemplu, dacă un nod x are ambii fii egali cu nil înseamnă ca x este frunză în arbore.

Căutarea

Căutarea se face exact ca la un arbore binar de căutare.

bool cautare(nod, cheie) {
  if nod == nil
    return false;
  if nod.cheie == cheie
    return true;
  
  if cheie < nod.cheie
    return cautare(nod.stanga, cheie);
  else
    return cautare(nod.dreapta, cheie);
}

Inserarea

Inserarea unui nod se face generând o prioritate aleatoare pentru acesta și procedând asemănător ca pentru un arbore de căutare, adăugând nodul la baza arborelui printr-o procedură recursivă, pornind de la rădăcină.

Deși inserarea menține invariantul arborelui de căutare, invariantul de heap poate să nu se mai respecte. De aceea, trebuie definite operații de rotire (stânga sau dreapta), care să fie aplicate unui nod în cazul în care prioritatea sa este mai mare decât ce a părintelui său.

Mai jos avem pseudocodul pentru operația de inserare.

void insert(nod, cheie, prioritate) {
  if nod == nil
    nod = creza nou nod pe baza de cheie si prioritate
  else if cheie < nod.cheie
    insert(nod.stanga, cheie, prioritate)
  else
    insert(nod.dreapta, cheie, prioritate)
    
  if nod.stanga.prioritate > nod.prioritate
    rotireDreapta(nod)
  else if nod.dreapta.prioritate > nod.prioritate
    rotireStanga(nod)
}

Spre exemplu, dacă am dori să inserăm nodul cu cheia 9 şi prioritatea 51, pașii vor arată în felul următor:

Se observă necesitatea rotirilor pentru a aduce nodul nou inserat în vârful arborelui (are prioritatea cea mai mare).

Cele două tipuri de rotiri sunt prezentate vizual în imaginea de mai jos:

Ștergerea

Operația de ștergere este inversul operației de inserare și se aseamăna foarte mult cu ștergerea unui nod în cadrul unui heap. Nodul pe care îl dorim a fi șters este rotit până când ajunge la baza arborelui, iar atunci este șters. Pentru a menține invariantul de heap, vom face o rotire stânga dacă fiul drept are o prioritate mai mare decât fiul stâng și o rotire drepta în caz contrar.

void sterge(nod, cheie) {
  if nod == nil
    return
 
  if cheie < nod.cheie
    sterge(nod.stanga, cheie)
  else if cheie > nod.cheie
    sterge(nod.dreapta, cheie)
  else if nod.stanga == nil si nod.dreapta == nil
    sterge nod
  else if nod.stanga.prioritate > nod.dreapta.prioritate
    rotireDreapta(nod)
    sterge(nod, cheie)
  else
    rotireStanga(nod)
    sterge(nod, cheie)
}

Exerciții

Pentru exerciții porniți de la scheletul de laborator.

1.[2p] Implementați funcțiile de bază pentru un treap:

2.[1p] Realizați o parcurgere a treapului astfel încât să obțineți cheile sortate crescător/descrescător.

3.[2p] Realizați o parcurgere a treapului astfel încât să obțineți o structură arborescentă a priorităților, pentru a observa invariantul de heap.

4.[2p] Scrieți o funcție care să răspundă într-o complexitate de O(logN) la următoarea cerință: Care este cea de-a K-a cheie, în ordinea sortării crescătoare, care se află în treap?

Bibliografie

[1] Fast Set Operations Using Treaps

[2] Randomized Binary Search Trees

[3] Balanced Search Trees

[4] Red-black Tree

[5] AVL Tree

[6] B-Tree