This shows you the differences between two versions of the page.
pa:laboratoare:laborator-07 [2021/04/20 00:04] darius.neatu [Algoritm] |
pa:laboratoare:laborator-07 [2025/05/14 16:50] (current) radu.iacob [Componente Biconexe] |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== Laborator 07: Parcurgerea grafurilor. Aplicații (1/2) ====== | + | ====== Laborator 07: Parcurgerea grafurilor. Aplicații (2/2) ====== |
- | Responsabili: | ||
- | * [[neatudarius@gmail.com|Darius-Florentin Neațu (2017-2021)]] | ||
- | * [[radunichita99@gmail.com | Radu Nichita (2021)]] | ||
- | * [[stefanpopa2209@gmail.com | Ștefan Popa (2018-2020)]] | ||
- | Autori: | ||
- | * [[neatudarius@gmail.com|Darius-Florentin Neațu (2021)]] | ||
- | * [[radunichita99@gmail.com | Radu Nichita (2021)]] | ||
===== Obiective laborator ===== | ===== Obiective laborator ===== | ||
- | * Conceptele de graf, reprezentare și parcugere | + | * Înțelegerea conceptelor de graf, reprezentare și parcugere |
- | * Aplicații parcurgeri | + | * Studierea unor aplicații pentru parcurgeri |
- | ===== Importanţă – aplicaţii practice ===== | + | ===== Componente Conexe ===== |
+ | >> O **componentă conexă** (**CC**) / **Connected Component** (**CC**) într-un graf **neorientat** este o submulțime maximală de noduri, cu proprietatea că oricare ar fi două noduri x și y din aceasta, există drum de la x la y. | ||
- | Grafurile sunt utile pentru a modela diverse probleme și au numeroase aplicații practice: | + | <spoiler CC - exemplu 01> |
+ | $n = 6$ $m = 6$ | ||
- | * Rețele de calculatoare (ex: stabilirea unei topologii fără bucle / arbore de acoperire) | + | $muchii: { (1,2); (1,5); (2,5); (2,3); (3, 5); (4, 6);} $ |
- | * Pagini Web (ex. algoritmi de căutare - Google PageRank ) | + | |
- | * Rețele sociale (ex. sugestii de prietenie pe Facebook) | + | |
- | * Harți cu drumuri (ex. drum minim între două localități) | + | |
- | * Modelare grafică (ex. arbori de parționare) | + | |
- | * Rețele de transport (ex. flux) | + | |
- | ===== Grafuri ===== | + | {{pa:new_pa:lab08-cc-example01.png}} |
- | Puteți consulta capitolul "Elementary Graph Algorithms" din "Introduction to Algorithms" [0] pentru mai multe definiții formale. Această secțiune sumarizează principalele notații folosite în laboratoarele de PA. | + | |
- | ==== Definiții ==== | + | Sunt **2 CC**-uri în graful dat: |
+ | * {1, 2, 3, 5} | ||
+ | * {4, 6} | ||
- | >> Un **graf** G se definește ca fiind o pereche (V, E), unde **V = {node / un nod oarecare din graf}**, iar **E = {(x, y) / (x, y) muchie in graf}**. | + | Explicație: |
+ | * Cele 2 sunt mulțimi maximale pentru care se respectă proprietatea de conexitate. | ||
+ | * 4 și 6 nu sunt accesibile din nodurile 1, 2, 3 și 5, prin urmare, acestea trebuie să facă parte din componente diferite. | ||
+ | </spoiler> | ||
- | >> Un graf este **neorientat** dacă relațiile dintre noduri sunt **bidirecționale**: oricare ar fi $(x, y)$ în $E$, există și $(y, x)$ în $E$. Relațiile se numesc **muchii**. | ||
- | >> Un graf este **orientat** dacă relațiile dintre noduri sunt **unidirecționale**: $(x, y)$ este în $E$ nu implică neapărat $(y, x)$ în $E$. Relațiile se numesc **arce**. | + | \\ |
+ | >> Un graf **neorientat** este **conex** dacă conține **o singură** componentă conexă. | ||
- | >> O **componentă conexă (CC)** este o submulțime maximală de noduri, cu proprietatea că oricare ar fi două noduri x și y din aceasta, există drum de la x la y. Pentru grafuri orientate, o componentă conexă se numește ** componentă tare conexă (CTC)**. | + | <spoiler CC - exemplu 02> |
+ | $n = 6$ $m = 7$ | ||
- | >> Un graf **aciclic** este un graf (orientat/neorientat) care nu conține cicluri. | + | $muchii: {(1, 2); (1, 5); (2, 5); (2, 3); (3, 5); (4, 6); (5, 4)} $ |
- | ==== Reprezentare ==== | + | |
- | Problemele care se modelează folosind grafuri, de obicei, presupun explorarea spațiului. O parcurgere explorează fiecare nod al grafului, exact o singură dată, pornind de la un nod ales, numit în continuare nod sursă (EN: **source**). Modul de reprezentare ar grafului, poate influența performanța unei parcurgeri/unui algoritm. | + | |
- | Un graf poate fi modelat în mai multe moduri (folosind mai multe notații): | ||
- | * printr-o pereche de mulțimi $G = (V, E)$ | + | {{pa:new_pa:lab08-cc-example02.png}} |
- | * $V$ = {v / v este un nod în graf} = mulțimea nodurile grafului (EN: nodes / vertices) | + | |
- | * $E$ = {e / $e=(x, y)$ este o muchie în graf între nodurile x și y} = mulțimea muchiile/arcelor (EN: edges), fiecare muchie stabilind o relație de vecinătate între doua noduri. | + | |
- | * printr-o pereche $G = (nodes, a)$ | + | Graful dat este conex - există **1 CC**: {1, 2, 3, 4, 5, 6}. |
- | * $nodes$ = {node / node este un nod în graf} | + | |
- | * $a[x][y] = 0/1$ | + | |
- | * **1** = există muchia/arcul (x, y) | + | |
- | * **0** = **NU** există muchia/arcul (x, y) | + | |
- | * printr-o pereche de mulțimi $G = (nodes, adj)$ | + | Explicație: Se poate ajunge de la oricare nod la oricare altul. |
- | * $nodes$ = {node / node este un nod în graf} | + | </spoiler> |
- | * $adj$ = {$adj[node]$ / unde $adj[node]$ este lista de adiacență a lui node} = reprezentarea grafului ca liste de adiacențe | + | |
- | * $adj[node] = {..., neigh, ...}$ => există muchie/arc (node, neigh) | + | |
+ | <note> | ||
+ | O componentă conexă reprezintă o partiție a nodurilor în submulțimi! <=> Fiecare nod face parte dintr-o singură componentă conexă! | ||
+ | </note> | ||
+ | ==== Algoritmi ==== | ||
+ | === DFS === | ||
+ | <note> | ||
+ | CC cu DFS: | ||
+ | * În algoritmul clasic de parcurgere DFS, de fiecare dată când se găsește un nod fără părinte și se apeleză DFS_RECURSIVE, se descoperă o nouă componentă conexă. | ||
+ | * Toate nodurile vizitate în acel subarbore fac parte din aceeași componentă conexă. | ||
+ | </note> | ||
+ | == Complexitate == | ||
- | Reprezentarea în memorie a grafurilor se face, de obicei, cu **liste de adiacență**. Se pot folosi însă și alte structuri de date, care vor fi introduse pe parcurs. | + | $T = O(n + m)$ |
- | Cele mai uzuale notații din laboratoarele de grafuri sunt descrise în [[https://ocw.cs.pub.ro/courses/pa/skel_graph | Precizări laboratoare 07-12]] (ex. $n$, $m$, $adj$, $adj\_trans$, $(x, y)$, etc). | + | === BFS === |
+ | <note> | ||
+ | CC cu BFS: | ||
+ | * Se parcurge lista de noduri. | ||
+ | * Pentru fiecare nod care nu are părinte, se pornește o nouă parcurgere BFS din nodul curent. | ||
+ | * Toate nodurile vizitate într-o parcurgere BFS fac parte din aceeași componentă conexă. | ||
+ | * Observație: Se păstreză lista de părinți de la o parcurgere la alta. | ||
+ | </note> | ||
+ | == Complexitate == | ||
- | ==== Colorare ==== | + | $T = O(n + m)$ |
- | Algoritmii de parcugere se pot folosi de o colorare a nodurilor: | + | |
- | * **white** (alb) = nod care nu a fost încă vizitat (nu este în coadă) | + | <note warning> |
+ | Deși ambele abordări au aceeași complexitate, recomandăm abordarea cu DFS pentru simplitate. | ||
+ | </note> | ||
- | * **gray** (gri) = nod care este în curs de vizitare (a fost adăugat în coadă) | + | ===== Componente Tare Conexe ===== |
- | * **black** (negru) = nod care a fost complet vizitat (node scos din coadă și pentru care s-a vizitat tot subarborele) | + | >> O **componentă tare conexă** (**CTC**) / **Strongly Connected Component** (**SCC**) într-un graf **orientat** este o submulțime maximală de noduri, cu proprietatea că oricare ar fi două noduri x și y din aceasta, există drum de la x la y. |
+ | <spoiler SCC - exemplu 01> | ||
+ | $n = 6$ $m = 6$ | ||
- | ==== Algoritmi de parcurgere ==== | + | $arce: {(1, 2); (1, 5); (5, 2); (2, 3); (3, 5); (4, 6)} $ |
- | Problemă: Să se parcurgă un graf dat. Fiecare nod se parcuge (exact) o singură dată. | + | |
- | Algoritmi: | + | |
- | * **BFS** | + | {{pa:new_pa:lab08-scc-example01.png}} |
- | * **DFS** | + | Sunt **4 SCC**-uri în graful dat: |
+ | * {1} | ||
+ | * {2, 3, 5} | ||
+ | * {4} | ||
+ | * {6} | ||
- | ===== BFS - Parcurgerea în lățime ===== | + | Explicație: |
+ | * În nodul 1 nu se poate ajunge, prin urmare acesta formează o componentă separată. Analog pentru 4. | ||
+ | * Similar, din nodul 6 nu se poate ajunge în alt nod, deci și acesta formeză singur o componentă. | ||
+ | * Nodurile 2, 3 și 5 formeză un ciclu, prin urmare se poate ajunge de la oricare la oricare. | ||
+ | </spoiler> | ||
- | Parcurgerea în lățime **(Breadth-first Search - BFS)** este un algoritm de căutare în graf, în care, atunci când se ajunge într-un nod oarecare **node**, nevizitat, se vizitează toate nodurile nevizitate adiacente lui (notate pe rand cu **neigh**), apoi toate vârfurile nevizitate adiacente vârfurilor adiacente lui node, etc. | ||
+ | \\ | ||
+ | >> Un graf **orientat** este **tare conex** dacă conține o **singură componentă** tare conexă. | ||
- | Atenție! BFS depinde de nodul de start **source**. Plecând din acest nod, se vor vizita toate nodurile accesibile. De exemplu, într-un graf neorientat, aceste noduri accesibile formează o componentă conexă; în urma aplicării algoritmului BFS asupra fiecărei componente conexe a grafului, se obține un arbore de acoperire a întregului graf (prin eliminarea muchiilor pe care nu le folosim la parcurgere). Pentru a putea reconstitui acest arbore, se păstrează pentru fiecare nod dat identitatea părintelui său. În cazul în care nu exista o funcție de cost asociată muchiilor, BFS va determina și drumurile minime de la rădăcină la oricare nod. | + | <spoiler SCC - exemplu 02> |
+ | $n = 6$ $m = 6$ | ||
+ | $arce: {(1, 2); (1, 5); (5, 2); (2, 3); (3, 5); (4, 6); (4, 1); (5, 4); (6, 5)} $ | ||
- | Pentru implementarea BFS se folosește o coadă. | + | {{pa:new_pa:lab08-scc-example02.png}} |
+ | Graful este tare conex - există **1 SCC**: {1, 2, 3, 4, 5, 6}; | ||
- | ==== Algoritm ==== | + | Explicație: Se poate vedea că pentru fiecare nod x se poate ajunge în oricare alt nod y. |
- | <code cpp| BFS> | + | </spoiler> |
- | // do a BFS traversal from source | + | |
- | // | + | |
- | // source = the source for the BFS traversal | + | |
- | // nodes = list of all node from G | + | |
- | // adj[node] = the adjacency list of node | + | |
- | // example: adj[node] = {..., neigh, ...} => edge (node, neight) | + | |
- | BFS(source, G=(nodes, adj)) { | + | |
- | // STEP 0: initialze results | + | |
- | // d[node] = distance from source to node | + | |
- | // p[node] = parent of node in the BFS traversal started from source | + | |
- | // [optional] color[node] = white/gray/black | + | |
- | // * white = not yet visited | + | |
- | // * gray = visit in progress | + | |
- | // * black = visited | + | |
- | foreach (node in nodes) { | + | |
- | d[node] = +oo; // distance not computed yet | + | |
- | p(node) = null; // parent not found yet | + | |
- | // [optional] color[node] = white; | + | |
- | } | + | |
- | + | ||
- | // STEP 1: initalize a queue | + | |
- | q = {} | + | |
- | + | ||
- | // STEP 2: add the source(s) into q | + | |
- | d[source] = 0; // distance from source to source | + | |
- | p[source] = null; // the source never has a parent (because it's the root of the traversal) | + | |
- | q.push(source); | + | |
- | // [optional] color[source] = gray; | + | |
- | + | ||
- | // STEP 3: start traversal using the node(s) from q | + | |
- | while (!q.empty()) { // still have nodes to explore | + | |
- | // STEP 3.1: extract the next node from queue | + | |
- | node = q.pop(); | + | |
- | + | ||
- | // [optional] STEP 3.2: print/use the node | + | |
- | + | ||
- | // STEP 3.3: expand/visit the node | + | |
- | foreach (neigh in adj[node]) { // for each neighbour | + | |
- | if (d[node] + 1 < d[neigh]) { // a smaller distance <=> color[neigh] == white | + | |
- | d[neigh] = d[node] + 1; // update distance | + | |
- | p[neigh] = node; // save parent | + | |
- | q.push(neigh); // add neigh to the queue of nodes to be visited | + | |
- | // [optional] color[neigh] = gray; | + | |
- | } | + | |
- | } | + | |
- | + | ||
- | // [optional] color[node] = black; | + | |
- | } | + | |
- | } | + | |
- | + | ||
- | </code> | + | |
<note> | <note> | ||
- | Liniile cu **[optional]** se referă la logica de colorare din curs, care se poate omite (dacă nu se dorește acest rezultat). | + | O componentă tare conexă reprezintă o partiție a nodurilor în submulțimi! <=> Fiecare nod face parte dintr-o singură componentă tare conexă! |
</note> | </note> | ||
+ | ==== Algoritmi ==== | ||
+ | === TARJAN SCC === | ||
- | ==== Complexitate ==== | + | [[https://en.wikipedia.org/wiki/Tarjan%27s_strongly_connected_components_algorithm|Algoritmul lui Tarjan pentru SCC]] foloseşte o singură parcurgere DFS în urma căreia rezultă o pădure de arbori DFS. Componentele tare conexe vor fi subarbori în această pădure. Rădăcinile acestor subarbori se vor numi **rădăcinile componentelor tare conexe** (**SCC roots**). |
- | *cu liste de adiacență: $O(n + m)$ sau $O(|V| + |E|)$ | + | |
- | *cu matrice de adiacență: $O(n^2)$ sau $ O(|V|^2)$ | + | |
- | ===== DFS - Parcurgerea în adâncime ===== | + | Nodurile sunt puse pe o stivă, în ordinea vizitării. Când parcurgerea termină de vizitat un subarbore, se determină dacă rădăcina arborelui care s-a terminat de vizitat este și rădăcina unui SCC. Dacă un nod este rădăcina unei componente, atunci el şi toate de deasupra sa din stivă formează acea componentă tare conexă. |
- | Parcurgerea în adâncime **(Depth-First Search - DFS)** pornește de la un nod dat (**node**), care este marcat ca fiind în curs de procesare. Se alege primul vecin nevizitat al acestui nod (**neigh**), se marchează și acesta ca fiind în curs de procesare, apoi și pentru acest vecin se caută primul vecin nevizitat, și așa mai departe. În momentul în care nodul curent nu mai are vecini nevizitati, se marchează că fiind deja procesat și se revine la nodul anterior. Pentru acest nod se caută primul vecin nevizitat. Algoritmul se repetă până când toate nodurile grafului au fost procesate. | + | Pentru a determina dacă un nod este rădăcina unei componente tare conexe, se definesc: |
+ | <code cpp> | ||
+ | // the timestamp when node was found (when started to visit its subtree) | ||
+ | found[node] = start[node]; | ||
- | În urma aplicării algoritmului DFS asupra fiecărei componente conexe a grafului, se obține pentru fiecare dintre acestea câte un arbore de acoperire (prin eliminarea muchiilor pe care nu le folosim la parcurgere). Pentru a putea reconstitui acest arbore, păstram pentru fiecare nod dat identitatea părintelui sau. | + | // the minimum accessible timestamp that node can see/access |
+ | low_link[node] = min { found[x] | x is node OR x in ancestors(node) OR x in descendants(node) }; | ||
+ | </code> | ||
- | Pentru fiecare nod se vor reține: | + | >> **Tarjan SCC**: **node** is root for a SCC if **low_link[node] == found[node]**. |
- | * $start[node]$ = timestamp-ul / timpul descoperirii | + | |
- | * $finish[node]$ = timestamp-ul / timpul finalizării | + | |
- | * $p[node]$ = părintele din parcugerea DFS a lui node | + | |
- | + | ||
- | Spre deosebire de BFS, pentru implementarea DFS se folosește o stivă (abordare **LIFO** în loc de **FIFO**). În practică, stiva nu va fi reținută explicit - ci ne vom baza pe recursivitate. | + | <spoiler Explicații found+low_link> |
+ | **found[node]** reprezintă timpul de **start** din DFS, definit în laboratorul anterior. În implementare reținem o variabilă **timestamp** care se incrementează de fiecare dată când se vizitează un nod. Noua valoare a lui **timestamp** este **found[node]** (momentul la care **node** a fost găsit). | ||
+ | **low_link[node]** reprezintă cel mai mic timp de descoperire al unui nod **x** la care se poate ajunge pornind din **node** și mergând pe arcele/muchii nevizitate (se poate coborî sau urca). Practic, nodul cu cel mai mic timp de descoperire care se poate atinge prin traversarea a 0 sau mai multe arce. | ||
+ | * observații prelimilare: | ||
+ | * nodurile vizitate înaintea lui **node** au valoare **found** mai mică (deci și orice strămoș a lui **node** - mulțimea **ancestors(node)**) | ||
+ | * nodurile descendente ale lui **node** au valoare **found** mai mare (mulțimea **descendants(node)**) | ||
+ | * întrucât și **node** face parte din subarbore, inițializăm **low_link[node] = found[node]**. Valoarea finală va fi mai mică sau egală decât aceasta (conform definiției, vom căuta un minim). | ||
+ | |||
+ | * după ce **toate** nodurile accesibile din **node** au fost vizitate, se cunoaște ***valoarea finală** a lui **low_link[node]** și putem avea 2 cazuri: | ||
+ | * **low_link[node] == found[node]** | ||
+ | * dacă valoarea finală a rămăs cea inițială, înseamnă că **NU** s-a urcat în arbore (altfel am fi întâlnit valori mai mici decât cea inițială) | ||
+ | * prin urmare **node** este rădăcina unui SCC (primul nod întâlnit din acest SCC) | ||
+ | * nodurile din vârful stivei de deasupra lui **node** formează SCC-ul găsit | ||
+ | * **low_link[node] < found[node] ** | ||
+ | * dacă valoarea finală pentru **low_link[node]** este mai mică decât cea inițială, înseamnă că s-a urcat în arbore | ||
+ | * în acest caz există cel puțin o muchie **(y, x)** unde **x** este strămoș și **y** este descendent pentru **node**, prin care **y** (si implicit și **node**) își actualizează minimul cu valoarea din **x** | ||
+ | * drumul **x - ... - node -... y - ... - x ** este atunci un ciclu care face parte dintr-un SCC; **node** este un nod oarecare dintr-un astfel de ciclu ("la mijloc", întrucât mai sus de el există cel puțin un nod mai aproape de "începutul ciclului", adică nodul **x**) | ||
+ | * prin urmare, suntem siguri că **node** nu este rădăcina unui SCC | ||
+ | </spoiler> | ||
- | ==== Algoritm ==== | + | == Algoritm == |
- | <code cpp | DFS> | + | <code cpp | TARJAN_SCC> |
- | // do a DFS traversal from all nodes | + | // Tarjan_SCC |
+ | // * visit all nodes with DFS | ||
+ | // * compute found[node] and low_link[node] | ||
+ | // * extract SCCs | ||
// | // | ||
- | // nodes = list of all node from G | + | // nodes = list of all nodes from G |
// adj[node] = the adjacency list of node | // adj[node] = the adjacency list of node | ||
- | // example: adj[node] = {..., neigh, ...} => edge (node, neight) | + | // example: adj[node] = {..., neigh, ...} => edge (node, neigh) |
- | // | + | TARJAN_SCC(G = (nodes, adj)) { |
- | DFS(G=(nodes, adj)) { | + | // STEP 1: initialize results |
- | // STEP 0: initialze results | + | // parent[node] = parent of node in the DFS traversal |
- | // p[node] = parent of node in the BFS traversal started from source | + | // |
- | // start[node] = the timestamp (the order) when we started visiting the node subtree | + | // the timestamp when node was found (when started to visit its subtree) |
- | // finish[node] = the timestamp (the order) when we finished visiting the node subtree | + | // Note: The global timestamp is incremented everytime a node is found. |
- | // [optional] color[node] = white/gray/black | + | // |
- | // * white = not yet visited | + | // the minimum accessible timestamp that node can see/access |
- | // * gray = visit in progress | + | // low_link[node] = min { found[x] | x is node OR x in ancestors(node) OR x in descendants(node) }; |
- | // * black = visited | + | // |
foreach (node in nodes) { | foreach (node in nodes) { | ||
- | p[node] = null; // parent not found yet | + | parent[node] = null; // parent not yet found |
- | // [optional] color[node] = white; | + | found[node] = +oo; // node not yet found |
+ | low_link[node] = +oo; // value not yet computed | ||
} | } | ||
+ | nodes_stack = {}; // visiting order stack | ||
- | timestamp = 0; // the first timestamp before the DFS traversal | + | // STEP 2: visit all nodes |
+ | timestamp = 0; // global timestamp | ||
foreach (node in nodes) { | foreach (node in nodes) { | ||
- | if (p[node] == null) { // or [optional] color[node] == white | + | if (parent[node] == null) { // node not visited |
- | DFS_RECURSIVE(node, G, p, timestamp) | + | parent[node] = node; // convention: the parent of the root is actually the root |
- | } | + | |
- | } | + | |
- | } | + | |
- | DFS_RECURSIVE(node, G=(node, adj), p, ref timestamp) { | + | // STEP 3: start a new DFS traversal this subtree |
- | start[node] = ++timestamp; // start visiting its substree | + | DFS(node, adj, parent, timestamp, found, low_link, nodes_stack); |
- | // [optional] color[node] = gray; | + | |
- | + | ||
- | for (neigh in adj[node]) { // for each neighbour | + | |
- | if (p[neigh] == null) { // or [optional] color[neigh] = white; | + | |
- | p[neigh] = node; // save parent | + | |
- | DFS_RECURSIVE(neigh, G, p, timestamp); // continut traversal | + | |
} | } | ||
} | } | ||
- | |||
- | finish[node] = ++timestamp; // finish visiting its substree | ||
- | // [optional] color[node] = black; | ||
} | } | ||
- | </code> | ||
- | <note> | + | DFS(node, adj, parent, ref timestamp, found, low_link, nodes_stack) { |
- | Liniile cu **[optional]** se referă la logica de colorare din curs, care se poate omite (dacă nu se dorește acest rezultat). | + | // STEP 1: a new node is visited - increment the timestamp |
- | </note> | + | found[node] = ++timestamp; // the timestamp when node was found |
+ | low_link[node] = found[node]; // node only knows its timestamp | ||
+ | nodes_stack.push(node); // add node to the visiting stack | ||
- | ==== Complexitate ==== | + | // STEP 2: visit each neighbour |
- | *cu liste de adiacență: $O(n + m)$ sau $O(|V| + |E|)$ | + | foreach (neigh in adj[node]) { |
- | *cu matrice de adiacență: $O(n^2)$ sau $ O(|V|^2)$ | + | // STEP 3: check if neigh is already visited |
+ | if (parent[neigh] != null) { | ||
+ | // STEP 3.1: update low_link[node] with information gained through neigh | ||
+ | // note: neigh is in the same SCC with node only if it's in the visiting stack; | ||
+ | // otherwise, neigh is from other SCC, so it should be ignored | ||
+ | if (neigh in nodes_stack) { | ||
+ | low_link[node] = min(low_link[node], found[neigh]); | ||
+ | } | ||
+ | continue; | ||
+ | } | ||
+ | // STEP 4: save parent | ||
+ | parent[neigh] = node; | ||
- | ===== Aplicații parcurgeri ===== | + | // STEP 5: recursively visit the child subtree |
+ | DFS(neigh, adj, parent, timestamp, found, low_link, nodes_stack); | ||
- | * Componente Conexe | + | // STEP 6: update low_link[node] with information gained through neigh |
- | * Sortarea Topologică | + | low_link[node] = min(low_link[node], low_link[neigh]); |
- | * Componente Tare-Conexe | + | } |
- | * Componente Biconexe | + | |
- | + | ||
- | În acest laborator vom studia doar problema sortare topologică. | + | |
- | ===== TopSort - Sortarea Topologică ===== | + | // STEP 7: node is root in a SCC if low_link[node] == found[node] |
+ | // (there is no edge from a descendant to an ancestor) | ||
+ | if (low_link[node] == found[node]) { | ||
+ | // STEP 7.1: pop all elements above node from stack => extract the SCC where node is root | ||
+ | new_scc = {}; | ||
+ | do { | ||
+ | x = nodes_stack.pop(); | ||
+ | new_scc.push(x); | ||
+ | } while (x != node); // stop when node was popped from the stack | ||
- | ==== Problemă ==== | + | // STEP 7.2: save / print the new SCC |
+ | print(new_scc); | ||
+ | } | ||
+ | } | ||
- | >> O **sortare topologică** într-un **graf orientat aciclic** reprezintă o aranjare/permutare a nodurilor din graf care ține cont de arce. | + | </code> |
- | + | ||
- | Orientarea muchiilor corespunde unei relatii de ordine de la nodul sursa catre cel destinație: dacă $(x,y$) este un arc, $x$ trebuie să apară înaintea lui $y$ în inșiruire. | + | |
- | + | ||
- | <note> | + | |
- | Daca graful ar fi ciclic, nu ar putea exista o astfel de insiruire (nu se poate stabili o ordine intre nodurile care alcatuiesc un ciclu). | + | |
- | </note> | + | |
- | + | ||
- | <spoiler Exemplu TopSort> | + | |
- | {{pa:new_pa:lab07-topsort-example1.png}} | + | |
- | + | ||
- | În figura anterioară avem un graf cu: | + | |
- | * $n = 5$ $m = 4$ | + | |
- | * $arce: { (1,2); (1,3); (2,3); (2,4);} $ | + | |
- | + | ||
- | + | ||
- | Toate sortările topologice valide sunt: | + | |
- | * cele date de ordinea relativa a primelor 4 noduri: (1,2,3,4) | + | |
- | * $topsort = [1, 2, 3, 4, 5] $ | + | |
- | * $topsort = [1, 2, 3, 5, 4] $ | + | |
- | * $topsort = [1, 2, 5, 3, 4] $ | + | |
- | * $topsort = [1, 5, 2, 3, 4] $ | + | |
- | * $topsort = [5, 1, 2, 3, 4] $ | + | |
- | * cele date de ordinea relativa a primelor 4 noduri: (1,2,4,3) | + | |
- | * $topsort = [1, 2, 4, 3, 5] $ | + | |
- | * $topsort = [1, 2, 4, 5, 3] $ | + | |
- | * $topsort = [1, 2, 5, 4, 3] $ | + | |
- | * $topsort = [1, 5, 2, 4, 3] $ | + | |
- | * $topsort = [5, 1, 2, 4, 3] $ | + | |
- | + | ||
- | Explicație pentru $topsort = [1, 2, 3, 4, 5] $: | + | |
- | * deoarece avem arcele $1 \rightarrow 3$ si $1 \rightarrow 2$, 1 trebuie să apara înainte lui 2 și 3 | + | |
- | * deoarece avem arcul $2 \rightarrow 3$ si $2 \rightarrow 4$, 2 trebuie să apara înainte lui 3 și 4 | + | |
- | * 5 nu depinde de nimeni, poate să apară oriunde | + | |
- | </spoiler> | + | |
- | ==== Algoritmi ==== | + | |
- | Sunt doi algoritmi cunoscuti pentru sortarea topologică. | + | |
- | + | ||
- | === TopSort - DFS: sortare descrescătoare după timpul de finalizare === | + | |
- | <note> | + | |
- | Algoritm TopSort cu DFS: | + | |
- | * se face o parcurgere DFS pentru determinarea timpilor de finalizare | + | |
- | * se sortează descrescător in functie de timpul de finalizare | + | |
- | * permutarea de noduri obținută este o sortare topologică | + | |
- | </note> | + | |
- | + | ||
- | **Optimizare**: Pentru a evita sortarea nodurilor in functie de timpul de finalizare, se poate folosi o stiva ce retine aceste noduri in ordinea terminarii parcurgerii (sau un vector care la final este inversat). | + | |
+ | Observații: | ||
+ | * La pasul **3.1** se încearcă actualizarea lui **low_link[node]** cu informația din **neigh** doar dacă **neigh** este în stivă. | ||
+ | * Nodul **neigh** are deja părinte, deci poate fi în unul din următoare 2 cazuri: | ||
+ | * **neigh** este în curs de vizitare (deci este în stivă) => **neigh** este strămoș a lui **node** | ||
+ | * Reactualizăm **low_link[node]** cu valoarea din **neigh**. | ||
+ | * **neigh** este deja vizitat (deci a fost scos din stivă) => **neigh** face parte din alt subarbore, terminat anterior. | ||
+ | * Prin urmare, anterior s-a stabilit că **neigh** face parte dintr-un alt SCC și trebuie ignorat (întrucât sigur are valoare **found** mai mică decât a lui **node** și ar reactualiza **low_link[node]** în mod eronat. | ||
+ | * Se face această actualizare doar dacă **neigh** este strămoș al lui | ||
== Complexitate == | == Complexitate == | ||
- | * $T(n) = O(n+ m)$ | + | * **complexitate temporală **: $T = O(n + m)$ |
+ | * **complexitate spațială ** : $S = O(n)$ | ||
+ | * recursivitate + câteva structuri de date de lungime $O(n)$ | ||
- | === TopSort - BFS: algoritmul lui Kahn === | + | === Kosaraju === |
- | <note> | + | Există și alt algoritm pentru determinarea componentelor tare conexe. Algoritmul lui Kosaraju se bazează pe compactarea ciclurilor. Deoarece are aceeași complexitate ca și Tarjan, nu îl vom studia la laborator la PA. Am ales algoritmul lui Tarjan întrucât îl putem modifica ușor pentru a produce și alte rezultate. |
- | Algoritm TopSort cu BFS (Kahn): | + | |
- | * se initializeaza coada de la BFS cu toate nodurile din graf care au grad inten **0** | + | |
- | * se porneste parcurgerea BFS | + | |
- | * la fiecare pas se vizitează un nod **node** | + | |
- | * se șterg toate muchiile care pleacă din **node**: $(node, neigh)$ | + | |
- | * $neigh$ este adaugat in coada doar daca devine un nod cu grad intern **0** | + | |
- | * se verifica la finalul parcugerii daca mai sunt muchii ramase in graf | + | |
- | * **daca** inca mai exista muchii neșterse, atunci graful conține cel puțin un ciclu - nu se poate determina o sortare topologică | + | |
- | * **altfel**, ordinea in care s-au scos nodurile din coada reprezinta o sortare topologica | + | |
- | </note> | + | |
- | **Optimizare**: Pentru a evita ștergerea propriu-zisă a muchiilor din graf, se poate modifica gradul intern al fiecărui nod (care poate fi reținut într-un vector $in\_degree[node]$). | + | Puteți consulta următoarele materiale dacă doriți să aflați mai multe: |
+ | * https://www.youtube.com/watch?v=RpgcYiky7uw | ||
+ | * https://iq.opengenus.org/kosarajus-algorithm-for-strongly-connected-components/ | ||
+ | ===== Puncte de articulație ===== | ||
- | == Complexitate == | + | >> **Punct de articulație** / **nod critic** / **Cut Vertex** (**CV**) este un nod într-un graf **neorientat** a cărui eliminare duce la creșterea numărului de componente conexe (CC) - se elimină nodul împreună cu muchiile incidente. |
- | * $T(n) = O(n+ m)$ | + | |
+ | <spoiler CV - exemplu 01> | ||
+ | $n = 8$ $m = 6$ | ||
- | ==== Concluzie ==== | + | $muchii: {(1, 2); (2, 3); (3, 4); (4, 1); (1, 5); (5, 6); (6, 7); (7, 5); (7, 8)} $ |
- | Ambele variante au aceeasi complexitate. | + | |
- | * Algoritmul bazat pe DFS nu verifica daca graful este aciclic: presupune corectitudinea inputului. Este relativ mai simplu de implementat. | + | |
- | * Algoritmul bazat pe BFS se poate folosi pentru a detecta daca graful este aciclic; in caz afirmativ, gaseste o sortare topologica valida. | + | |
- | ===== TLDR ===== | + | |
- | * Cele mai uzuale moduri de reprezentare a unui graf sunt: liste de adiacentă și matrice de adiacentă. | + | {{pa:new_pa:lab08-cv-example01.png}} |
- | * Cele doua moduri uzuale de parcurgere a unui graf sunt: **BFS** și **DFS**. | + | Sunt **3 CV**-uri în graful dat: 1, 5 și 7. |
- | * O aplicație importantă a parcurgerilor este **Sortarea topologică** - o modalitate de aranjare a nodurilor în funcție de muchiile dintre ele. În functie de nodul de start al DFS, se pot obține sortări diferite, păstrând însă proprietatile generale ale sortarii topologice. | + | Explicație: |
+ | * Dacă ștergem nodul 1, graful se sparge în 2 CC-uri: {2, 3, 4}, {5, 6, 7, 8}. | ||
+ | * Dacă ștergem nodul 5, graful se sparge în 2 CC-uri: {1, 2, 3, 4}, {6, 7, 8}. | ||
+ | * Dacă ștergem nodul 7, graful se sparge în 2 CC-uri: {1, 2, 3, 4, 5, 6}, {8}. | ||
+ | * Dacă ștergem oricare alt nod, ,graful rămâne conex. | ||
+ | </spoiler> | ||
- | ===== Exerciții ===== | + | ==== TARJAN CV ==== |
+ | Putem modifica ușor algoritmul TARJAN SCC astfel încât să obținem [[https://en.wikipedia.org/wiki/Biconnected_component | Algoritmul lui Tarjan pentru CV]]. | ||
+ | În mod analog, pentru a determina dacă un nod este CV, se definesc și folosesc **found** și **low_link**. | ||
- | <note warning> | + | >> **TARJAN CV**: **node** is **CV** if |
- | Înainte de a rezolva exercițiile, asigurați-vă ca ați citit și înțeles toate precizările din secțiunea | + | >>**i)** node is NOT root and **low_link[neigh] >= found[node]** for at least one **neigh** in **adj[node]** |
- | [[https://ocw.cs.pub.ro/courses/pa/skel_graph | Precizări laboratoare 07-12]]. | + | >> OR |
+ | >> **ii)** node is root and children(node) > 1 | ||
- | Prin citirea acestor precizari vă asigurați ca: | + | Dacă **node** este rădăcină într-un subarbore, acesta are valoarea **found** mai mică decât a oricărui nod. Prin urmare, condiția **low_link[neigh] >= found[node]** ar fi adevărată mereu și nu ne-ar putea furniza o informație utilă. De aceea, cazul **i)** nu este aplicabil pentru rădăcină. Putem trata foarte simplu cazul pentru rădăcină folosind **ii)**: dacă **node** este rădăcină a unui subarborele și are cel puțin 2 copii, atunci, prin eliminarea lui **node**, arborele acestuia se sparge într-un număr de subarbori egal cu numărul de copii. |
- | * cunoasteți **convențiile** folosite | + | |
- | * evitați **buguri** | + | |
- | * evitați **depunctări** la lab/teme/test | + | |
- | </note> | + | <spoiler Explicații found+low_link> |
+ | **found[node]** are aceeași semnificație ca la SCC. | ||
- | <note> | + | **low_link[node]** are aceeași semnificație ca la SCC. |
- | Scheletul de laborator se găsește pe pagina [[https://github.com/acs-pa/pa-lab/tree/main/skel/lab07|pa-lab::skel/lab07]]. | + | * observații/diferențe: |
- | </note> | + | * Nu este nevoie de folosirea stivei de vizitare. |
+ | * La SCC aveam nevoie de stiva de noduri pentru a nu folosi o muchie **node -> neigh** (arc) care unea 2 SCC-uri. | ||
+ | * Într-un graf neorientat nu putem avea o muchie care să unească 2 subarbori, deoarece în momentul în care un capăt este vizitat, adaugă și celălalt capăt în același subarbore. | ||
+ | * **neigh** este copil al lui **node** în parcurgerea DFS => **found[neigh] > found[node]** | ||
+ | * după ce un copil **neigh** este vizitat, se cunoaște ***valoarea finală** a lui **low_link[neigh]** și putem avea 2 cazuri: | ||
+ | * **low_link[neigh] < found[node] ** | ||
+ | * inițial **low_link[neigh] = found[neigh]**, deci **low_link[neigh] > found[node]** | ||
+ | * în acest caz există cel puțin o muchie **(y, x)** unde **x** este strămoș și **y** este descendent pentru **node** prin care **y** (și implicit și **node**) își actualizează minimul cu valoarea din **x** | ||
+ | * drumul **x - ... - node - neigh - ... y - x ** este atunci un ciclu | ||
+ | * dacă **node** este eliminat din graf, toate nodurile din subarborele lui **neigh** vor rămâne conectate de restul grafului prin muchia **(y, x)** | ||
+ | * deci nu putem trage vreo concluzie doar analizând vecinul curent **neigh**, trecem la următorul | ||
+ | * **low_link[neigh] >= found[node] ** | ||
+ | * în acest caz nu există ciclul **x - ... - node - neigh - ... y - x ** de la cazul anterior | ||
+ | * eliminarea lui **node** ar duce la separarea subarborelui lui **neigh** de restul grafului | ||
+ | * prin urmare, numărul de componente conexe crește cu cel puțin 1, deci **node** este sigur un **CV** (concluzie corectă chiar dacă ne-am uitat la un singur vecin **neigh**) | ||
- | <note warning> | + | </spoiler> |
- | Începând cu acest laborator, fiecare problemă are restricții concrete: dimensiuni pentru input și timp maxim de execuție. Pentru a vedea dacă o soluție (idee) intră în timp înainte de a o implementa, va trebui să îi calculați complexitatea și să aproximați timpul de execuție folosind tutorialul [[https://github.com/acs-pa/pa-lab/tree/main/docs/complexity.md|pa-lab::docs/Complexity]]. | + | |
- | </note> | + | |
+ | \\ | ||
+ | \\ | ||
+ | Punem la dispoziție un diff de pseudocod: [[https://pastebin.com/raw/8th3Pnjg | TARJAN_SCC vs TARJAN_CV]]. Se observă că este același algoritm, singurele diferențe relevante sunt: | ||
+ | * STEP **3.1**: condiția după care se reactulizează **low_link[node]** în funcție de **neigh** atunci când cel din urmă este deja vizitat | ||
+ | * STEP **7**: condiția prin care se determină dacă **node** este o rădăcină de SCC / CV. | ||
+ | \\ | ||
- | === BFS === | + | == Complexitate == |
- | Se dă un graf **neorientat** cu **n** noduri și **m** muchii. Se mai dă un nod special **source**, pe care îl vom numi sursa. | + | * **complexitate temporală **: $T = O(n + m)$ |
+ | * **complexitate spațială ** : $S = O(n)$ | ||
+ | * recursivitate + câteva tablouri auxiliare de lungime n | ||
+ | ===== Punți / muchii critice ===== | ||
+ | >> **Punte** / **muchie critică** / **Critical Edge** (**CE**) este o muchie într-un graf **neorientat** a cărei eliminare duce la creșterea numărului de componente conexe (CC) - se elimină muchia, fără a se sterge capetele (nodurile) acesteia. | ||
- | Se cere să se găsească **numărul minim de muchii** ce trebuie parcurse de la **source** la **toate ** celelalte noduri. | + | <spoiler CE - exemplu 01> |
+ | $n = 8$ $m = 6$ | ||
- | <note warning> | + | $muchii: { (1,2); (2, 3); (3, 4); (4, 1); (1, 5); (5, 6); (6, 7); (7, 5); (7, 8)} $ |
- | Restricții și precizări: | + | |
- | * $ n, m <= 10^5 $ | + | |
- | * timp de execuție | + | |
- | * C++: 1s | + | |
- | * Java: 1s | + | |
- | </note> | + | |
- | <note> | + | {{pa:new_pa:lab08-ce-example01.png}} |
- | Rezultatul se va returna sub forma unui vector **d** cu **n** elemente. | + | |
- | Convenție: | + | Sunt **2 CE**-uri în graful dat: (1, 5) și (7,8) |
- | * ** d[node] ** = numărul minim de muchii ce trebuie parcurse de la **source** la nodul **node** | + | |
- | * ** d[source] = 0 ** | + | |
- | * ** d[node] = -1**, dacă nu se poate ajunge de la **source** la **node** | + | |
- | </note> | + | |
- | <spoiler Exemplu 1> | + | Explicație: |
- | $n = 5$ $m = 4$ $source = 3$ | + | * Dacă ștergem muchia (1, 5), graful se sparte în 2 CC-uri: {1, 2, 3, 4}, {5, 6, 7, 8}. |
+ | * Dacă ștergem muchia (7, 8), graful se sparte în 2 CC-uri: {1, 2, 3, 4, 5, 6, 7}, {8}. | ||
+ | * Dacă ștergem oricare altă muchie, graful rămâne conex. | ||
+ | </spoiler> | ||
- | $muchii: { (1,2); (1,3); (2,3); (2,4);} $ | + | ==== TARJAN CE ==== |
+ | Se modifică algoritmul de CV. Se folosesc aceleași definiții și semnificații pentru **found** și **low_link**. | ||
+ | >> **TARJAN CE**: **(node, neigh)** is a **CE** if **low_link[neigh] > found[node]** where **neigh** in **adj[node]**. | ||
- | Răspuns: | ||
- | |node|1|2|3|4|5| | ||
- | |d|1|1|0|2|-1| | ||
- | Explicație: | + | <spoiler Explicație> |
- | Graful dat este cel din figura urmatoare. | + | Există 2 tipuri de muchii în parcugerea DFS într-un graf neorientat: |
+ | * **(node, neigh)**: muchiile din arbore (numită și muchie de arbore) | ||
+ | * **(y, x)**: muchie de la un nod **y** la un strămoș **x** (numită și muchie înapoi) | ||
+ | Tipul al 2-lea de muchie închide un ciclu, deci clar nu reprezintă un CE. Prin urmare trebuie să căutăm toate CE-urile printre muchiile **(node, neigh)** din arbore. | ||
- | {{pa:new_pa:lab07-bfs-example1.png}} | + | Când se termină de vizitat subarborele lui **neigh** și cunoaștem valoarea finală a lui **low_link[neigh]** putem avea: |
- | + | * **low_link[neigh] <= found[node]**: | |
- | * ** d[3] = 0 ** pentru că 1 este sursa | + | * analog explicațiilor de la CV, din subarborele lui **neigh** se poate urca până la un nod **x** (x este **node** SAU un strămoș al lui **node**) => muchia **(node, neigh)** face parte dintr-un ciclu |
- | * ** d[1] = d[2] = 1 ** pentru că există muchie directă de la 2 la fiecare nod | + | * prin urmare, dacă se taie aceasta, toate nodurilor de pe ciclu rămân conectate, deci nu este CE |
- | * ** d[4] = 2 ** pentru că trebuie să parcurgem 2 muchii ($3-2-4$) | + | * **low_link[neigh] > found[node]**: |
- | * ** d[5] = -1 ** pentru că nu se poate ajunge de la 3 la 5 | + | * înseamnă că nu există acel ciclu de la pasul anterior (nu s-a putut urca în arbore mai sus de **node**) |
+ | * prin urmare, **(node, neigh)** este **CE** | ||
</spoiler> | </spoiler> | ||
+ | == Complexitate == | ||
+ | * **complexitate temporală **: $T = O(n + m)$ | ||
+ | * **complexitate spațială ** : $S = O(n)$ | ||
+ | * recursivitate + câteva structuri de date de lungime $O(n)$ | ||
+ | ===== Componente Biconexe ===== | ||
- | <spoiler Exemplu 2> | + | >> O **componentă biconexă** / **BiConnected Component** (**BCC**) într-un graf **neorientat** este o submulțime maximală de noduri cu proprietatea că nu conține puncte de articulație - oricare nod s-ar elimina, nodurile rămase sunt încă conectate. |
- | $n = 7$ $m = 7$ $source = 1$ | + | |
- | $muchii: { (1,2); (1,4); (2,3); (4,5); (5,6); (3,7); (7,6) } $ | + | <spoiler BCC - exemplu 01> |
+ | $n = 8$ $m = 9$ | ||
- | Răspuns: | + | $muchii: {(1, 2); (2, 3); (3, 4); (4, 1); (1, 5); (5, 6); (6, 7); (7, 5); (7, 8)} $ |
- | |node|1|2|3|4|5|6|7| | + | |
- | |d|0|1|2|1|2|3|3| | + | |
- | Explicație: | + | {{pa:new_pa:lab08-bcc-example01.png}} |
- | Graful dat este cel din figura urmatoare. | + | |
- | {{pa:new_pa:lab07-bfs-example2.png}} | + | Sunt **4 BCC**-uri în graful dat: |
+ | * {1, 2, 3, 4} | ||
+ | * {1, 5} | ||
+ | * {5, 6, 7} | ||
+ | * {7, 8} | ||
- | * ** d[1] = 0 ** pentru că 1 este sursa | + | Explicație: |
- | * ** d[2] = d[4] = 1 ** pentru că există muchie directă de la 2 la fiecare nod | + | * Dacă ștergem muchia (1, 5), graful se sparge în 2 CC-uri: {1, 2, 3, 4}, {5, 6, 7, 8}. |
- | * ** d[3] = d[5] = 2 ** pentru că trebuie să parcurgem 2 muchii ($1-2-3$, $1-4-5$) | + | * Dacă ștergem muchia (7, 8), graful se sparge în 2 CC-uri: {1, 2, 3, 4, 5, 6, 7}, {8}. |
- | * ** d[6] = d[7] = 3 ** pentru ca trebuie să parcurgem 3 muchii ($1-2-3-7$ sau $1-4-5-6$) | + | * Dacă ștergem oricare altă muchie, graful rămâne conex. |
</spoiler> | </spoiler> | ||
- | <spoiler Exemplu 3> | + | \\ |
- | $n = 7$ $m = 8$ $source = 1$ | + | >> Un graf **neorientat** este **biconex** dacă nu conține puncte de articulație - conține o singură componentă biconexă. |
- | $muchii: { (1,2); (1,4); (2,3); (4,5); (5,6); (3,7); (7,6); (1, 6) } $ | + | <spoiler BCC - exemplu 02> |
+ | $n = 8$ $m = 10$ | ||
- | Răspuns: | + | $muchii: {(1, 2); (2, 3); (3, 4); (4, 1); (1, 5); (5, 6); (6, 7); (7, 5); (7, 8); (8, 2)} $ |
- | |node|1|2|3|4|5|6|7| | + | |
- | |d|0|1|2|1|2|1|2| | + | |
- | Explicație: | + | {{pa:new_pa:lab08-bcc-example02.png}} |
- | Graful dat este cel din figura urmatoare. | + | |
- | {{pa:new_pa:lab07-bfs-example3.png}} | + | Sunt **1 BCC**-uri în graful dat: {1, 2, 3, 4, 5, 6, 7, 8} |
- | * ** d[1] = 0 ** pentru că 1 este sursa | + | Explicație: |
- | * ** d[2] = d[4] = d[6] = 1 ** pentru că există muchie directă de la 2 la fiecare nod | + | * Nu există noduri/puncte critice în graf (se poate șterge orice nod și graful rămâne conex). |
- | * ** d[3] = d[5] = d[7] = 2 ** pentru că trebuie să parcurgem 2 muchii ($1-2-3$, $1-4-5$, $1-6-7$) | + | |
</spoiler> | </spoiler> | ||
- | |||
- | |||
- | === Topological Sort === | ||
- | Se dă un graf **orientat** aciclic cu **n** noduri și **m** arce. Se cere să se găsească **o sortare topologica** validă. | ||
<note warning> | <note warning> | ||
- | Restricții si precizari: | + | Împărțirea în componente biconexe a unui graf neorientat reprezintă **o partiție disjunctă a muchiilor grafului** (împreună cu vârfurile adiacente muchiilor). Acest lucru implică faptul că unele vârfuri pot face parte din mai multe componente biconexe diferite (vezi BCC - exemplu 01) - mai exact, punctele de articulație vor face parte din mai multe componente. |
- | * $ n, m <= 10^5 $ | + | |
- | * timp de executie | + | |
- | * C++: 1s | + | |
- | * Java: 1s | + | |
</note> | </note> | ||
+ | ==== TARJAN BCC ==== | ||
+ | Se modifică algoritmul de CV. Se folosesc aceleași definiții și semnificații pentru **found** și **low_link**. | ||
- | <note> | + | * Se folosește o stivă **edges_stack** în care se adaugă toate muchiile **(node, neigh)** atunci când se înaintează în recursivitate. |
- | Rezultatul se va returna sub forma unui vector **topsort** cu ** n ** elemente. | + | * Atunci când se termină de vizitat un copil **neigh**, dacă se îndeplinește condiția de **CV** (**low_link[neigh] >= found[node]**), înseamnă că prin eliminarea lui **node** tot subarborele **node - neigh - ...** rămâne deconectat. Prin urmare, toate muchiile din stivă de deasupra muchiei **(node, neigh)** (inclusiv) formează o componentă biconexă (mulțimea de noduri formată din capetele acestor muchii). |
+ | * Se termină de vizitat copilul curent și se trece la următorul. De fiecare dată când se găsește un copil **neigh** cu **low_link[neigh] >= found[node]** se formează o nouă **BCC**. | ||
- | Vectorul **topsort** va reprezenta o permutare a multimii ${1, 2, 3,..., n}$ reprezentand sortarea topologica gasita. | + | == Complexitate == |
- | </note> | + | * **complexitate temporală **: $T = O(n + m)$ |
+ | * **complexitate spațială ** : $S = O(n + m)$ | ||
+ | * recursivitate + câteva structuri de date de lungime $O(n)$ / $O(m)$ | ||
+ | * ATENȚIE! În plus, față de CE/CV , se stochează o stivă de muchii. | ||
- | <spoiler Exemplu 1> | ||
- | $n = 5$ $m = 4$ | ||
- | $arce: { (1,2); (1,3); (2,3); (2,4);} $ | + | ===== Importanţă – aplicaţii practice ===== |
+ | * SCC: Data Mining, Compilatoare, problema 2-SAT. | ||
+ | * BCC: cele mai importante aplicații se găsesc în rețelele de calculatoare, deoarece un BCC asigură redundanţă (există cel puțin 2 căi de a conecta o entitate la celelalte). | ||
+ | |||
+ | ===== TLDR ===== | ||
+ | * Se poate folosi/modifica algoritmul lui Tarjan pentru a determina **SCC**, **CV** / **CE** / **BCC**. | ||
+ | * Deoarece algoritmul se folosește de o parcurgere DFS, complexitatea este liniară în toate cazurile. | ||
- | Răspuns: $topsort = [1, 2, 3, 4, 5] $ | + | ===== Exercitii ===== |
+ | <note> | ||
+ | Scheletul de laborator se găsește pe pagina [[https://github.com/acs-pa/pa-lab/tree/main/skel/lab07|pa-lab::skel/lab07]]. | ||
+ | </note> | ||
- | Explicație: | + | <note warning> |
- | Graful dat este cel din figura următoare. | + | Înainte de a rezolva exercițiile, asigurați-vă că ați citit și înțeles toate precizările din secțiunea |
+ | [[https://ocw.cs.pub.ro/courses/pa/skel_graph | Precizari laboratoare 07-12]]. | ||
- | {{pa:new_pa:lab07-topsort-example1.png}} | + | Prin citirea acestor precizări vă asigurați că: |
- | * deoarece avem arcele $1 \rightarrow 3$ si $1 \rightarrow 2$, 1 trebuie să apara înainte lui 2 și 3 | + | * știți **convențiile** folosite |
- | * deoarece avem arcul $2 \rightarrow 3$ si $2 \rightarrow 4$, 2 trebuie să apara înainte lui 3 și 4 | + | * evitați **buguri** |
- | * 5 nu depinde de nimeni, poate să apară oriunde | + | * evitați **depunctări** la lab/teme/test |
- | Toate sortările topologice valide sunt: | + | </note> |
- | * cele date de ordinea relativa a primelor 4 noduri: 1,2,3,4 | + | |
- | * $topsort = [1, 2, 3, 4, 5] $ | + | |
- | * $topsort = [1, 2, 3, 5, 4] $ | + | |
- | * $topsort = [1, 2, 5, 3, 4] $ | + | |
- | * $topsort = [1, 5, 2, 3, 4] $ | + | |
- | * $topsort = [5, 1, 2, 3, 4] $ | + | |
- | * cele date de ordinea relativa a primelor 4 noduri: (1,2,4,3) | + | |
- | * $topsort = [1, 2, 4, 3, 5] $ | + | |
- | * $topsort = [1, 2, 4, 5, 3] $ | + | |
- | * $topsort = [1, 2, 5, 4, 3] $ | + | |
- | * $topsort = [1, 5, 2, 4, 3] $ | + | |
- | * $topsort = [5, 1, 2, 4, 3] $ | + | |
- | </spoiler> | + | === Task-1: SCC === |
+ | Se dă un graf **orientat** cu **n** noduri și **m** arce. Să se găsească **componentele tare-conexe** folosind algoritmul lui **Tarjan**. Secțiunea de teorie conține exemple grafice explicate. | ||
+ | <note warning> | ||
+ | Restricții și precizări: | ||
+ | * $ n <= 10^5 $ | ||
+ | * $ m <= 2 * 10^5 $ | ||
+ | * timp de execuție | ||
+ | * C++: 1s | ||
+ | * Java: 4s | ||
+ | </note> | ||
- | <spoiler Exemplu 2> | ||
- | $n = 9$ $m = 8$ | ||
- | $arce: { | + | === Task-2: CV === |
- | (1,2); | + | Se dă un graf **neorientat conex** cu **n** noduri și **m** muchii. Se cere să se găsească toate **punctele critice** folosind algoritmul lui **Tarjan**. Secțiunea de teorie conține exemple grafice explicate. |
- | (1,3); | + | |
- | (3,4); | + | |
- | (3,5); | + | |
- | (5,9); | + | |
- | (4,6); | + | |
- | (4,7); | + | |
- | (4,8); | + | |
- | } $ | + | |
+ | <note warning> | ||
+ | Restricții și precizări: | ||
+ | * $ n <= 10^5 $ | ||
+ | * $ m <= 2 * 10^5 $ | ||
+ | * timp de execuție | ||
+ | * C++: 1s | ||
+ | * Java: 4s | ||
+ | </note> | ||
- | Răspuns: $topsort = [1, 2, 3, 4, 6, 7, 8, 5, 9] $ | ||
- | Explicație: | + | === Task-3: CE === |
- | Graful dat este cel din figura următoare. | + | Se dă un graf **neorientat conex** cu **n** noduri și **m** muchii. Se cere să se găsească toate **muchiile critice** folosind algoritmul lui **Tarjan**. Secțiunea de teorie conține exemple grafice explicate. |
- | {{pa:new_pa:lab07-topsort-example2.png}} | + | <note warning> |
+ | Restricții și precizări: | ||
+ | * $ n <= 10^5 $ | ||
+ | * $ m <= 2 * 10^5 $ | ||
+ | * timp de execuție | ||
+ | * C++: 1s | ||
+ | * Java: 4s | ||
+ | </note> | ||
- | Se observă din desen că soluția menționată este validă. | + | === Task-4: BCC === |
- | </spoiler> | + | Se dă un graf **neorientat conex** cu **n** noduri și **m** muchii. Se cere să se găsească toate **componentele biconexe** folosind algoritmul lui **Tarjan**. Secțiunea de teorie conține exemple grafice explicate. |
- | === BONUS === | + | <note warning> |
- | **B1** Determinați componentele conexe ale unui graf neorientat. Puteți testa implementarea pe infoarena la problema [[https://infoarena.ro/problema/dfs| dfs]]. | + | Restricții și precizări: |
- | + | * $ n <= 10^5 $ | |
- | **B2** Rezolvați problema [[https://infoarena.ro/problema/muzeu| muzeu]] pe infoarena. | + | * $ m <= 2 * 10^5 $ |
+ | * timp de execuție | ||
+ | * C++: 1s | ||
+ | * Java: 4s | ||
+ | </note> | ||
=== Extra === | === Extra === | ||
- | + | <spoiler rețele> | |
- | <spoiler arbore3> | + | Rezolvați problema [[https://infoarena.ro/problema/retele| retele]] pe infoarena. |
- | Rezolvați problema [[https://infoarena.ro/problema/arbore3 | + | |
- | | arbore3]] pe infoarena. | + | |
</spoiler> | </spoiler> | ||
- | <spoiler Pokemon GO AWAY> | + | <spoiler clepsidra> |
- | Rezolvați problema [[https://www.hackerrank.com/contests/test-practic-pa-2017-v2-meeseeks/challenges/test-2-pokemon-go-away-grea| Pokemon GO AWAY]] de la test PA 2017. | + | Rezolvați problema [[https://infoarena.ro/problema/clepsidra| clepsidra]] pe infoarena. |
- | + | ||
- | Cu ce problemă seamana? | + | |
</spoiler> | </spoiler> | ||
- | <spoiler insule> | ||
- | Rezolvați problema [[https://infoarena.ro/problema/insule | ||
- | | insule]] pe infoarena. | ||
- | </spoiler> | ||
- | <spoiler tsunami> | + | <spoiler Course schedule> |
- | Rezolvați problema [[https://infoarena.ro/problema/tsunami | + | Rezolvați problema [[https://leetcode.com/problems/course-schedule/description/| course-schedule]] pe leetcode. |
- | | tsunami]] pe infoarena. | + | (aplicație tipuri de muchii) |
</spoiler> | </spoiler> | ||
- | |||
- | |||
- | <spoiler berarii2> | ||
- | Rezolvați problema [[https://infoarena.ro/problema/berarii2 | ||
- | | berarii2]] pe infoarena. | ||
- | </spoiler> | ||
- | |||
- | |||
- | |||
===== Referințe ===== | ===== Referințe ===== | ||
Line 550: | Line 523: | ||
[0] Chapter **Elementary Graph Algorithms**, “Introduction to Algorithms”, Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest and Clifford Stein | [0] Chapter **Elementary Graph Algorithms**, “Introduction to Algorithms”, Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest and Clifford Stein | ||
- | [1] [[https://en.wikipedia.org/wiki/Breadth-first_search]] | + | [1] [[https://en.wikipedia.org/wiki/Tarjan%27s_strongly_connected_components_algorithm]] |
- | [2] [[https://en.wikipedia.org/wiki/Depth-first_search]] | + | [2] [[https://en.wikipedia.org/wiki/Biconnected_component]] |
- | [3] [[https://en.wikipedia.org/wiki/Topological_sorting]] | + | [3] "Depth-first search and linear graph algorithms", R.Tarjan |
+ | [4] [[https://en.wikipedia.org/wiki/Kosaraju%27s_algorithm]] |