Laboratorul 8: Drumuri de cost minim
1. Obiectivele laboratorului
Înțelegerea ideii de cost și de drum minim într-un graf
Prezentarea algoritmilor care calculează drumul de cost minim
Înțelegerea aplicațiilor practice prezente în:
2. Considerente teoretice
2.1 Costul unei muchii
La fel ca la arbori de acoperire, presupunem că fiecare muchie are un cost de parcurgere.
2.2 Costul unui drum; drumul de cost minim
Într-un graf, orice drum este definit de o succesiune de muchii (cu proprietatea că, pentru oricare două muchii consecutive din succesiune, nodul destinaţie/de sosire al primei muchii este acelaşi cu nodul sursa/de plecare al celei de-a doua muchii).
Costul unui drum va fi definit ca suma costurilor muchiilor ce compun acel drum.
Fie un nod sursă (S) şi un nod destinaţie (D). Pot exista mai multe drumuri de la S la D (drumuri care au S = primul nod, D = ultimul nod), iar drumul de cost minim de la S la D va fi cel mai ieftin (cu costul cel mai mic) dintre acestea.
Pot exista mai multe drumuri de cost minim de la S la D.
2.3 Legătura muchii-arce
Orice graf neorientat este echivalent cu un graf orientat dacă înlocuim fiecare muchie cu două arce(de acelaşi cost, câte un arc pentru fiecare sens). Algoritmii următori pot fi folosiţi (în limita observaţiilor finale) pe grafuri orientate la fel ca pe grafuri neorientate.
3. Drumul de cost minim cu sursă unică
Următorii algoritmi caută drumurile de cost minim de la un singur nod (sursă) la toate celelalte noduri. Rezultatul acestor algoritmi este un arbore cu drumuri de cost minim, unde:
nodul sursă (S) este rădăcina arborelui;
toate nodurile din graf sunt în arbore;
pentru orice nod destinaţie (D), costul drumului din arbore de la rădăcina S la D este drum de cost minim (de la S la D) în graf.
3.1 Algoritmul lui Dijkstra
Algoritmul lui Dijkstra se bazează pe un principiu similar cu cel al algoritmului lui Prim:
iniţial, toate nodurile sunt neexplorate şi vom construi arborele, începând de la nodul S;
atribuim un posibil cost (o estimare a distanţei) pentru fiecare nod. (iniţial, S are costul 0, toate celelalte noduri au costul infinit);
la fiecare pas, alegem cel mai bun candidat dintre nodurile neexplorate, urmând să îl explorăm (să îi evaluăm vecinii), iar acel candidat va rămâne în arbore;
la fiecare explorare (evaluare a vecinilor), dacă găsim o nouă estimare de cost mai bună decât cea precedentă, folosim, mai departe, noua estimare. Dacă dorim să ţinem evidenţa muchiilor folosite, actualizăm şi nodul părinte al vecinului respectiv.
Diferenţa apare, în algoritmul lui Dijkstra, la funcţia folosită pentru estimarea costurilor, atunci când evaluăm vecinii unui nod:
Dacă C este nodul curent (pe care îl explorăm), atunci:
pentru fiecare nod vecin (V) al lui C, noul cost posibil va fi costul drumului S-V (de la S la V) care trece prin C, mai exact - suma dintre costul drumului S-C şi costul muchiei (C,V).
Construind astfel algoritmul, este garantat că, în momentul în care explorăm un nod (C), estimarea pentru costul drumului S-C este chiar costul minim.
Pentru grafuri orientate, ne referim la vecinii la care putem ajunge printr-un arc ce pleacă din C: (C,V).
Paşii algoritmului lui Dijkstra:
1. Declarăm două mulţimi:
mulţimea nodurilor neexplorate(MN), iniţial MN conţine toate nodurile;
mulţimea nodurilor explorate(ME) ce compun arborele, iniţial ME = vidă;
2. Atribuim fiecărui nod o estimare iniţială a costului:
0 pentru nodul sursă(S);
infinit pentru toate celelalte;
3. Cât timp există noduri în MN
1. Alegem, din MN(nodurile neexplorate), nodul cu cel mai mic cost estimat
îl numim C(nodul curent)
2. pentru fiecare din vecinii lui C care se află în MN
3. calculăm noua estimare de cost = cost(drumul S-C) + cost(muchia (C,V));
4. comparăm noua estimare cu vechiul cost(drumul S-V):
dacă noul cost e mai bun
1. actualizăm cost(drumul S-V) = noul cost;
2. actualizăm parinte(V) = C; (pentru păstrarea muchiei folosite)
altfel păstrăm vechiul cost
5. Marcăm nodul C ca explorat: îl eliminăm din MN şi îl adăugăm în ME.
(Nu va mai fi verificat)
3.2 Algoritmul Bellman-Ford
Principii similare pentru algoritmul Bellman-Ford:
vom construi arborele, începând de la nodul S;
atribuim un posibil cost (o estimare a distanţei) pentru fiecare nod. (iniţial, S are costul 0, toate celelalte noduri au costul infinit);
la fiecare evaluare, dacă găsim o nouă estimare de cost mai bună decât cea precedentă, folosim, mai departe, noua estimare. Dacă dorim să ţinem evidenţa muchiilor folosite, actualizăm şi nodul părinte.
funcţia de estimare a costului este definită la fel ca la algoritmul lui Dijkstra (costul drumului de la S la nodul respectiv)
Rezultatul algoritmului va fi un arbore cu N noduri (unde N = |V|, numărul de noduri din graf). Prin urmare, lungimea oricărui drum de la S la alt nod va fi maxim N-1. (Presupunem că nu se repetă muchii)
Diferenţa apare, în algoritmul Bellman-Ford, la alegerea nodurilor pentru care facem evaluarea:
Algoritmul nu are preferinţe pentru anumite noduri şi nu extrage, la fiecare pas, cel mai bun candidat.
În schimb, acest algoritm evaluează toate muchiile la un pas. Folosindu-se de principiul de mai sus, (N-1) astfel de paşi vor fi suficienţi.
În cazul grafurilor neorientate, evaluăm fiecare muchie în ambele sensuri.
Paşii algoritmului Bellman-Ford:
1. Atribuim fiecărui nod o estimare iniţială a costului:
0 pentru nodul sursă(S);
infinit pentru toate celelalte;
2. Executăm de N-1 ori:
1. Pentru fiecare pereche (u, v) a.i. există muchie de la u la v
1. calculăm noua estimare de cost = cost(drumul S-u) + cost(muchia (u,v));
2. comparăm noua estimare cu vechiul cost(drumul S-v):
dacă noul cost e mai bun
1. actualizăm cost(drumul S-v) = noul cost;
2. actualizăm parinte(v) = u; (pentru păstrarea muchiei folosite)
altfel păstrăm vechiul cost
4. Drumul de cost minim între oricare 2 noduri
Următorul algoritm caută cel mai scurt drum de la orice nod sursă (S) la fiecare nod destinaţie (D).
4.1. Algoritmul Floyd-Warshall
Rezultatul algoritmului este o matrice N x N (unde N = |V|, numărul de noduri), iar valorea din matrice de la poziţia [i][j] va fi costul minim pentru drumul i-j. Fie această matrice numită dist.
Pentru simplitate, algoritmul numerotează nodurile de la 1 la N şi foloseşte următoarea construcţie:
defineşte o funcţie costMinim(i,j,k) = cel mai ieftin drum care:
pleacă din i
ajunge în j
în afară de primul şi de ultimul nod, conţine numai noduri din {1,2,3,…,k}(primele k noduri).
Algoritmul calculează costMinim(i,j,k) pentru toate perechile (i,j,k), folosind formula: costMin(i,j,k+1) = min(costMin(i,j,k), costMin(i,k+1,k) + costMin(k+1,j,k));
Observaţii:
costMin(i,j,0) = costMuchie(i,j) (dacă există muchie de la i la j) sau infinit(altfel);
costMin(i,j,N) = drumul de cost minim de la i la j.
Paşii algoritmului Floyd-Warshall:
1. Declarăm matricile:
dist, matrice N x N şi o iniţializăm dist[i][j] = infinit, pentru orice i şi j
next, matrice N x N în care vom salva prima muchie din drumul i-j de cost minim
//next este necesar doar în cazul în care ne interesează muchiile folosite
//pasul k = 0
2. Pentru fiecare nod v
1. dist[v][v] = 0;
3. Pentru fiecare pereche (u,v) a.i. există muchie de la u la v
1. dist[u][v] = costMuchie(u,v);
2. next[u][v] = v; //pentru urmărirea muchiilor ce compun drumul
//am terminat pasul k = 0
4. Pentru fiecare pas k (de la 1 la N)
1. Pentru fiecare nod i (de la 1 la N)
1. Pentru fiecare nod j (de la 1 la N)
1. calculăm costul nou = dist[i][k] + dist[k][j];
2. comparăm costul nou cu costul vechi = dist[i][j]
dacă e mai bun costul nou:
1. dist[i][j] = costul nou;
2. next[i][j] = next[i][k]; //pentru urmărirea muchiilor
altfel păstrăm costul vechi
Pentru obţinerea nodurilor ce formează drumul de cost minim de la u la v, putem folosi următoarea secvenţă:
funcţie afişareDrum(u, v)
1. dacă u == v
1. print(v); STOP
2. print(u);
3. afişareDrum(next[u][v], v);
5. Observaţii finale
Cei 3 algoritmi funcţionează bine atunci când toate muchiile au cost pozitiv.
Drumul de cost minim NU este bine definit atunci când există cicluri cu cost negativ.
putem ajunge de la un nod la acelaşi nod, folosind acelaşi ciclu de oricâte ori ⇒ costMinim = -infinit);
în aceste cazuri, nu putem pune problema găsirii drumurilor de cost minim.
O muchie cu cost negativ este echivalentă cu 2 arce cu cost negativ şi implică existenţa unui ciclu cu cost negativ.
Algoritmii Bellman-Ford şi Floyd-Warshall pot detecta dacă un graf conţine cicluri cu cost negativ:
Bellman-Ford: executăm încă o evaluare a tuturor muchiilor la final. Dacă găsim cel puţin o estimare nouă mai buna, graful conţine măcar un ciclu cu cost negativ.
Floyd-Warshall: putem verifica, la fiecare pas, dacă avem o valoare negativă pe diagonala matricei dist. Dacă găsim cel puţin o valoare negativă, graful conţine măcar un ciclu cu cost negativ.
Pentru algoritmul lui Dijkstra, „garanţia“ se pierde când există chiar şi un singur arc cu cost negativ.
Algoritmul se bazează pe ideea că, odată explorat un nod, drumul de cost minim până la acel nod a fost găsit, ceea ce NU este mereu corect în prezenţa unui arc cu cost negativ.
De aceea, algoritmul poate produce răspunsuri greşite în acest caz.
În schimb, algoritmii Bellman-Ford şi Floyd-Warshall funcţionează pe grafurile cu arce cu cost negativ, atâta timp cât drumurile de cost minim sunt bine definite (fără cicluri cu cost negativ).
6. Exerciții laborator
Folosiți datele din fișierul trains_with_km.zip.
Citiți datele din arhiva atașată.
Creați un graf neorientat și altul orientat din fișerele atașate. Creați matricea de adiancență și separat graful de costuri. La punctele următoare folosiți graful neorientat.
Găsiți stațiile consecutive care au distanța minimă/maximă între ele. (rezultatele în fișierele min.txt și max.txt)
Câți km de cale ferată există în baza noastră de date? (rezultatele în fișierul total.txt)
Calculați drumul de cost minim de la București la orașul vostru natal. (rezultatele în fișierul ruta.txt)
Găsiți stația (nodul) cea mai departe de București și drumul. (rezultatele în fișierul departe.txt)
Găsiți toate drumurile de la București la Oradea. (rezultatele în fișierul bucuresti_oradea.txt)
Găsiți cele două stații din graf care sunt la distanța maximă (pe drumul de cost minim). (rezultatele în fișierul drum_lung.txt)
7. Probleme opționale, de interviu
Îmbunătățiți algoritmul lui Dijkstra folosind min-heap.
Se dă un graf pentru care se cunoaşte drumul de cost minim de la un nod sursă (S) la un nod destinaţie (D). Dacă adăugăm 100 la costul fiecărei muchii, se modifică drumul de cost minim? (dacă da, daţi un exemplu; dacă nu, explicaţi de ce).
Aceeaşi întrebare dacă înmulţim fiecare cost cu 100.
Cum găsiţi (mai rapid decât cu cei 3 algoritmi prezentaţi) drumul de cost minim de la S la D într-un graf în care toate muchiile au acelaşi cost(1)? Cum adaptaţi soluţia în cazul în care toate muchiile au costul 1 sau 2?
Daţi un exemplu în care folosirea algoritmului lui Dijkstra (pentru a obţine drumul de cost minim pentru toate perechile de noduri) ar fi mai rapidă decât algoritmul Floyd-Warshall.
8. Referințe