Laborator 05: Backtracking și optimizări

Obiective laborator

Înțelegerea noțiunilor de bază legate de backtracking și optimizările aferente;
Conștientizarea necesității îmbunătățirii versiunii simple de backtracking și beneficiile fiecărei abordări în parte;
Familiarizarea atât cu problema satisfacerii constrângerilor, cât și cu metode prospective, euristici.

Importanţă – aplicaţii practice

Răspunsul general și imediat: orice problemă care presupune o căutare în spațiul stărilor. De asemenea, majoritatea problemelor din Inteligență Artificială pot fi reduse la problema satisfacerii constrângerilor, iar metodele prospective, respectiv euristicile pot fi aplicate într-o multitudine de probleme, fiind în general valabile.

Descrierea problemei și a rezolvărilor

Pornind de la strategiile clasice de parcurgere a spațiului de stări, algoritmii de tip backtracking practic enumeră un set de candidați parțiali, care, după completarea definitivă, pot deveni soluții potențiale ale problemei inițiale. Exact ca strategiile de parcurgere în lățime/adâncime și backtracking-ul are la bază expandarea unui nod curent, iar determinarea soluției se face într-o manieră incrementală. Prin natura sa, bkt-ul este recursiv, iar în arborele expandat top-down se aplică operații de tipul pruning (tăiere) dacă soluția parțială nu este validă.

Notațiile utilizate sunt următoarele:

X₁, …, X_N variabilele problemei, N fiind numărul de variabile ale problemei;
D₁, …, D_N domeniile aferente fiecărei variabile;
U - întreg care reprezintă indicele variabilei curent selectate pentru a i se atribui o valoare;
F - vector indexat după indicii variabilelor, în care sunt memorate selecțiile de valori făcute de la prima variabila și până la variabila curentă

Reprezentarea grafică a unei relații pentru două variabile X₁ și X₂ cu domeniul {a, b, c} este următoarea:

O versiune generică a algoritmului de tip backtracking recursiv poate fi următoarea:

BKT (U, F)
if U == N // dacă am determinat o soluție completă
	Afișează valorile din vectorul F
	return
foreach V of XU
	F[U] ← V
	if Verifica (U,F) == true then
		BKT(U+1, F)
 
Verifică (U,F)
	test = true
	I ← U - 1
	while I > 0
		test = Relație(I, F[I], U, F[U]) 
		I = I - 1
		if test == false
			then break
	return test

Complexitatea algoritmului: complexitatea temporală este de O(B^d), iar cea spațială O(d), unde B este factor de ramificare (numărul mediu de stări posibil ulterioare în care nodul curent poate fi expandat) și d este adâncimea soluției.

Pornind de la versiunea inițială de BKT, putem aduce o serie de îmbunătățiri în următoarele direcții:

Algoritmi de îmbunătățire a consistenței reprezentării care vizează consistența locală a arcelor sau a căilor în graful de restricții
Utilizarea euristicilor în vederea optimizării numărului de teste prin luarea în considerare a următoarelor scenarii:
- Ordonarea variabilelor
- Ordonarea valorilor
- Ordonarea testelor
Algoritmi hibrizi care îmbunătățesc performanțele rezolvării prin reducerea numărului de teste; aici putem identifica următoarele subcategorii:
- Tehnici prospective:
  - Căutare cu predicție completă
  - Căutare cu predicție parțială
  - Căutare cu verificare predictivă
- Tehnici retrospective:
  - Backtracking cu salt
  - Backtracking cu marcare

Dintre metodele enumerate mai sus ne vom concentra asupra CSP (Constraint Satisfaction Problem) cu îmbunătățirea aferentă a consistenței reprezentării și asupra tehnicilor prospective, existând în cazul ambelor o îmbunătățire sesizabilă la nivelul apelurilor recursive / al expandărilor efectuate / al intrărilor în stivă.

Problema satisfacerii constrângerilor

Problema satisfacerii restricțiilor, în formularea cea mai generală, presupune existența unei mulțimi de variabile, unor domenii de valori potențiale pentru fiecare variabilă și o multime de restricții care specifică combinațiile de valori acceptabile ale variabilelor (exact conceptul de relații definite anterior, cu tot cu restricțiile aferente). Scopul final îl reprezintă determinarea unei atribuiri de valori pentru fiecare variabila astfel încât toate restrictiile să fie satisfăcute.

Problema satisfacerii restrictiilor este, în cazul general, o problema grea, deci NP-completă, exponențială în raport cu numărul de variabile ale problemei. Din perspectiva strategiilor de căutare într-un spațiu de stări, traducerea problemei ar fi următoarea: pornind din starea inițială a procesului care conține restricțiile identificate în descrierea inițială a problemei, se dorește atingerea unei stări finale care a fost restricționată “suficient” pentru a rezolva problema.

Pornind de la premisa că CSP este o problema de căutare din clasa problemelor NP, aspectul de interes al optimizării curente devine reducerea cât mai puternică a timpului / spațiului de căutare.

Fiind o problemă de căutare, rezolvarea problemei satisfacerii restricțiilor poate fi facută aplicând una din tehnicile de căutare a soluției în spațiul stărilor. Astfel, cea mai utilizată strategie de rezolvare a problemei CSP este backtracking-ul, variantă simplificată a căutării neinformate în adâncime. Aceasta strategie este preferată datorită economiei de spațiu atinse raportat la strategia de căutare în adâncime - O(B*d) sau pe nivel – O (B^d). În fucție de particularizare și anume în funcție de necesitatea determinării unei soluții sau a tuturor soluțiilor, satisfacerea tuturor constrângerilor sau relaxarea unora, putem avea următoarele categorii:

CSP totală
CSP parțială
CSP binară – graf de restricții

Pentru noi, în cazul studiului de față, problemele de tipul CSP binare care pot fi reprezentate printr-un graf de restricții sunt de interes.

Un arc (X_i, X_j) într-un graf de restricții orientat se numeste arc-consistent dacă și numai dacă pentru orice valoare x ∈ D_i, domeniul variabilei X_i, există o valoare y ∈ D_j, domeniul variabilei X_j, astfel incat R_i,j(x,y). Graful de restrictii orientat rezultat se numește arc-consistent.

O cale de lungime m prin nodurile i₀,…,i_m ale unui graf de restricții orientat se numeste m-cale-consistentă dacă și numai dacă pentru orice valoare x ∈ D_i0, domeniul variabilei i₀ și o valoare y ∈ D_im, domeniul variabilei i_m, pentru care R_i0,im(x,y), există o secvență de valori z₁ ∈ D_{i1 … zm-1} ∈ D_im-1 astfel încât R_i0,i1(x,z₁), …, R_im-1,im(z_m-1,y). Graful de restrictii orientat rezultat se numește m-arc-consistent.

Arc-consistența unui graf de restricții se verifica folosind următorii algoritmi:

Verifică (Xk, Xm)
	delete = false
	foreach x ∈ Dk
		if nu există nici o valoare y ∈ Dm astfel încât Rk,m(x,y) 
			elimină x din Dk 
			delete = true
	return delete
 
AC-1:
 
Crează Q ← { (Xi, Xj) | (Xi, Xj) ∈ Mulțime arce, i≠j} 
repeat
	modificat = false
	foreach (Xi, Xj) ∈ Q
		modificat = modificat or Verifică(Xi, Xj)
until modificat==false
 
AC-3:
 
Crează Q ← { (Xi, Xj) | (Xi, Xj) ∈ Multime arce, i≠j} 
while Q nu este vida
	Elimină din Q un arc (Xk, Xm)
	if Verifică(Xk, Xm)then
		Q ← Q ∪ { (Xi, Xk) | (Xi, Xk) ∈ Multime arce, i≠k,m}

Pornind de la următoarele notații:

N - numărul de variabile;
a - cardinalitatea maximă a domeniilor de valori ale variabilelor;
e - numărul de restricții.

complexitățile algoritmilor precedenți sunt următoarele:

Algoritmului de realizare a arc-consistentei - AC-1 are în cazul cel mai defavorabil complexitatea O(a²*N*e)
Algoritmului de realizare a arc-consistentei - AC-3: complexitate timp este O(e*a³); complexitate spatiu: O(e+N*a)
Algoritmului de realizare a arc-consistentei - AC-4 care presupune o îmbunătățire a complexității în timp: O(e*a²)
Algoritmul de realizare a 2-cale-consistentei - PC-4: complexitate timp O(N³*a³)

Euristici

Ordonarea variabilelor urmărește reordonarea variabilelor legate prin restricții explicite (specificate de mulțimea de restricții definită în problemă) astfel încât numărul de operații ulterioare să fie minim. Astfel sunt preferate mai întâi variabilele care apar într-un număr mare de restricții și au domenii de valori cu cardinalitate mică.

Ordonarea valorilor pleacă de la premisa că nu toate valorile din domeniul variabilelor apar în toate restricțiile. Și în acest caz sunt preferate mai întâi variabilele cele mai restricționate, cu cele mai puține atribuiri posibile.

Ordonarea testelor presupune începerea cu variabila precedentă cea mai restricționată.

Tehnici prospective

Principiul este simplu: fiecare pas spre soluție nu trebuie să ducă la blocare. Astfel, la fiecare atribuire a variabilei curente cu o valoare corespunzătoare, toate variabilele sunt verificate pentru a depista eventuale condiții de blocare. Anumite valori ale variabilelor neinstanțiate pot fi eliminate deoarece nu vor putea să facă parte din soluție niciodată. Următorii algoritmi analizați implementează strategia de căutare neinformată cu realizarea unor grade diferite de k-consistență.

Backtracking cu predicție completă

Predicție(U, F, D)
foreach L of D[U]
F[U] ← L
if U < N then
	DNEW ← Verifică_Inainte (U, L, D)
	if DNEW != null
		then DNEW  ← Verifica _Viitoare (U, DNEW)
	if DNEW != null
		then Predictie (U+1, F, DNEW)
 
Verifica_Înainte (U, L, D)
inițializează DNEW
for U2 = U+1..N
	foreach L2 of D[U2]
		if Relatie(U, L, U2, L2) == true 
			then introduce L2 in DNEW[U2]
	daca DNEW[U2] vidă
		atunci return null
return DNEW
 
Verifica_Viitoare (U, DNEW)
for U1 = U+1..N
	foreach L1 of DNEW[U1]
		for U2 = U+1..N
			foreach L2 of DNEW[U2]
				if Relatie (U1, L1, U2, L2) == true
				then break L2
			if nu s-a gasit o valoare consistenta pentru U2 then
				elimina L1 din DNEW[U1]
				break U2
	if DNEW[U1] vidă then return null
return DNEW

Backtracking-ul cu predictie parțială presupune modificarea doar a funcției Verifică_Viitoare din prisma domeniului de vizibilitate a variabilei U₂ care acum variază exclusiv de la U₁+1, nu direct de la U+1. Rezultatul imediat este înjumătățirea numărului de operații efectuate la nivelul funcției.

Verifica_Viitoare (U, DNEW)
…
for U1 = U+1..N
	foreach L1 of DNEW[U1]
		for U2 = U1+1..N
			foreach L2 of DNEW[U2]
				…

Backtracking-ul cu verificare predictivă elimină apelul Verifica_Viitoare(U, DNEW) complet din funcția de Predicție

Predicție(U, F, D)
…
		DNEW ← Verifică_Inainte (U, D[U], D)
		// if DNEW != null
		//	then DNEW  ← Verifica _Viitoare (U, DNEW)
		if DNEW != null
			…

Discuția care se ridică imediat este care dintre cele 3 metode este mai eficientă? Părerile sunt împărțite în sensul că uneori costul rafinărilor ulterioare poate fi mai mare decât costul expandării efective a nodului curent, dar totodată se poate obține o reducere semnificativă a numărului de apeluri recursive prin eliminarea unor soluții neviabile. Certitudinea este că oricare dintre aceste metode reduce corespunzător numărul de intrări în stivă, dar trebuie luat în considerare în funcție de specificul problemei și costul operației de Verifica_Viitoare.

Un aspect important este că toate cele trei variante de tehnici prospective pot fi îmbunatatite prin introducerea de euristicii, lucru echivalent cu o reordonare dinamică a variabilelor la fiecare avans în căutare. Experimental, s-a dovedit că introducerea acestor euristici (ex. selecția următoarei variabile urmărind ca aceasta să aibă cele mai puține valori rămase în domeniul propriu) furnizează rezultate foarte bune.

Concluzii și observații

Metodele descrise pot fi aplicate pe o plajă largă de probleme, iar optimizările prezentate pot duce la scăderi drastice ai timpilor de execuție. Combinarea anumitor metode, precum tehnici prospective cu euristici duce la rezultate și mai bune, demonstrate în practică. Astfel, majoritatea problemelor care presupun parcurgeri în spațiul stărilor pot fi abordate pornind de la unul dintre algoritmii descriși.

Sudoku

La finalul laboratorului, încărcați soluțiile aici.

Jocul clasic rezolvat prin BKT la nivelul căruia aplicăm diverse optimizări este Sudoku. Astfel, avem o matrice 9 X 9 subdivizată în 9 sub-matrici identice de dimensiuni 3 X 3, denumite regiuni.

Regula jocului este simplă: fiecare rând, coloană sau regiune nu trebuie să conţină decât o dată cifrele de la unu la nouă. Formulat altfel, fiecare ansamblu trebuie să conţină cifrele de la unu la nouă o singură dată.

1. Backtracking

Să se rezolve problema folosind tehnica backtracking.

2. Backtracking şi o metodă prospectivă (preferabil predictie parțială sau completă)

3. Euristică

Modificați codul anterior: implementați o euristică la alegere și explicați efectele acesteia asupra timpului de execuție și a numarului de intrări în recursivitate.

Pentru fiecare solutie anterioară se va analiza impactul la nivelul timpului total de execuție (care pot fi influențați și de alte procese din sistemul de operare, respectiv alocări și procese interne ale JVM, etc.), precum și al numărului de intrări în recursivitate.

Referințe

[1] Curs BLIA, Prof. Ing. Adina Magda Florea

[2] Introducere in Algoritmi, Thomas H. Cormen; Charles E. Leiserson, Ronald R. Rivest, Cliff Stein (1990)

[3] The Art of Computer Programming, Donald E. Knuth (1968)

[4] CSP Tutorial http://4c.ucc.ie/web/outreach/tutorial.html

[5] The Complexity of Some Polynomial Network Consitency Algorithms for Constraint Satisfaction Problems disponibil la http://cse.unl.edu/~choueiry/Documents/AC-MackworthFreuder.pdf

[6] http://en.wikipedia.org/wiki/Backtracking

[7] http://en.wikipedia.org/wiki/Constraint_satisfaction_problem