Tema 1 PP 2023

DEADLINE 7 aprilie

Temele trebuie submise pe curs.upb.ro, in assignment-ul numit Tema 1.
Temele ce nu sunt acceptate de validatorul de arhive NU vor fi puncate.
Va sugeram ca dupa ce ati incarcat o arhiva, sa o descarcati si sa o testati cu validatorul de arhive.

În cadrul acestei teme veți lucra cu fișiere imagine, mai exact cu formatul PPM din pachetul Netpbm. Le veți primi sub formă de listă de charactere.

Folosiți un stil de programare funcțional. NU se vor accepta:

Efecte laterale (de exemplu modificarea parametrilor dați ca input la funcție)
var (val este ok!)

Scheletul se poate găsi la: tema1_2023_pp-skel.zip

Validatorul de arhive se poate găsi la: archive_validator_hw1.zip
Formatul arhivelor este:

util: Util.scala, Pixel.scala
Solution.scala
ID.txt - acest fisier va contine o singura linie, formata din ID-ul unic al fiecarui student

Numele arhivelor trebuie sa fie de forma <Nume>_<Prenume>_<Grupa>_T1.zip (daca aveti mai multe prenume sau nume, le puteti separa prin '-')

Exemplu fișier PPM (cu explicații)

P3                        (este mereu așa, format PPM din NetPBM)
3 2                       (lungimea și înălțimea imaginii)
255                       (culoarea maximă care va fi mereu 255)
255 0 0                   (primul pixel de pe prima linie este rosu)
0 255 0                   (al doilea pixel de pe prima linie este verde)
0 0 255                   (al treilea pixel de pe prima linie este albastru)
255 255 0                 (primul pixel de pe a doua linie este galben)
255 255 255               (al doilea pixel este alb)
0 0 0                     (al treilea pixel este negru)

Vizualizare:

	Coloana 1	Coloana 2	Coloana 3
Linia 1	roșu	verde	albastru
Linia 2	galben	alb	negru

Primele 3 linii vor fi mereu aproape la fel, formatul P3 pe prima linie, lungimea și înălțimea pe a doua, culoarea maximă pe a treia, care va fi mereu 255. Apoi fiecare pixel va fi pe o linie, mai intâi valoarea de roșu (de la 0 la 255) apoi verde și albastru, urmat direct de un \n.

La ieșirea voastră va fi un singur format, la fel ca în exemplu (după valoarea albastru a culorii va fi mereu \n, fără spații în plus).

Nu schimbați funcțiile din scheletul de cod. Puteți, însă, adăuga oricâte în plus.

Pentru a vedea ușor imaginea generată de voi, puteți folosi https://0xc0de.fr/webppm/

Pentru a reprezenta imaginea, se va folosi tipul Image definit mai jos:

type Image = List[List[Pixel]]
type GrayscaleImage = List[List[Double]]

unde Pixel este o clasă in care se rețin valorile celor 3 culori (roșu, verde, albastru) sub forma de Integer. Clasa Pixel se găsește in folderul util din schelet.

1. Alăturare de imagini pe verticală (10p)

Se dau două imagini de aceeași lungime. Să se alăture vertical astfel încât prima imagine să fie sus și a doua jos.

Exemplu

Dacă prima imagine arată așa:

P1 P2
P3 P4

și a doua așa:

D1 D2

Alăturarea lor pe verticală ar fi așa:

P1 P2
P3 P4
D1 D2

Se va completa pentru asta funcția

def verticalConcat(image1: Image, image2: Image): Image = ???

2. Alăturare de imagini pe orizontală (5p)

Se dau două imagini de aceeași înălțime. Să se alăture orizontal astfel încât prima imagine să fie în stânga și a doua în dreapta.

Exemplu

Dacă prima imagine arată așa:

P1 P2 P3
P4 P5 P6

și a doua așa:

D1
D2

Alăturarea lor pe orizontală ar fi așa:

P1 P2 P3 D1
P4 P5 P6 D2

Se va completa pentru asta funcția

def horizontalConcat(image1: Image, image2: Image): Image = ???

3. Rotire de imagini (5p)

La această cerință se va implementa o rotație în sens trigonometric cu multipli de 90 de grade (90, 180, …).

Exemplu

Pentru o matrice

P1 P2
P3 P4

dacă o rotim în sens trigonometric cu 90 de grade, vom avea:

P2 P4
P1 P3

Se va completa pentru asta funcția

def rotate(image: Image, degrees: Integer): Image = ???

4. Detectare de muchii cu detectorul Sobel (40p)

O operatie care apare destul de des in procesarea imaginilor este detectia obiectelor, iar o parte importanta din acest proces complex este detectia frontierelor (marginilor) obiectelor. Un algoritm simplu pentru detectia frontierelor este detectorul/operatorul Sobel.

Acesta se bazeaza pe conceptul de convolutie, care este folosit extrem de des in prelucrarea imaginilor. Convolutia reprezinta o transformare a imaginii in care fiecare pixel din imaginea noua este obtinut prin insumarea valorilor ponderate ale unui pixel si ale vecinilor lui. Ponderile cu care se inmultesc fiecare dintre vecinii pixelului sunt reprezentate de obicei ca o matrice numita nucleu sau kernel de convolutie. Variind kernelul, putem obtine diverse efecte asupra imaginii.

Presupunem ca vrem sa aplicam detectia frontierelor pe aceasta imagine:

imagine originala

Pași detectorului Sobel sunt următorii:

1. Se va aplica funcția grayscale

 def toGrayScale(pixel: Pixel) : Double = ???

din Util pe fiecare pixel (detectorul functioneaza doar pe imagini alb-negru)

imagine alb-negru

2. Se va aplica un blur gaussian prin convolutie cu kernelul:

Kernel pentru blur gaussian

$\begin{matrix} \frac{1}{273} & \frac{4}{273} & \frac{7}{273} & \frac{4}{273} & \frac{1}{273} \\
\frac{4}{273} & \frac{16}{273} & \frac{26}{273} & \frac{16}{273} & \frac{4}{273} \\
\frac{7}{273} & \frac{26}{273} & \frac{41}{273} & \frac{26}{273} & \frac{7}{273} \\
\frac{4}{273} & \frac{16}{273} & \frac{26}{273} & \frac{16}{273} & \frac{4}{273} \\
\frac{1}{273} & \frac{4}{273} & \frac{7}{273} & \frac{4}{273} & \frac{1}{273} \end{matrix} $

Cod Scala pentru Kernel

val gaussianBlurKernel: GrayscaleImage = List[List[Double]](
    List( 1, 4, 7, 4, 1),
    List( 4,16,26,16, 4),
    List( 7,26,41,26, 7),
    List( 4,16,26,16, 4),
    List( 1, 4, 7, 4, 1)
  ).map(_.map(_ / 273))

(acest pas nu face parte din detector propriu-zis, dar are rolul de a elimina zgomotul din imagine, care ar fi foarte vizibil in rezultat)

imagine blurred

3. Se vor aplica apoi, prin convolutie, kernelurile Gx și Gy pentru a genera Mx și My

Gx

val Gx : GrayscaleImage = List(
  List(-1, 0, 1),
  List(-2, 0, 2),
  List(-1, 0, 1)
)

Gy

val Gy : GrayscaleImage = List(
  List( 1, 2, 1),
  List( 0, 0, 0),
  List(-1,-2,-1)
)

(acestea detecteaza variatii bruste ale intensitatii pe orizontala si, respectiv, pe veriticala)

Mx

pixelii cu valori negative sunt reprezentati cu rosu, iar cei cu valori pozitive, cu albastru

My

pixelii cu valori negative sunt reprezentati cu rosu, cei cu valori pozitive, cu albastru

Pentru pasii 2 si 3, se va implementa functia

def applyConvolution(image: GrayscaleImage, kernel: GrayscaleImage) : GrayscaleImage = ???

4. Se vor combina Mx și My, adunându-se (element cu element) fiecare pixel în modul (astfel, obtinem o aproximare destul de buna a schimbarii de intensitate in jurul fiecarui pixel)

'imagine' combinata

5. Se va pune un prag (threshold) T, astfel încât fiecare pixel cu o valoare mai mica decat T va fi negru (rgb 0 0 0) și fiecare pixel deasupra T va fi alb (rgb 255 255 255)

rezultat final

Se va completa pentru asta funcția

def edgeDetection(image: Image, threshold : Double): Image = ???

Hint: la acest exercitiu este indicat sa folositi functia getNeighbors din fisierul Util.scala

5. Triunghi pascal cu resturi - colorare (40p)

Triunghiul lui Pascal este o reprezentare 2-dimensionala a unor valori care apar in foarte multe aplicatii de combinatorica dar si algebra. Triunghiul lui Pascal cu 5 linii este ilustrat mai jos:

Cea mai simpla modalitate de a descrie o linie l din triunghiul lui Pascal este urmatoarea: primul element $ l_0$ (si ultimul) este intotdeauna 1;
Pentru restul elementelor din triunghi, se foloseste recurenta $ i > 0$ , $ l_i = lp_{i-1} + lp_{i}$ , unde $ l$ este linia curenta, si $ lp$ este linia precedenta.
Cu puțină atentie, observam ca o valoare de pe linia n si coloana k este $ C_n^k$ (combinari de $ n$ luate cate $ k$ ), si atunci relatia de mai sus devine: $ C_n^k = C_{n-1}^k + C_{n-1}^{k-1} $. Preferam in general sa implementam calculul $ C_n^k$ folosind aceasta relatie de recurenta, pentru ca este mai eficientă din punct de vedere al complexității temporale față de formula cu factoriale.
Asadar, triunghiul lui Pascal este format pe fiecare linie din $ C_n^0 C_n^1 \ldots C_n^n $ unde n este numărul liniei ( $ n \ge 0 $).

Triunghiul lui Pascal size = 5 ; reprezentare ca matrice

In cele ce urmeaza, nu vom construi triunghiul lui Pascal cu valori absolute, ca mai sus, ci in locul fiecarei valori $ l_i$ vom construi valoarea $ l_i \% M$ . Deoarece numerele apărute in recurența mentionata anterior cresc foarte rapid, ar putea aparea un overflow la adunare, ducand la rezultate eronate. Asadar, pentru a obtine valoarea $ l_i % M$ , vom folosi tot relatia de recurenta anterioara: $ Cmodulo_n^k = (Cmodulo_{n-1}^k + Cmodulo_{n-1}^{k-1}) \% M $. Observati ca $ Cmodulo_n^k = C_n^k \% M = (C_{n-1}^k + C_{n-1}^{k-1}) \% M = (C_{n-1}^k \% M + C_{n-1}^{k-1} \% M) \% M = (Cmodulo_{n-1}^k + Cmodulo_{n-1}^{k-1}) \% M$ Formula recursivă ne ajută mai mult deoarece putem să aplicăm modulo la fiecare pas.

Triunghiul lui Pascal size = 5 ; M = 4

Prin triunghiul lui Pascal cu valori modulo se pot genera diferite șabloane (patterns), ale căror reprezentare grafică este influențată de modul de colorare al matricii rezultate. Vom folosi M pentru a stabili numarul de culori folosite in colorare. O culoare este, de fapt, un Pixel. Colorarea inseamna ca fiecarei valori din triunghiul modulo al lui Pascal i se asociaza un Pixel cu anumite valori (rosu, verde, albastru), valori ce urmeaza regula prezentata in functia pickColor. Tot ce este deasupra diagonalei principale va rămâne negru și nu se va aplica funcția!

def pickColor(i: Integer) : Pixel = {
  if (i == 0) Pixel(255, 0, 0)
  else if (i == 1) Pixel(0, 0, 255)
  else if (i == 2) Pixel(0, 255, 0)
  else if (i == 3) Pixel(255, 255, 255)
  else Pixel(0, 0, 0)
}

Triunghiul lui Pascal size = 5 ; M = 4 DUPA COLORARE

Se va completa pentru acest task functia:

def moduloPascal(M: Integer, // nr. de culori 
                 pickColor: Integer => Pixel, // functia de colorare
                 size: Integer // dimensiunea triunghiului (nr de linii) 
                 ): Image = ???

Sugestia de rezolvare ar fi generarea linie cu linie a triunghiului Pascal începând de la $ C_0^0 = 1 $ pe prima linie. Aceasta este o abordare de programare dinamică.

Nu folosiți formula combinăriilor cu factorial pentru acest exercițiu!

Triunghiul lui Pascal fiind infinit, va avea o marime limitata la $ size^2 $ (size > 2).