This shows you the differences between two versions of the page.
pr:labs:sd04 [2020/12/14 11:16] iulia.florea [Lucru Online] |
— (current) | ||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== Laborator 9 - Inferențe ====== | ||
- | |||
- | ==== Lucru Online ==== | ||
- | |||
- | <note important>Acest laborator este doar în varianta online. | ||
- | |||
- | Exercițiile se găsesc în Jupyter Notebook </note> | ||
- | |||
- | Colab google: [https://colab.research.google.com/drive/1YgbyMFTBI_b6TthqQI_D5Wg80RzBfJg6?usp=sharing] | ||
- | |||
- | Folosiți opțiunea File->Save a copy in Drive | ||
- | și apoi Runtime-> Run all | ||
- | |||
- | |||
- | Pentru trimiterea rezolvării folosiți butunoul Share din partea dreaptă sus. Apăsați pe "Get link" selectați ca oricine cu link-ul să fie viewer și folosiți opțiunea copy link și trimiteți linkul către asistent pe canalul de comunicare dorit de acesta. | ||
- | |||
- | |||
- | ===== Inferențe Bayesiene ===== | ||
- | |||
- | Inferența bayesiană este o metodă de inferență statistică în care teorema lui Bayes este utilizată pentru a actualiza probabilitatea unei ipoteze pe măsură ce devin disponibile mai multe dovezi sau informații. | ||
- | Definitia matematica a Teoremei lui Bayes | ||
- | |||
- | P(A|B) = P(B|A) * P(B) / P(A) | ||
- | |||
- | P(A|B) este probabilitatea ca evenimentul A sa se intample daca s-a intamplat evenimentul B | ||
- | |||
- | P(B|A) este probabilitatea ca evenimentul B sa se intample daca s-a intamplat evenimentul A | ||
- | |||
- | P(A) si P(B) sunt probabilitatile ca evenimentele A si B sa se intample | ||
- | Exemplu | ||
- | |||
- | Consideram ca se alege o carte dintr-un pachet cu 52 de carti. Stim ca jumatate dintre carti sunt rosii si cealalta jumatate sunt negre. Care este probabilitatea ca valoarea de pe o carte sa fie 4, daca stim ca e o carte rosie? | ||
- | |||
- | Pentru a transforma in simboluri matematice, putem spune: | ||
- | |||
- | A este evenimentul de a alege un 4 | ||
- | B este evenimentul de a alerge o carte rosie | ||
- | P(B|A) - probabilitatea de a alege o carte 4 care e rosie | ||
- | P(A|B) este P(4|rosie) | ||
- | |||
- | Calculand folosind teorema lui Bayes: | ||
- | |||
- | P(B|A) = P(rosie|4) = 1/2 P(A) = P(4) = 4/52 = 1/13 P(B) = P(rosie) = 1/2 | ||
- | |||
- | P(4|rosie) = P(rosie|4) * P(rosie) / P(4) = (1/2 * 1/13) / (1/2) = 1/13 | ||
- | Inferența Bayesiană | ||
- | |||
- | Să luăm un alt exemplu: Care e probabilitatea de a vinde înghețată, indiferent de vremea de afară? | ||
- | |||
- | Matematic, ce vrem să calculăm este: P(A=vândut_înghețată | B=vreme_afară) | ||
- | |||
- | P(A) este expresia pe care o știm de dinainte. Considerând că deja știm că un eșantion de 30 din 100 de oameni cumpără înghețată. Putem pleca inițial de la presupunerea că probabilitatea este 0.3, dar nu este o valoare sigură. Poate fi la fel de bine 0.25 sau 0.4. În acest caz, avem o distribuție de probabilități. Acestea se folosesc des atunci când lucrăm cu modele. | ||
- | Modele în teorema lui Bayes | ||
- | |||
- | În definiția teoremei lui Bayes de mai sus am folosit evenimentele A și B, dar atunci când folosim modele în teorema lui Bayes, sunt adesea folosite diferite simboluri. | ||
- | |||
- | Simbolul pentru evenimentul definit mai sus ca A, este Θ (Theta). Theta este ceea ce ne interesează, reprezintă setul de parametri. Deci, dacă vrem să estimăm valorile parametrilor unei distribuții Gaussiene, Θ reprezintă și media, și deviația standard, σ (matematic Θ = {μ, σ}). | ||
- | |||
- | În locul evenientului B, vedem date sau y = {y1, y2, …, yn}. Aceasta reprezintă setul de observații pe care îl avem. | ||
- | |||
- | Teorema lui Bayes, în formă de model, devine: | ||
- | |||
- | P(Θ|data) = P(data|Θ) * P(Θ) / P(data) | ||
- | |||
- | ===== Inferențe statistice ===== | ||
- | |||
- | Inferențele statistice ne ajută să tragem concluzii din eșantioane pentru a estima parametrii unei populații. Eșantionul nu este o reprezentare exactă a unei populații, deci trebuie să ne așteptăm la rezultate aproximative. |