This is an old revision of the document!
Inferența bayesiană este o metodă de inferență statistică în care teorema lui Bayes este utilizată pentru a actualiza probabilitatea unei ipoteze pe măsură ce devin disponibile mai multe dovezi sau informații. Definitia matematica a Teoremei lui Bayes
P(A|B) = P(B|A) * P(B) / P(A)
P(A|B) este probabilitatea ca evenimentul A sa se intample daca s-a intamplat evenimentul B
P(B|A) este probabilitatea ca evenimentul B sa se intample daca s-a intamplat evenimentul A
P(A) si P(B) sunt probabilitatile ca evenimentele A si B sa se intample Exemplu
Consideram ca se alege o carte dintr-un pachet cu 52 de carti. Stim ca jumatate dintre carti sunt rosii si cealalta jumatate sunt negre. Care este probabilitatea ca valoarea de pe o carte sa fie 4, daca stim ca e o carte rosie?
Pentru a transforma in simboluri matematice, putem spune:
A este evenimentul de a alege un 4 B este evenimentul de a alerge o carte rosie P(B|A) - probabilitatea de a alege o carte 4 care e rosie P(A|B) este P(4|rosie)
Calculand folosind teorema lui Bayes:
P(B|A) = P(rosie|4) = 1/2 P(A) = P(4) = 4/52 = 1/13 P(B) = P(rosie) = 1/2
P(4|rosie) = P(rosie|4) * P(rosie) / P(4) = (1/2 * 1/13) / (1/2) = 1/13 Inferența Bayesiană
Să luăm un alt exemplu: Care e probabilitatea de a vinde înghețată, indiferent de vremea de afară?
Matematic, ce vrem să calculăm este: P(A=vândut_înghețată | B=vreme_afară)
P(A) este expresia pe care o știm de dinainte. Considerând că deja știm că un eșantion de 30 din 100 de oameni cumpără înghețată. Putem pleca inițial de la presupunerea că probabilitatea este 0.3, dar nu este o valoare sigură. Poate fi la fel de bine 0.25 sau 0.4. În acest caz, avem o distribuție de probabilități. Acestea se folosesc des atunci când lucrăm cu modele. Modele în teorema lui Bayes
În definiția teoremei lui Bayes de mai sus am folosit evenimentele A și B, dar atunci când folosim modele în teorema lui Bayes, sunt adesea folosite diferite simboluri.
Simbolul pentru evenimentul definit mai sus ca A, este Θ (Theta). Theta este ceea ce ne interesează, reprezintă setul de parametri. Deci, dacă vrem să estimăm valorile parametrilor unei distribuții Gaussiene, Θ reprezintă și media, și deviația standard, σ (matematic Θ = {μ, σ}).
În locul evenientului B, vedem date sau y = {y1, y2, …, yn}. Aceasta reprezintă setul de observații pe care îl avem.
Teorema lui Bayes, în formă de model, devine:
P(Θ|data) = P(data|Θ) * P(Θ) / P(data)
Inferențele statistice ne ajută să tragem concluzii din eșantioane pentru a estima parametrii unei populații. Eșantionul nu este o reprezentare exactă a unei populații, deci trebuie să ne așteptăm la rezultate aproximative.