This is an old revision of the document!
Inferența se va face pe un set de date ce conține informații despre pacienți, precum:
Pentru antrenamentul modelului vostru, setul de date va conține și rezultatul unui test PCR:
Despre datele primite:
Hint: Aceste măsuri vor fi folosite atât în etapa de antrenare cât și în etapa de de testare.
Despre etapa de antrenament:
O mare parte din operațiile pe date realizate în această etapă, se vor repeta/utiliza și la etapa de inferență. * citește datele * curăță, generalizează și mapează datele la o formă definită și așteptată de voi * aici (doar la antrenare) observații pot fi eliminate cu scopul de a oferi doar informații corecte/relevante la antrenare * codifică datele într-o formă definită și așteptată de voi * aici (doar la antrenare) observații pot fi eliminate cu scopul de a oferi doar informații corecte/relevante la antrenare * se va determina cea mai bună codificare pentru fiecare tip de informație primit * exemple de tipuri de codificare: * one-hot encoding * dummy encoding * effect encoding * categorical encoding * binary encoding * base n encoding * antrenează modelul ales și parametrizat cu datele codificate * salvează modelul * realizează inferența utilizând datele de validare * evaluează antrenamentul utilizând metodele de măsurare menționate
Despre etapa de inferență:
Această etapă este numită și etapa de testare. În general, există următoarea abordare: * citește datele * curăță, generalizează și mapează datele asemenea etapei de antrenare * nu se vor elimina observații din setul de date * codifică datele asemenea etapei de antrenare * nu se vor elimina observații din setul de date * încarcă modelul * realizează inferența utilizând: * datele de test * datele de validare * evaluează inferența utilizând măsurile menționate
Obligatorii și care trebuie prezentate:
Alte livrabile la latitudinea evaluatorilor:
70p implementarea sistemului. Din care:
30p prezentarea proiectului. Din care:
Se acordă un bonus de 10p pentru codificarea subseturilor de date de antrenare și validare.
Se acorda un bonus de cel putin 20% din punctajul total al proiectului dacă implementarea sistemului oferă posibilitatea de a integra funcția de inferență pe date noi într-un alt proiect software. De exemplu, funcția de inferență poate fi inclusă într-o componentă software de tip API care răspunde unui utilizator șansele de infectare cu COVID ale unor pacienți pe baza unui fișier de intrare.
</hidden>