This is an old revision of the document!
Nume proiect: Inferența pentru pacienții suspecți de COVID
Cum pandemia de COVID-19 pune societatea într-o situație nouă și plină de încercări, ne dorim să aducem o contribuție în domeniul medical. De aceea, ne propunem să construim un sistem de inferență a șansei de infectare cu COVID a unui pacient utilizând informații medicale și demografice.
Primul proiect la Managementul proiectelor software se desfășoară în perioada laboratoarelor 2, 3, 4, 5, 6. Începutul laboratorului 7 este termenul limită pentru definitivat proiectul, moment în care va fi prezentat asistentului (18-25 noiembrie 2020).
Pentru întrebări sau nelămuriri legate de proiect, folosiți forumul dedicat al proiectului sau canalul de MS Teams dedicat proiectului .
Se dorește construirea unui sistem de inferență a șansei de infectare cu COVID. Pentru realizarea lui, se vor utiliza:
Inferența se va face pe un set de date ce conține informații despre pacienți, precum:
Pentru antrenamentul modelului vostru, setul de date va conține și rezultatul unui test PCR:
Despre datele primite:
Hint: Aceste măsuri vor fi folosite atât în etapa de antrenare cât și în etapa de de testare.
Despre etapa de antrenament:
O mare parte din operațiile pe date realizate în această etapă, se vor repeta/utiliza și la etapa de inferență. * citește datele * curăță, generalizează și mapează datele la o formă definită și așteptată de voi * aici (doar la antrenare) observații pot fi eliminate cu scopul de a oferi doar informații corecte/relevante la antrenare * codifică datele într-o formă definită și așteptată de voi * aici (doar la antrenare) observații pot fi eliminate cu scopul de a oferi doar informații corecte/relevante la antrenare * se va determina cea mai bună codificare pentru fiecare tip de informație primit * exemple de tipuri de codificare: * one-hot encoding * dummy encoding * effect encoding * categorical encoding * binary encoding * base n encoding * antrenează modelul ales și parametrizat cu datele codificate * salvează modelul * realizează inferența utilizând datele de validare * evaluează antrenamentul utilizând metodele de măsurare menționate
Despre etapa de inferență:
Această etapă este numită și etapa de testare. În general, există următoarea abordare: * citește datele * curăță, generalizează și mapează datele asemenea etapei de antrenare * nu se vor elimina observații din setul de date * codifică datele asemenea etapei de antrenare * nu se vor elimina observații din setul de date * încarcă modelul * realizează inferența utilizând: * datele de test * datele de validare * evaluează inferența utilizând măsurile menționate
Obligatorii și care trebuie prezentate:
Alte livrabile la latitudinea evaluatorilor:
80p implementarea sistemului. Din care:
20p prezentarea proiectului. Din care:
Se acorda un bonus de cel putin 20% din punctajul total al proiectului dacă implementarea sistemului oferă posibilitatea de a integra funcția de inferență pe date noi într-un alt proiect software. De exemplu, funcția de inferență poate fi inclusă într-o componentă software de tip API care răspunde unui utilizator șansele de infectare cu COVID ale unor pacienți pe baza unui fișier de intrare.