Table of Contents

Detecție și identificare de obiecte folosind ESP32-CAM

Introducere

Proiectul folosește modulul ESP32-CAM pentru a construi un sistem de recunoaștere a imaginilor, capabil să identifice diverse obiecte în timp real. Modulul camera captează imaginea, iar un model de inteligență artificială antrenat o analizează și afișează rezultatul, adică obiectul detectat împreună cu procentul de încredere pe un ecran OLED. Pe lângă afișaj, am adăugat și un servomotor care rotește brațul cu 90° pentru a ridica sau coborî poarta, în funcție de obiectul identificat.

Scopul proiectului este implementarea unui sistem automat de sortare a fructelor folosind computer vision. Camera ESP32-CAM capturează imagini în timp real, un model MobileNetV2 antrenat custom clasifică obiectele, iar un servomotor acționează o poartă mecanică în funcție de rezultat.

Sunt pasionată de inteligența artificială și am vrut să construiesc ceva care să combine IA cu microcontrollerele. Provocarea principală este atât găsirea celui mai bun model care să clasifice corect obiectele.

Proiectul are aplicații practice variate. Într-un supermarket, de exemplu, poate identifica automat produsul pus pe cântar, eliminând nevoia de a căuta manual codul acestuia și accelerând procesul pentru toți clienții. Pentru persoanele nevăzătoare, este deosebit de util deoarece nu mai trebuie să caute un cod pe un ecran pe care nu îl pot vedea. Mai departe, sistemul poate fi adaptat pentru inventariere și sortare automată în depozite sau clasificarea fructelor și legumelor în agricultură.

Descriere generală

Module hardware:

Module software:

Hardware Design

Listă de piese:

Demonstrație funcționare

Schemă electrică

Schema electrică prezintă sistemul complet al proiectului ESP32-CAM Object Detection, realizată în KiCad 10.0.3. Aceasta include patru componente principale: microcontrollerul ESP32-WROOM-32 în centrul schemei, display-ul OLED conectat prin I2C , convertorul USB-Serial FT232RL conectat prin UART pentru programare și alimentare la 5V, și servomotorul SG90 alimentat separat din baterii 4xAA la 6V. Firele verzi indică conexiunile de semnal și alimentare între componente, iar simbolurile de alimentare (+3.3V, +5V, +6V, GND) sunt distribuite corespunzător fiecărei componente în funcție de tensiunea necesară.

Pin FTDI Semnal Conectat la De ce?
VCC Alimentare ESP32 5V Furnizează 5V prin USB de la laptop către ESP32
GND Masă ESP32 GND Referință comună de tensiune
TX Transmisie ESP32 U0R FTDI trimite date, ESP32 primește - încărcare cod
RX Recepție ESP32 U0T ESP32 trimite date, FTDI primește - Serial Monitor
Pin ESP32 Semnal Conectat la De ce?
5V Alimentare FTDI VCC Primește alimentare 5V prin USB
GND Masă FTDI GND + Baterii GND + OLED GND Masă comună pentru toate componentele
3.3V Alimentare OLED VCC 3.3V pentru OLED
GPIO0 Boot mode GND Conectat la GND, mod programare. Deconectat, rulare normală
GPIO14 I2C SCL OLED SCL Clock I2C pentru OLED
GPIO15 I2C SDA OLED SDA Date I2C pentru OLED
GPIO16 PWM Servo semnal Generează semnal PWM
Pin OLED Semnal Conectat la De ce?
GND Masă ESP32 GND Referință comună
VCC Alimentare ESP32 3.3V OLED funcționează la 3.3V
SCL I2C clock ESP32 GPIO14 Primește clock-ul I2C de la ESP32
SDA I2C date ESP32 GPIO15 Primește datele de afișat de la ESP32
Pin Servo Culoare fir Conectat la De ce?
VCC Roșu Baterii +6V Alimentare separată baterii
GND Maro/Negru Baterii GND + ESP32 GND Masă comună
Semnal Portocaliu ESP32 GPIO16 Primește semnal PWM

Software Design

Descrierea codului aplicaţiei (firmware):

  • mediu de dezvoltare (if any) (e.g. AVR Studio, CodeVisionAVR)
  • librării şi surse 3rd-party (e.g. Procyon AVRlib)
  • algoritmi şi structuri pe care plănuiţi să le implementaţi
  • (etapa 3) surse şi funcţii implementate

Stadiul actual al implementării software Proiectul este implementat pe două componente software distincte care comunică prin WiFi.

Motivația alegerii bibliotecilor

Scheletul proiectului și interacțiunea dintre funcționalități

Arhitectura generala Browser (localhost:5000)

      ↕ HTTP

Flask Server (Python)

      ↕ HTTP WiFi

ESP32-CAM

      ↕ I2C

OLED Display

      ↕ PWM

Servo SG90

Flux clasificare 1. Utilizatorul deschide http://localhost:5000 2. Browser afișează stream live (refresh la 300ms) 3. Utilizatorul apasă “Clasifica” 4. Browser → POST /clasificare → Flask 5. Flask → GET /jpeg → ESP32 portul 82 6. ESP32 flush frame vechi → captură nouă 7. Trimite 153600 bytes RGB565 raw 8. Flask swap bytes → conversie RGB565→BGR 9. MobileNetV2 → predicție label + confidence 10. Flask → GET /rezultat → ESP32 OLED 11. Flask → GET /servo?grade=90 (dacă apple) 12. Flask → sleep(3) → GET /servo?grade=0 13. Flask → JSON {detectii, snapshot} → Browser 14. Browser afișează rezultat + snapshot

Interacțiunea dintre funcționalități din laborator

Validarea funcționalităților

Optimizări realizate

Link Github: https://github.com/saratutuianu/UPB-PM-Automatic-object-sorting-using-ML

Link videoclip functionare: https://youtu.be/nlO-m5YhCmo

Rezultate Obţinute

Care au fost rezultatele obţinute în urma realizării proiectului vostru.

Concluzii

Download

O arhivă (sau mai multe dacă este cazul) cu fişierele obţinute în urma realizării proiectului: surse, scheme, etc. Un fişier README, un ChangeLog, un script de compilare şi copiere automată pe uC crează întotdeauna o impresie bună ;-).

Fişierele se încarcă pe wiki folosind facilitatea Add Images or other files. Namespace-ul în care se încarcă fişierele este de tipul :pm:prj20??:c? sau :pm:prj20??:c?:nume_student (dacă este cazul). Exemplu: Dumitru Alin, 331CC → :pm:prj2009:cc:dumitru_alin.

Jurnal

Puteți avea și o secțiune de jurnal în care să poată urmări asistentul de proiect progresul proiectului.

Bibliografie/Resurse

Listă cu documente, datasheet-uri, resurse Internet folosite, eventual grupate pe Resurse Software şi Resurse Hardware.

Export to PDF