Torna ai Case Study
PythonDeep LearningComputer VisionAutomazione Industriale

Ispezione Visiva Industriale con Deep Learning

Francesco NegroComputer Vision Industriale27 marzo 2026

Ispezione Visiva Industriale con Deep Learning

Il controllo qualità visivo è una delle cose più difficili da automatizzare in fabbrica. I sistemi di visione con AI integrata esistono da anni, ma costano migliaia di euro a postazione, una cifra che taglia fuori la maggior parte delle piccole e medie imprese. Ci siamo chiesti se si potesse fare diversamente e abbiamo iniziato a costruire un'alternativa: un'applicazione desktop che usa il deep learning e una normale webcam per ispezionare i pezzi in tempo reale. È ancora in fase alpha, ma i primi risultati ci hanno sorpresi in positivo.

Perché serviva un'alternativa

Chi prova ad automatizzare un'ispezione visiva si scontra quasi sempre con gli stessi muri. L'hardware proprietario con AI integrata va pagato per ogni punto di controllo e arriva quasi sempre dentro un ecosistema chiuso, con vincoli sull'hardware, software di configurazione dedicato e contratti di manutenzione. Spesso basta cambiare il tipo di controllo per dover riconfigurare o sostituire la macchina.

Sul lato software il quadro non è più semplice. Gli approcci classici al machine learning chiedono dataset da migliaia di immagini e competenze che in officina raramente ci sono. E molte soluzioni recenti girano nel cloud, aggiungendo latenza, dubbi sulla riservatezza dei dati di produzione e un punto di rottura in più ogni volta che la connessione cade.

Come funziona

Tutto in locale

La scelta di fondo è stata tenere tutto sulla macchina. Addestramento, inferenza e modelli restano in locale, senza che un solo byte esca dal PC: nessuna dipendenza dalla rete, pieno controllo sui dati di produzione e nessuna spesa di cloud o API. Se è presente una GPU compatibile il sistema la usa per accelerare l'addestramento, altrimenti lavora bene anche solo con la CPU.

Transfer learning: pochi scatti, un modello

Il motore è il transfer learning. Partiamo da reti neurali già addestrate su milioni di immagini, che portano con sé una grammatica visiva di base fatta di bordi, texture e forme, e la specializziamo con poche decine di foto del pezzo reale. In pratica l'operatore fotografa una ventina di pezzi buoni e altrettanti difettosi, preme un tasto e in qualche minuto ha un modello pronto. Può scegliere tra diversi profili di rete, dal più leggero e veloce al più accurato, a seconda di quanta precisione o velocità serve sulla linea.

Un tool per ogni controllo

Ogni tipo di ispezione vive in un tool a sé: il controllo di una saldatura, la lettura di un'etichetta, l'analisi di una finitura superficiale. Ciascun tool ha il proprio modello, la propria area di interesse sul video e i propri parametri di classificazione. Così da una sola postazione si seguono più punti di controllo, e le configurazioni si esportano e si spostano da una stazione all'altra.

Niente scatole nere

Un sistema che si limita a dire «conforme» o «scarto» senza spiegare il perché non convince nessuno, ed è giusto così. Per questo abbiamo integrato Grad-CAM, che disegna in tempo reale una mappa di calore sopra l'immagine: quando un pezzo viene scartato, l'operatore vede esattamente quale zona ha fatto scattare la decisione. Serve a capire i falsi positivi e, soprattutto, a fidarsi dello strumento.

Inferenza in tempo reale

L'analisi gira di continuo sul flusso della webcam, senza fermare la produzione. L'operatore traccia l'area da controllare direttamente sul video e ogni fotogramma viene classificato in millisecondi. La soglia di decisione si regola al volo, senza riaddestrare nulla, e una media mobile smorza le oscillazioni da un frame all'altro. Dove serve più robustezza si attiva la test-time augmentation, che valuta più varianti della stessa immagine per ridurre la sensibilità a luce e posizionamento.

A che punto siamo

Siamo in alpha, quindi lontani da un impiego in produzione senza supervisione. Detto questo, i numeri che vediamo in sviluppo e nei test interni sono migliori di quanto sperassimo. Un nuovo controllo passa dalle prime foto a un modello funzionante in meno di dieci minuti; bastano 20-30 immagini per classe dove gli approcci tradizionali ne chiedono migliaia; tutto gira su un PC con una webcam USB, poche decine di euro di hardware, con classificazioni in tempo reale compatibili con i ritmi di linea e nessun costo ricorrente.

Una cosa il progetto ce l'ha confermata: il transfer learning ha abbassato di colpo la soglia d'ingresso all'AI industriale. Quello che fino a poco tempo fa significava dataset enormi e un team di data scientist dedicato oggi è alla portata di chi ha un laptop e una manciata di campioni. E l'impostazione desktop-first si è rivelata quella giusta per la fabbrica, dove affidabilità, latenza e controllo dei dati contano sul serio.

Il lavoro che resta non è poco: la tenuta sui casi limite, la validazione su volumi di produzione reali, il supporto multi-camera, l'ottimizzazione su hardware embedded. Non siamo ancora dove vogliamo arrivare, ma per una alpha promette parecchio.


Progetto in sviluppo attivo. I prossimi passi: rilevamento anomalie non supervisionato, integrazione con i sistemi SCADA e porting su hardware embedded, per avvicinare l'ispezione intelligente sempre di più alla linea di produzione.

Stack: Python · PyTorch · OpenCV · CustomTkinter

Colpito da questo progetto?

Parliamo di come possiamo ottenere risultati simili per la tua azienda.

Contattaci