Introducing G2.ai, the future of software buying.Try now

Segmentazione delle Immagini: Tecniche Utilizzate per Classificare le Immagini

Agosto 7, 2024
da Holly Landis

Negli ultimi anni, la tecnologia si è evoluta al punto che i computer possono rilevare e comprendere le immagini visive quasi come i nostri cervelli umani. Ma naturalmente, ciò è avvenuto solo grazie ai nostri significativi interventi e allo sviluppo di un processo noto come visione artificiale.

La visione artificiale si basa su una tecnica chiamata segmentazione delle immagini. Senza di essa, un'immagine rimane semplicemente un elemento visivo isolato con poca relazione con la macchina. Ma con la segmentazione, i computer possono etichettare correttamente e comprendere i vari elementi che un'immagine contiene e dare un senso a questi dati per un uso futuro.

Una volta segmentati, gli elementi individuali possono essere elaborati e valutati in base alle esigenze degli utenti. Le parti di un'immagine possono essere divise utilizzando regioni o dagli oggetti presenti all'interno dell'immagine. Una volta separati, gli elementi dell'immagine possono essere etichettati individualmente e raggruppati insieme come parte del più ampio processo di riconoscimento delle immagini. Questo rende più facile per gli utenti identificare dettagli importanti sull'immagine nel suo insieme, così come ciascuna delle caratteristiche individuali che contiene. 

La segmentazione delle immagini ha molti usi in diversi settori. Ad esempio, puoi tracciare oggetti in tempo reale sotto sorveglianza video che utilizza la segmentazione delle immagini. Elementi visivi come persone o veicoli possono essere isolati all'interno del video più grande per facilitare il personale di sicurezza nella revisione delle informazioni man mano che arrivano e agire se necessario. 

Tipi di modelli di segmentazione delle immagini 

La maggior parte della segmentazione delle immagini rientra in tre categorie basate sul tipo di informazioni che devono essere estratte dall'immagine. 

  • Segmentazione per istanza, come il rilevamento degli oggetti, si concentra sul rilevamento e la segmentazione di oggetti specifici all'interno dell'immagine e sulla separazione di questi dallo sfondo generale. Gli oggetti sovrapposti possono essere più facilmente segmentati utilizzando questo approccio ed è spesso utilizzato per identificare e tracciare oggetti individuali all'interno di un'immagine.
  • Segmentazione semantica divide le immagini in base ai pixel in un'immagine data. In altre parole, la segmentazione semantica raggruppa gli oggetti in base a quanto i loro pixel sono simili tra loro, riconoscendo che questi oggetti sono diversi dallo sfondo e da altri oggetti nell'immagine. Ogni pixel nell'immagine riceve un'etichetta sotto questo tipo di segmentazione delle immagini.
  • Segmentazione panottica. unisce la segmentazione semantica e per istanza allo stesso tempo. Ogni pixel è etichettato sia per la sua classe che per il tipo di oggetto che è. Questo tipo di segmentazione delle immagini offre il livello più dettagliato di rilevamento e analisi, quindi è utile quando il modello del computer deve essere il più specifico possibile, come nel caso dei veicoli autonomi.

types of image segmentation

Fonte: SuperAnnotate

Vuoi saperne di più su Software di Reti Neurali Artificiali? Esplora i prodotti Rete Neurale Artificiale.

Tecniche di segmentazione delle immagini 

Ogni tipo di segmentazione delle immagini ha le proprie tecniche basate sui suoi punti di forza e applicazioni. Queste sono tipicamente suddivise in due categorie separate: tecniche tradizionali e tecniche di deep learning.

Tecniche tradizionali 

Utilizzate per decenni nel campo della visione artificiale, le tecniche tradizionali derivano da modelli algoritmici ed equazioni matematiche per identificare caratteristiche comuni all'interno delle immagini in modo che gli oggetti possano essere etichettati in modo appropriato. Le tecniche più comuni utilizzate nei quadri tradizionali sono spiegate qui.

  • Basato su regioni. Le immagini possono essere divise in regioni basate su criteri sovrapposti, come colore o texture. In questa tecnica, i pixel sono divisi e raggruppati in base a caratteristiche simili. I pixel vicini tra loro sono solitamente parte dello stesso oggetto, quindi la macchina cercherà somiglianze e differenze in queste aree per trovare i bordi degli oggetti.
  • Rilevamento dei bordi. Basandosi sulla tecnica basata su regioni, il rilevamento dei bordi si concentra su luoghi in cui i pixel che si affiancano cambiano improvvisamente. Cambiamenti drastici nei pixel spesso indicano dove potrebbe esserci un confine per un oggetto, quindi queste aree sono segnate per la revisione per delineare dove si trova il bordo di quell'oggetto particolare.
  • Soglia. La forma più semplice di segmentazione delle immagini, la soglia divide i pixel in base alle loro classi e intensità. La maggior parte delle immagini viene convertita in scala di grigi per rendere più facile questa tecnica perché la macchina cerca aree di alto e basso contrasto per dividere gli oggetti. Le immagini binarie vengono prodotte durante il processo di segmentazione, creando contorni che rendono più facile per la macchina distinguere tra gli oggetti.
  • Clustering. In questo caso, i pixel sono raggruppati nei propri segmenti o cluster in base alla somiglianza. Ogni cluster rappresenta una somiglianza o una caratteristica comune. 

Tecniche di deep learning 

La segmentazione delle immagini nel deep learning si distingue come uno dei modi migliori per ottenere un output accurato, in particolare quando si lavora con dataset complessi su larga scala. Le due tecniche più popolari per questo sono dettagliate qui.

  • U-net, costruito per assomigliare a una forma a "U", utilizza un processo di upsampling e downsampling che funziona in modo molto simile a un codificatore e decodificatore nei modelli di didascalia delle immagini. Il processo basato su livelli di U-net è utilizzato per evitare il più possibile la perdita di dati e informazioni durante il processo di segmentazione, rendendolo una delle metodologie più accurate attualmente disponibili.
  • Mask R-CNN è un processo a due fasi che utilizza una rete neurale convoluzionale, ma offre un alto livello di flessibilità. Il primo passo di questa tecnica è suddividere l'immagine in regioni di interesse proposte all'interno del visivo complessivo. Da qui, il secondo passo è il boxing, la classificazione e l'applicazione di maschere binarie alle regioni separate e l'analisi pezzo per pezzo.

Settori che utilizzano la segmentazione delle immagini 

La capacità di analizzare le informazioni nelle immagini dopo che sono state estratte utilizzando la segmentazione migliora profondamente i flussi di lavoro e le procedure per un numero di settori diversi.

Imaging medico e ricerca 

Risonanze magnetiche, TAC, radiografie e altri tipi di imaging medico utilizzano tutti una forma di segmentazione delle immagini per cercare irregolarità nelle scansioni dei pazienti. La segmentazione delle immagini supera molti degli altri modi in cui i professionisti medici diagnosticano e trattano i pazienti. 

Ad esempio, gli operatori sanitari possono rilevare più facilmente i tumori con questi strumenti. Gli strumenti di segmentazione delle immagini evidenziano la dimensione e la posizione esatta dei tumori sulle scansioni mediche separando questi oggetti dal tessuto sano. Anche le scansioni cerebrali funzionano in modo simile: la segmentazione delle immagini può separare i diversi tessuti all'interno del cervello per aiutare i medici a diagnosticare problemi come il morbo di Alzheimer o gli ictus, o pianificare interventi chirurgici al cervello.

La segmentazione delle immagini può anche essere implementata per la ricerca biomedica, inclusa l'analisi dei tessuti, il conteggio delle cellule e gli studi sulle strutture anatomiche.

Veicoli autonomi 

I veicoli a guida autonoma hanno bisogno di un set di occhi digitali per guidarli. Gli strumenti di segmentazione delle immagini consentono ai veicoli autonomi di percepire il mondo intorno a loro in modo che possano evitare pedoni e altre auto, rimanere nella corsia corretta e rispettare i segnali stradali. Queste caratteristiche di sicurezza cruciali rendono possibile l'uso delle nostre strade da parte dei veicoli autonomi.

Ulteriori applicazioni coprono il riconoscimento degli oggetti oltre gli standard previsti sulla strada e il rilevamento di anomalie che potrebbero compromettere la guidabilità dell'auto.

Imaging satellitare 

I satelliti possono essere utilizzati per tutti i tipi di scopi, in gran parte quelli che sono difficili o impossibili da completare per gli esseri umani da soli. Monitorare grandi aree di terra, ad esempio, avviene solo grazie ai satelliti aerei e alla loro capacità di visualizzare centinaia di miglia di terra contemporaneamente.

Con la segmentazione delle immagini, questi satelliti possono monitorare più accuratamente i cambiamenti ambientali che richiedono azioni da intraprendere, in modo molto simile a come gli agricoltori monitorano le loro colture con la segmentazione delle immagini. Possono anche essere utilizzati per progetti di pianificazione urbana estensivi, in particolare dove il terreno rurale o agricolo viene riqualificato in spazi residenziali, commerciali o di lavoro.

Giochi 

Man mano che i giochi diventano più interattivi, la tecnologia necessaria per alimentarli diventa più complessa. La segmentazione delle immagini ha aperto la strada agli utenti per interagire come se fossero parte dei giochi stessi - specialmente negli ambienti di realtà virtuale - in modi nuovi e immersivi. Anche i personaggi possono interagire con gli elementi del gioco in modi nuovi, fornendo un'esperienza di gioco migliorata per gli utenti.

Robotica 

Le nostre vite quotidiane coinvolgono sempre più la presenza di robot e l'uso di strumenti di intelligenza artificiale per gestirli è in crescita. Come parte di una pratica più ampia di segmentazione delle immagini, il riconoscimento degli oggetti per i robot li abilita a comprendere e interagire con il loro ambiente. Questo li aiuta a seguire i comandi in modo preciso, in particolare quando devono identificare oggetti in un ambiente sconosciuto.

La segmentazione delle immagini aiuta anche la navigazione robotica, cioè lo spostamento del robot da un punto all'altro. Combinata con la segmentazione degli oggetti, i robot possono interagire con diversi elementi nel loro ambiente e prendere decisioni autonomamente, come pianificare un percorso di navigazione ed evitare ostacoli lungo il cammino.

Sfide con la segmentazione delle immagini 

Non importa quanto complessa e ben costruita diventi la tua macchina, l'IA rimane alla mercé di buoni dati di addestramento. Senza di essi, si corre il rischio di risultati inaccurati e lunghi periodi di riaddestramento nel tentativo di correggere gli errori commessi in partenza. Ci sono altre sfide importanti da considerare quando si tratta di segmentazione delle immagini, tra cui:

  • Ambiguità delle immagini. Non tutte le immagini che inserisci nella macchina hanno confini nitidi e chiari che rendono facile per l'algoritmo distinguere e segmentare gli oggetti. Le regioni con caratteristiche simili o variazioni di illuminazione e altri problemi basati sul rumore possono avere un impatto significativo sull'accuratezza della segmentazione.
  • Segmentazione eccessiva e insufficiente. Le immagini possono essere divise in troppe regioni, noto anche come segmentazione eccessiva. D'altra parte, più gruppi potrebbero essere raggruppati insieme come una singola regione, noto anche come segmentazione insufficiente. C'è una linea sottile nel bilanciare questi aspetti, e ancora di più quando si ha a che fare con piccoli oggetti in più punti di un'immagine.
  • Consumo di risorse. Alimentare macchinari basati su IA richiede più energia di quanto si possa pensare. Le risorse informatiche necessarie per lanciare e mantenere modelli di deep learning possono rapidamente diventare complesse, quindi garantire di avere tutto il necessario per consentire la segmentazione in tempo reale può essere una sfida.

Non dividere i capelli - dividi le immagini! 

La segmentazione delle immagini è una parte vitale della visione artificiale che si basa sulla segmentazione delle immagini per costruire le molte applicazioni che le macchine forniscono nelle nostre vite, soprattutto quando si utilizzano modelli di deep learning per replicare il comportamento umano. Questa potente tecnica rende l'identificazione e la comprensione degli oggetti all'interno di un'immagine più rapida e facile - una caratteristica essenziale in molti settori.

Costruisci i tuoi sistemi di IA con software di reti neurali artificiali (ANN) che possono imitare il cervello umano.

Holly Landis
HL

Holly Landis

Holly Landis is a freelance writer for G2. She also specializes in being a digital marketing consultant, focusing in on-page SEO, copy, and content writing. She works with SMEs and creative businesses that want to be more intentional with their digital strategies and grow organically on channels they own. As a Brit now living in the USA, you'll usually find her drinking copious amounts of tea in her cherished Anne Boleyn mug while watching endless reruns of Parks and Rec.