Introducing G2.ai, the future of software buying.Try now

Segmentation d'image : Techniques utilisées pour classer les images

7 Août 2024
par Holly Landis

Au cours des dernières années, la technologie a évolué au point où les ordinateurs peuvent détecter et comprendre les images visuelles presque aussi bien que notre cerveau humain. Mais bien sûr, cela n'a été possible que grâce à nos interventions significatives et au développement d'un processus connu sous le nom de vision par ordinateur.

La vision par ordinateur repose sur une technique appelée segmentation d'image. Sans elle, une image reste simplement une image autonome avec peu de relation avec la machine. Mais avec la segmentation, les ordinateurs peuvent correctement étiqueter et comprendre les différents éléments qu'une image contient et donner un sens à ces données pour une utilisation ultérieure.

Une fois segmentés, les éléments individuels peuvent être traités et évalués en fonction des besoins des utilisateurs. Les parties d'une image peuvent être divisées en utilisant des régions ou par les objets présents dans l'image. Une fois qu'elles sont séparées, les éléments de l'image peuvent être individuellement étiquetés et regroupés dans le cadre du processus plus large de reconnaissance d'image. Cela facilite l'identification par les utilisateurs des détails importants concernant l'image dans son ensemble, ainsi que chacune des caractéristiques individuelles qu'elle contient.

La segmentation d'image a de nombreuses utilisations dans divers secteurs. Par exemple, vous pouvez suivre des objets en temps réel sous surveillance vidéo qui utilise la segmentation d'image. Les éléments visuels comme les personnes ou les véhicules peuvent être isolés dans la vidéo plus large pour faciliter la révision des informations par le personnel de sécurité à mesure qu'elles arrivent et prendre des mesures si nécessaire.

Types de modèles de segmentation d'image

La plupart des segmentations d'image se répartissent en trois catégories en fonction du type d'informations à extraire de l'image.

  • Segmentation d'instance, comme la détection d'objets, se concentre sur la détection et la segmentation d'objets spécifiques dans l'image et les sépare de l'arrière-plan global. Les objets qui se chevauchent peuvent être plus facilement segmentés en utilisant cette approche et elle est souvent utilisée pour identifier et suivre des objets individuels dans une image.
  • Segmentation sémantique divise les images selon les pixels d'une image donnée. En d'autres termes, la segmentation sémantique regroupe les objets en fonction de la similitude de leurs pixels, tout en reconnaissant que ces objets sont différents de l'arrière-plan et des autres objets de l'image. Chaque pixel de l'image reçoit une étiquette sous ce type de segmentation d'image.
  • Segmentation panoptique. combine la segmentation sémantique et d'instance en même temps. Chaque pixel est étiqueté à la fois par sa classe et par le type d'objet qu'il est. Ce type de segmentation d'image offre le niveau le plus détaillé de détection et d'analyse, il est donc utile lorsque le modèle informatique doit être aussi précis que possible, comme c'est le cas avec les véhicules autonomes.

types of image segmentation

Source : SuperAnnotate

Vous voulez en savoir plus sur Logiciel de réseau de neurones artificiels ? Découvrez les produits Réseau de neurones artificiels.

Techniques de segmentation d'image

Chaque type de segmentation d'image est accompagné de ses propres techniques basées sur ses forces et ses applications. Celles-ci sont généralement divisées en deux catégories distinctes – techniques traditionnelles et techniques d'apprentissage profond.

Techniques traditionnelles

Utilisées depuis des décennies dans le domaine de la vision par ordinateur, les techniques traditionnelles proviennent de modèles algorithmiques et d'équations mathématiques pour identifier les caractéristiques communes au sein des images afin que les objets puissent être étiquetés de manière appropriée. Les techniques les plus courantes utilisées dans le cadre des cadres traditionnels sont expliquées ici.

  • Basé sur les régions. Les images peuvent être divisées en régions basées sur des critères de chevauchement, comme la couleur ou la texture. Dans cette technique, les pixels sont divisés et regroupés selon des caractéristiques similaires. Les pixels proches les uns des autres font généralement partie du même objet, donc la machine recherchera des similitudes et des différences dans ces zones pour trouver les bords des objets.
  • Détection des contours. S'appuyant sur la technique basée sur les régions, la détection des contours se concentre sur les endroits où les pixels qui se bordent changent soudainement. Les changements drastiques de pixels indiquent souvent où il pourrait y avoir une limite à un objet, donc ces zones sont marquées pour examen afin de délimiter où se trouve le bord de cet objet particulier.
  • Seuil. La forme la plus simple de segmentation d'image, le seuil divise les pixels selon leurs classes et leur intensité. La plupart des images sont transformées en niveaux de gris pour faciliter cette technique car la machine recherche des zones de contraste élevé et faible pour diviser les objets. Des images binaires sont produites au cours du processus de segmentation, créant des contours qui facilitent la distinction entre les objets par la machine.
  • Regroupement. Dans ce cas, les pixels sont regroupés en leurs propres segments ou clusters selon leur ressemblance. Chaque cluster représente une similitude ou une caractéristique commune.

Techniques d'apprentissage profond

La segmentation d'image dans l'apprentissage profond se distingue comme l'un des meilleurs moyens d'obtenir un résultat précis, en particulier lorsqu'on travaille avec des ensembles de données complexes à grande échelle. Les deux techniques les plus populaires pour cela sont détaillées ici.

  • U-net, construit pour ressembler à une forme de "U", utilise un processus de suréchantillonnage et de sous-échantillonnage qui fonctionne de la même manière qu'un encodeur et un décodeur dans les modèles de légende d'image. Le processus basé sur les niveaux de U-net est utilisé pour éviter autant que possible la perte de données et d'informations tout au long du processus de segmentation, ce qui en fait l'une des méthodologies les plus précises actuellement disponibles.
  • Mask R-CNN est un processus en deux étapes qui utilise un réseau neuronal convolutif, mais offre un haut niveau de flexibilité. La première étape de cette technique consiste à décomposer l'image en régions d'intérêt proposées dans l'ensemble du visuel. À partir de là, la deuxième étape consiste à encadrer, classer et appliquer des masques binaires aux régions séparées et à les analyser pièce par pièce.

Industries qui utilisent la segmentation d'image

La capacité d'analyser les informations dans les images après qu'elles ont été extraites à l'aide de la segmentation améliore considérablement les flux de travail et les procédures pour un certain nombre d'industries différentes.

Imagerie médicale et recherche

Les IRM, les tomodensitogrammes, les radiographies et d'autres types d'imagerie médicale utilisent tous une forme de segmentation d'image pour rechercher des irrégularités dans les scans des patients. La segmentation d'image surpasse de nombreuses autres méthodes que les professionnels de la santé utilisent pour diagnostiquer et traiter les patients.

Par exemple, les travailleurs de la santé peuvent plus facilement détecter les tumeurs avec ces outils. Les outils de segmentation d'image mettent en évidence la taille et l'emplacement exacts des tumeurs sur les scans médicaux en séparant ces objets des tissus sains. Les scans cérébraux fonctionnent également de manière similaire : la segmentation d'image peut séparer les différents tissus du cerveau pour aider les médecins à diagnostiquer des problèmes comme la maladie d'Alzheimer ou les AVC, ou à planifier une chirurgie cérébrale.

La segmentation d'image peut également être mise en œuvre pour la recherche biomédicale, y compris l'analyse des tissus, le comptage des cellules et les études de structures anatomiques.

Véhicules autonomes

Les véhicules autonomes ont besoin d'un ensemble d'yeux numériques pour les guider. Les outils de segmentation d'image permettent aux véhicules autonomes de percevoir le monde qui les entoure afin qu'ils puissent éviter les piétons et les autres voitures, rester dans la bonne voie et respecter les panneaux de signalisation. Ces caractéristiques de sécurité cruciales rendent possible l'utilisation de nos routes par les véhicules autonomes.

Les applications supplémentaires couvrent la reconnaissance d'objets au-delà des normes attendues sur la route et la détection d'anomalies qui pourraient nuire à la maniabilité de la voiture.

Imagerie satellite

Les satellites peuvent être utilisés à toutes sortes de fins, principalement celles qui sont difficiles ou impossibles à réaliser par les humains seuls. La surveillance de vastes zones de terre, par exemple, n'est possible que grâce aux satellites aériens et à leur capacité à visualiser des centaines de kilomètres de terre en même temps.

Avec la segmentation d'image, ces satellites peuvent surveiller plus précisément les changements environnementaux qui nécessitent une action, de la même manière que les agriculteurs surveillent leurs cultures avec la segmentation d'image. Ils peuvent également être utilisés pour des projets d'urbanisme étendus, en particulier là où des terres rurales ou agricoles sont réaménagées en espaces résidentiels, commerciaux ou de travail.

Jeux

À mesure que les jeux deviennent plus interactifs, la technologie nécessaire pour les alimenter devient plus complexe. La segmentation d'image a ouvert la voie aux utilisateurs pour interagir comme s'ils faisaient partie des jeux eux-mêmes – en particulier dans les environnements de réalité virtuelle – de manière nouvelle et immersive. Les personnages peuvent également interagir avec les éléments du jeu de nouvelles manières, offrant une expérience de jeu améliorée pour les utilisateurs.

Robotique

Nos vies quotidiennes impliquent de plus en plus la présence de robots et l'utilisation d'outils IA pour les gérer est également en croissance. Dans le cadre d'une pratique plus large de segmentation d'image, la reconnaissance d'objets pour les robots leur permet de comprendre et d'interagir avec leur environnement. Cela les aide à suivre les commandes de manière précise, en particulier lorsqu'ils doivent identifier des objets dans un environnement inconnu.

La segmentation d'image aide également à la navigation robotique, c'est-à-dire à déplacer le robot d'un point à un autre. Combinée à la segmentation d'objets, les robots peuvent interagir avec différents éléments de leur environnement et prendre des décisions par eux-mêmes, comme planifier un chemin de navigation et éviter les obstacles sur leur chemin.

Défis de la segmentation d'image

Peu importe à quel point votre machine devient complexe et bien construite, l'IA reste à la merci de bonnes données d'entraînement. Sans cela, vous courez le risque de résultats inexacts et de longues périodes de réentraînement dans le but de corriger les erreurs commises au départ. Il existe d'autres défis importants à prendre en compte en ce qui concerne la segmentation d'image, notamment :

  • Ambiguïté de l'image. Toutes les images que vous alimentez dans la machine n'ont pas des limites nettes et claires qui facilitent la distinction et la segmentation des objets par l'algorithme. Les régions avec des caractéristiques similaires ou des variations d'éclairage et d'autres problèmes basés sur le bruit peuvent avoir un impact significatif sur la précision de la segmentation.
  • Sur-segmentation et sous-segmentation. Les images peuvent être divisées en trop de régions, également connues sous le nom de sur-segmentation. D'un autre côté, plusieurs groupes pourraient être regroupés en une seule région, également appelée sous-segmentation. Il y a une fine ligne à équilibrer entre ces deux aspects, et encore plus lorsqu'il s'agit de petits objets à plusieurs points d'une image.
  • Drain de ressources. Alimenter des machines basées sur l'IA prend plus d'énergie que vous ne le pensez. Les ressources informatiques nécessaires pour lancer et maintenir des modèles d'apprentissage profond peuvent rapidement devenir complexes, donc s'assurer que vous avez tout ce dont vous avez besoin pour permettre une segmentation en temps réel peut être un défi.

Ne coupez pas les cheveux en quatre - segmentez les images !

La segmentation d'image est une partie vitale de la vision par ordinateur qui repose sur la segmentation d'image pour construire les nombreuses applications que les machines fournissent dans nos vies, notamment lors de l'utilisation de modèles d'apprentissage profond pour reproduire le comportement humain. Cette technique puissante rend l'identification et la compréhension des objets dans une image plus rapides et plus faciles – une fonctionnalité essentielle dans de nombreuses industries.

Construisez vos propres systèmes d'IA avec des logiciels de réseau neuronal artificiel (ANN) qui peuvent imiter le cerveau humain.

Holly Landis
HL

Holly Landis

Holly Landis is a freelance writer for G2. She also specializes in being a digital marketing consultant, focusing in on-page SEO, copy, and content writing. She works with SMEs and creative businesses that want to be more intentional with their digital strategies and grow organically on channels they own. As a Brit now living in the USA, you'll usually find her drinking copious amounts of tea in her cherished Anne Boleyn mug while watching endless reruns of Parks and Rec.