Introducing G2.ai, the future of software buying.Try now

Modèles génératifs vs. modèles discriminatifs : Décoder l'apprentissage profond

20 Décembre 2024
par Holly Landis

Avec l'essor de l'apprentissage profond, de nouveaux algorithmes comme les modèles génératifs et discriminatifs sont devenus le sujet de discussion du marché. Bien que les modèles génératifs et discriminatifs soient intégrés dans divers domaines d'application, la valeur mathématique latente de ces techniques d'apprentissage automatique peut transformer radicalement votre cycle de vie de génération de produits. En tant qu'expert en apprentissage automatique, les principales anomalies racines sont liées à une gestion de base de données incompatible, un stockage insuffisant et un mauvais étiquetage entraînant des échecs et des erreurs.

Explorer les modèles génératifs et discriminatifs et comprendre leurs applications dans la technologie de l'apprentissage profond permettrait de construire une courbe d'apprentissage et de vous aider à prendre une décision éclairée sur lequel choisir pour vos données privées et sensibles. Évaluer ces options au sein des logiciels d'étiquetage de données peut être un moyen rapide de gérer un grand volume, d'optimiser le stockage et de construire des processus de modélisation prédictive robustes.

Apprenons ces deux techniques prédominantes d'apprentissage automatique et explorons les nuances de chacune.

Alors que l'IA générative progresse encore plus, de nouvelles façons de prédire les données sont en pleine expérimentation dans les industries. Les modèles génératifs et discriminatifs sont dans une ligue à part, mais suivent différentes méthodes de manipulation et d'analyse des données pour prédire les résultats.

Comment fonctionnent les modèles génératifs et discriminatifs

Lorsque des algorithmes reçoivent de grandes quantités de données pour entraîner un modèle génératif, ils sont utilisés pour aider l'algorithme à identifier des structures et des motifs qui aideront à créer de nouvelles sorties. Le modèle génératif apprend la distribution de probabilité de ces motifs et produit ensuite de nouvelles sorties qui ressemblent au jeu de données original. Même si les données ne sont pas étiquetées, les modèles génératifs peuvent toujours distinguer les motifs dans les données et créer des sorties similaires.

Pour les modèles discriminatifs, les données non étiquetées sont beaucoup plus difficiles à gérer. Les modèles discriminatifs ont besoin d'étiquettes pour comprendre où se trouvent les frontières entre les types de données, les classes ou les catégories. Par exemple, une image montrant un chien, un chat, une balle et un arbre doit avoir des étiquettes sur chacun de ces éléments pour que le modèle puisse distinguer les frontières de ces objets. Ces modèles sont plus faciles à créer que les modèles génératifs car ils peuvent fonctionner efficacement avec de plus petites quantités de données d'entraînement et un étiquetage simple des frontières.

Formule pour le modèle génératif

Le modèle génératif se concentre sur l'apprentissage du comportement passé du modèle et le réutilise pour prédire de nouvelles catégories pour de nouveaux points de données. Principalement utilisé dans l'apprentissage non supervisé, il est très vital pour l'analyse des sentiments, la détection d'anomalies, la détection de spam et la réduction du bruit.

Formule pour le modèle génératif :

P (X,Y) = P(Y) x P(X | Y)


P (Y) → Distribution des données passées sur les étiquettes.

P (X | Y) →Vraisemblance des données X étant donné l'étiquette Y

Formule pour le modèle discriminatif

Le modèle discriminatif se concentre uniquement sur les frontières de décision pour attribuer rapidement des étiquettes aux ensembles de données en utilisant une technique de "fission". Cependant, le modèle discriminatif doit parfois être vérifié deux fois pour éviter les "mauvais classements".

Formule pour le modèle génératif :

Objectif : Modéliser directement la probabilité P (Y | X) en se concentrant sur les frontières de décision et non sur la distribution des données.

P (Y | X; θ) = exp (f( X, Y, θ)) / Σ y' exp (X, Y'; θ)

 

Ici,

θ → Paramètres du modèle

f (X, Y, θ) : Une fonction de score indiquant à quel point (X,Y) s'adapte au modèle

Comme il est évident d'après la formule, le modèle génératif utilise la distribution binomiale des données pour dériver le contexte et les motifs au sein des données elles-mêmes, tandis que le modèle discriminatif calcule rapidement la probabilité de classe avec une cartographie mentale et une classification passée.

Vous voulez en savoir plus sur Logiciel d'étiquetage de données ? Découvrez les produits Étiquetage des données.

Types de modèles génératifs

Que vous cherchiez à créer une nouvelle sortie entièrement ou à analyser des données existantes détermine le type de modèle que vous utilisez.

Les modèles génératifs sont mieux adaptés aux applications qui nécessitent une nouvelle sortie. Les exemples les plus courants sont décrits ici.

  • Réseaux bayésiens, également connus sous le nom de réseau de Bayes, utilisent des graphes acycliques dirigés (DAG) pour calculer des probabilités ou détecter des anomalies dans les données. Ils tirent des inférences bayésiennes, un type de prédiction statistique qui met à jour la probabilité d'une hypothèse à mesure que plus d'informations deviennent disponibles. Comme le modèle génératif crée de nouvelles sorties basées sur les données d'entraînement, ces nouvelles données sont ensuite réinjectées dans l'algorithme pour continuer à évaluer les motifs. Cela permet au modèle de créer des probabilités plus probables à mesure que plus de données sont examinées.
  • Modèles génératifs d'autorégression sont principalement utilisés pour la modélisation de séries temporelles, où les corrélations entre les comportements passés dans les données sont utilisées pour prédire le comportement futur. L'autorégression est particulièrement utile dans un certain nombre d'industries, avec des applications comme les prévisions de chiffres de vente ou la stratégie d'investissement.
  • Réseaux antagonistes génératifs (GANs) utilisent à la fois la modélisation générative et discriminative dans le cadre du modèle génératif plus large. Le générateur s'entraîne initialement et produit de nouveaux points de données au fil du temps. Ces sorties sont ensuite introduites dans le sous-modèle discriminatif pour classer quelles parties des données générées sont réelles ou fausses.
  • Naive Bayes : Naive Bayes est une méthode probabiliste simple qui classe les nouvelles données d'entrée en comparant ses caractéristiques ou attributs indépendants à la distribution de probabilité précédente. Elle est entièrement basée sur le "théorème de Bayes" et est une méthode populaire pour classer de petits ensembles de données.
  • Champ aléatoire de Markov : Le champ aléatoire de Markov représente la probabilité conjointe des variables en utilisant des graphes techniques où les variables sont des nœuds et les arêtes peuvent indiquer les dépendances au sein des données. C'est un algorithme courant utilisé pour le traitement du langage naturel et la modélisation de grands langages.
  • Modèle de Markov caché : Un modèle de Markov caché est un algorithme statistique pour interpréter et classer des données séquentielles où la sortie dépend d'états cachés. Il capture la bonne classe via un état caché et une fonction d'activation qui détermine la bonne classe.
  • Allocation de Dirichlet latente : Ce modèle génératif est utilisé pour la modélisation de sujets. Il suppose que les documents sont un mélange de sujets, génère des probabilités pour différents sujets et attribue des probabilités à chaque sujet avant de l'assigner à une catégorie spécifique.

Types de modèles discriminatifs

Les modèles discriminatifs sont plus appropriés pour analyser des données existantes que pour créer une nouvelle sortie. Ils utilisent ces informations pour déterminer les frontières entre les catégories ou les objets dans les textes et les images. Cela permet aux utilisateurs d'identifier à la fois les motifs et les anomalies dans de grands ensembles de données.

Par exemple, les informations saisies dans un modèle discriminatif peuvent séparer les données de notes universitaires en catégories Réussite ou Échec en fonction de l'étiquetage des données précédentes. Les types les plus courants sont définis ici.

  • Régression logistique est un modèle linéaire simple utilisé pour la classification binaire entre deux groupes distincts dans les données. Les valeurs des données d'entrée doivent aboutir à une sortie comprise entre 0 et 1. Par exemple, les banques pourraient utiliser la régression logistique pour prédire si une transaction par carte était authentique (0) ou frauduleuse (1) – il n'y a que deux résultats possibles dans l'analyse des données, et rien de nouveau n'est créé. Le modèle évalue simplement les relations entre les points de données d'entrée.
  • Arbres de décision sont également utilisés pour le travail de classification. Ces modèles utilisent une structure "si ceci, alors cela" pour créer des branches de résultats possibles basés sur certains choix. L'arbre divise progressivement les données en groupes de plus en plus petits en fonction des attributs de chaque point de données individuel. L'arbre continue de se ramifier, avec de moins en moins de données dans chaque branche à mesure que l'arbre progresse jusqu'à ce que les données ne puissent plus être divisées davantage.
  • Machines à vecteurs de support (SVM) peuvent être appliquées à la fois au travail de classification et de régression. Les frontières de deux points de données créent un espace vide entre eux connu sous le nom de vecteur de support ou marge. C'est comme une zone tampon entre deux objets ou points de données, donc plus la marge est grande, mieux le modèle est capable d'identifier ceux-ci comme deux classes distinctes. Les SVM ont de nombreuses applications, allant des logiciels de reconnaissance faciale à l'analyse des sentiments.
  • Réseaux neuronaux (pour la classification) : Les réseaux neuronaux traitent principalement le texte séquentiel en stockant l'entrée dans un état caché et en déclenchant le bon nœud de sortie dans l'état suivant en fonction de l'entrée précédente. Le type de réseau neuronal le plus populaire est le réseau neuronal artificiel (ANN), les RNN et les CNN.

Les modèles discriminatifs sont largement utilisés pour la classification d'images et la détection d'objets en apprentissage automatique, car ils utilisent de grands réseaux neuronaux qui imitent la compréhension humaine pour identifier les qualités d'une image. Ils peuvent également être utilisés pour des tâches de traitement du langage naturel (NLP) comme l'analyse des sentiments et les revues de traduction multilingue.

Algorithmes supplémentaires de modèles discriminatifs

  • K plus proches voisins : K plus proches voisins est une technique supervisée où la classe d'un point de données est calculée en fonction de la frontière de décision de "K" points de données qui lui sont proches. La classe des "K" points a un potentiel élevé et lui est attribuée.
  • Champ aléatoire conditionnel : Les champs aléatoires conditionnels sont des modèles discriminatifs pour les tâches de prédiction structurée. Ils créent un graphe non dirigé pour capturer les dépendances, corréler les caractéristiques et générer des étiquettes pour les séquences.
  • Forêt aléatoire : L'algorithme de forêt aléatoire regroupe plusieurs arbres de décision pour entraîner l'algorithme sur toutes les plages d'entrée possibles et générer une sortie pour de grands ensembles de données ou des clusters d'images.

Industries qui utilisent des modèles génératifs

Avec les modèles génératifs créant de nouvelles sorties, les industries qui disposent déjà d'une grande quantité de données peuvent les utiliser de diverses manières pour rendre leur travail plus productif et efficace.

Santé

Le domaine médical doit surmonter de nombreux défis pour sauver la vie des patients. Les outils d'intelligence artificielle (IA) prédictive et générative aident les professionnels de la santé à rendre compte des images, à découvrir de nouveaux médicaments grâce à des recherches synthétisées et à personnaliser le traitement des patients en fonction de leurs besoins et de leur historique médical.

Les modèles génératifs peuvent également donner aux médecins et aux pharmaciens plus de temps dans leur journée en simplifiant et en automatisant des tâches telles que la transcription des notes des patients et la synthèse des informations des patients pour examen.

Marketing

Dans le monde de la publicité, les marketeurs utilisent des modèles génératifs pour créer des campagnes qui atteignent de nouveaux marchés. Des tâches telles que la rédaction de descriptions de produits ou la création de balises d'images optimisées pour les moteurs de recherche (SEO) prennent beaucoup de temps, mais les outils d'IA générative peuvent accélérer ce processus et laisser les équipes passer plus de temps sur le développement de stratégies. Les modèles d'IA peuvent également créer des recommandations personnalisées pour les clients en fonction des données sur leurs expériences précédentes.

Fabrication

Les ingénieurs et les fabricants peuvent accélérer leur processus de conception en utilisant des outils d'IA générative pour créer de nouvelles idées qui s'inscrivent dans les contraintes d'un projet et correspondent à des projets similaires réalisés dans le passé.

Les modèles génératifs peuvent également être utilisés pour suivre les besoins de maintenance en cours pour les équipements en fonction des données historiques et alerter les équipes des problèmes potentiels avant qu'une machine ne tombe en panne.

Médias

Les nouveaux médias, comme le contenu visuel et audio, peuvent être produits à l'aide d'outils génératifs. Les entreprises de sport ou d'événements en direct peuvent facilement créer des résumés de moments forts avec l'IA générative pour donner aux fans des informations plus rapidement que lorsque les humains seuls font le travail.

Pour les agences de presse et les publications en ligne qui gèrent des milliers de données et de contenus, l'IA générative peut faciliter la localisation et la mise à jour des fichiers existants.

Industries qui utilisent des modèles discriminatifs

Bien que les modèles discriminatifs ne créent pas eux-mêmes de nouvelles données, ils ont encore de nombreuses utilisations. De nombreuses industries bénéficient de ces outils pour améliorer la prise de décision de l'entreprise et améliorer leurs performances commerciales.

Vente au détail et commerce électronique

Lorsque vous êtes un vendeur, vous devez comprendre les tendances du marché et l'impact potentiel qu'elles ont sur les ventes futures, que ce soit en ligne ou dans un magasin physique. En utilisant des modèles discriminatifs, les propriétaires d'entreprise peuvent prendre des données historiques précédentes et faire des prédictions plus précises sur ce à quoi ressembleront les revenus.

Les modèles discriminatifs simplifient les décisions proactives qui affectent le résultat net de votre entreprise. Vous pouvez mieux optimiser vos stratégies de produits, comme prédire la saisonnalité et la popularité des produits, ainsi que mieux comprendre le comportement des clients.

Publicité et marketing

Vendre des produits et des services nécessite une compréhension de la façon dont les clients pensent et se comportent. En utilisant des données existantes dans un modèle discriminatif, les marketeurs peuvent segmenter les clients en fonction des motifs de leur comportement et créer des campagnes ciblées autour de cette segmentation.

Par exemple, les clients qui appartiennent à la catégorie des parents pourraient recevoir un marketing ciblé pour les ventes de rentrée scolaire, augmentant ainsi la probabilité qu'ils effectuent un achat car la publicité s'adresse à leur situation.

Finance

Bien que la finance soit encore considérée comme une industrie traditionnelle, son fonctionnement interne évolue rapidement pour rattraper la technologie, y compris l'utilisation de modèles d'IA discriminatifs. Les financiers ont rendu la modélisation prédictive populaire, principalement lorsqu'elle se concentre sur les prévisions concernant les actions ou les taux d'intérêt en utilisant des données passées et des rapports économiques.

Les professionnels de la finance s'appuient également sur l'analyse prédictive pour examiner les données de traduction afin de trouver des anomalies qui pourraient indiquer une activité frauduleuse ou déterminer les niveaux de risque.

Véhicules et machines autonomes

La modélisation discriminative est particulièrement utile dans les véhicules autonomes, car elle peut identifier les frontières des objets dans la classification et l'étiquetage des images. Comprendre les objets dans le monde réel, en temps réel, maintient les passagers et les piétons en sécurité et permet aux véhicules autonomes de cartographier avec précision le monde qui les entoure grâce à la modélisation prédictive basée sur l'image.

Modèle génératif vs. modèle discriminatif : avantages et défis

L'IA générative en est encore à ses débuts, donc les utilisateurs ne devraient pas s'attendre à trop de ces outils au départ. Si la précision est une priorité, les modèles discriminatifs vous conviendront mieux. Mais d'autres types de modèles d'IA présentent des défis importants.

Précision et fiabilité

La nouveauté des modèles génératifs signifie qu'ils créent souvent des données inexactes lorsque des problèmes existent dans le jeu de données. Nous ne devrions jamais nous fier entièrement à ces outils en raison du potentiel d'inexactitude que les données non étiquetées et non supervisées ont. Les modèles discriminatifs ont leurs propres défauts mais sont généralement plus fiables et précis car ils n'utilisent que des données étiquetées.

Confidentialité

La confidentialité dans la modélisation de l'IA peut être un problème avec les deux types, mais surtout pour les génératifs. Si du contenu privé ou sensible au sein des ensembles d'entraînement est utilisé pour créer de nouvelles sorties, la sécurité des données originales pourrait être compromise.

Biais et transparence

Le biais présente un défi particulièrement difficile pour l'IA générative. Chaque fois que les ensembles d'entraînement ont un biais ou manquent de transparence sur la façon dont l'algorithme a été construit, les sorties créées par ces modèles hériteront des biais implicites des données sur lesquelles ils ont été entraînés. Établir des politiques pour contrôler cela autant que possible est essentiel lors de la création d'un nouveau modèle génératif.

Étiquetez d'abord ; puis qualifiez

Alors que les modèles génératifs offrent des fonctionnalités pour prédire les tendances courantes et classer les futurs jetons, les modèles discriminatifs regroupent intelligemment les données en créant des cartes mentales. Ces deux techniques sont adoptées pour traiter de plus grands ensembles de données séquentielles et créer des vagues dans des industries comme le marketing, la santé, la banque ou le commerce de détail. Ces algorithmes s'amélioreront en performance et pourront être déployés dans des secteurs industriels plus larges pour atteindre des degrés de précision plus élevés.

Explorez comment les réseaux neuronaux récurrents sont utilisés pour traiter des données séquentielles et générer des réponses cohérentes pour des requêtes textuelles.

Holly Landis
HL

Holly Landis

Holly Landis is a freelance writer for G2. She also specializes in being a digital marketing consultant, focusing in on-page SEO, copy, and content writing. She works with SMEs and creative businesses that want to be more intentional with their digital strategies and grow organically on channels they own. As a Brit now living in the USA, you'll usually find her drinking copious amounts of tea in her cherished Anne Boleyn mug while watching endless reruns of Parks and Rec.