Con el auge del aprendizaje profundo, algoritmos más nuevos como los modelos generativos y discriminativos se han convertido en el tema del mercado. Mientras que los modelos generativos y discriminativos se están integrando con varios dominios de aplicación, el valor matemático latente de estas técnicas de aprendizaje automático puede transformar drásticamente su ciclo de vida de generación de productos. Como experto en aprendizaje automático, las principales anomalías raíz están relacionadas con la gestión de bases de datos incompatibles, el almacenamiento insuficiente y el etiquetado incorrecto que conduce a fallos y errores.
Explorar modelos generativos y discriminativos y comprender sus aplicaciones en la tecnología de aprendizaje profundo construiría una curva de aprendizaje y le ayudaría a tomar una decisión informada sobre cuál elegir para sus datos privados y sensibles. Evaluar estas opciones dentro del software de etiquetado de datos puede ser una forma rápida de gestionar grandes volúmenes, optimizar el almacenamiento y construir procesos de modelado predictivo robustos.
Aprendamos sobre estas dos técnicas predominantes de aprendizaje automático y exploremos las sutilezas de ambas.
¿Cuál es la diferencia entre los modelos generativos y discriminativos?
Los modelos generativos son una estrategia no supervisada para predecir categorías para datos no etiquetados. Forma grupos para nuevos puntos de datos y evalúa la probabilidad basada en el comportamiento pasado. El modelo discriminativo, por otro lado, es una técnica de aprendizaje supervisado que calcula estimaciones de probabilidad y la máxima verosimilitud de que un punto de datos pertenezca a una categoría particular.
A medida que la IA generativa avanza aún más, se están experimentando nuevas formas de predicciones de datos en todas las industrias. Los modelos generativos y discriminativos están en una liga propia, pero siguen diferentes métodos de manipulación y análisis de datos para predecir resultados.
Cómo funcionan los modelos generativos y discriminativos
Cuando se le da a los algoritmos grandes cantidades de datos para entrenar un modelo generativo, se utiliza para ayudar al algoritmo a identificar estructuras y patrones que ayudarán a crear nuevas salidas. El modelo generativo aprende la distribución de probabilidad de estos patrones y luego genera nuevas salidas que se asemejan al conjunto de datos original. Incluso si los datos no están etiquetados, los modelos generativos aún pueden distinguir los patrones en los datos y crear salidas similares.
Para los modelos discriminativos, los datos no etiquetados son un desafío mucho mayor. Los modelos discriminativos necesitan etiquetas para entender dónde están los límites entre tipos de datos, clases o categorías. Por ejemplo, una imagen que muestra un perro, un gato, una pelota y un árbol necesita tener etiquetas en cada uno de estos elementos para que el modelo distinga los límites de estos objetos. Estos modelos son más fáciles de crear que los modelos generativos porque pueden trabajar eficazmente con cantidades más pequeñas de datos de entrenamiento y etiquetado de límites simples.
Fórmula para el modelo generativo
El modelo generativo se centra en aprender del comportamiento pasado del modelo y reutilizar eso para predecir nuevas categorías para nuevos puntos de datos. Principalmente utilizado en el aprendizaje no supervisado, es muy vital para el análisis de sentimientos, la detección de anomalías, la detección de spam y la reducción de ruido.
Fórmula para el modelo generativo:
P (X,Y) = P(Y) x P(X | Y)
P (Y) → Distribución de datos pasados sobre etiquetas.
P (X | Y) → Verosimilitud de los datos X dado la etiqueta Y
Fórmula para el modelo discriminativo
El modelo discriminativo solo se centra en los límites de decisión para asignar etiquetas rápidamente a los conjuntos de datos utilizando una técnica de "fisión". Sin embargo, el modelo discriminativo a veces necesita ser verificado dos veces para evitar "clasificaciones erróneas".
Fórmula para el modelo generativo:
Objetivo: Modelar directamente la probabilidad P (Y | X) centrándose en los límites de decisión y no en la distribución de datos.
P (Y | X; θ) = exp (f( X, Y, θ)) / Σ y' exp (X, Y'; θ)
Aquí,
θ → Parámetros del modelo
f (X, Y, θ) : Una función de puntuación que indica qué tan bien (X,Y) se ajusta al modelo
Como es evidente en la fórmula, el modelo generativo utiliza la distribución de datos binominal para derivar contexto y patrones dentro de los datos mismos, mientras que el modelo discriminativo calcula la probabilidad de clase rápidamente con mapeo mental y clasificación pasada.
¿Quieres aprender más sobre Software de etiquetado de datos? Explora los productos de Etiquetado de datos.
Tipos de modelos generativos
Ya sea que esté buscando crear una nueva salida por completo o analizar datos existentes, determina qué tipo de modelo usar.
Los modelos generativos son más adecuados para aplicaciones que requieren una nueva salida. Los ejemplos más comunes se describen aquí.
- Redes bayesianas, también conocidas como Red de Bayes, utilizan gráficos acíclicos dirigidos (DAG) para calcular probabilidades o detectar anomalías en los datos. Extraen inferencias bayesianas, un tipo de predicción estadística que actualiza la probabilidad de una hipótesis a medida que se dispone de más información. A medida que el modelo generativo crea nuevas salidas basadas en los datos de entrenamiento, estos nuevos datos se vuelven a introducir en el algoritmo para seguir evaluando patrones. Esto permite que el modelo cree probabilidades más probables a medida que se revisan más datos.
- Modelos generativos de autorregresión se utilizan principalmente para el modelado de series temporales, donde las correlaciones entre comportamientos pasados en los datos se utilizan para predecir el comportamiento futuro. La autorregresión es particularmente útil en varias industrias, con aplicaciones como predicciones de cifras de ventas o estrategias de inversión.
- Redes generativas adversarias (GANs) utilizan tanto el modelado generativo como el discriminativo como parte del modelo generativo más amplio. El generador inicialmente entrena y produce nuevos puntos de datos con el tiempo. Estas salidas se introducen luego en el submodelo discriminativo para clasificar qué partes de los datos generados son reales o falsas.
- Naive Bayes: Naive Bayes es un método probabilístico simple que clasifica nuevos datos de entrada comparando sus características o atributos independientes con la distribución de probabilidad anterior. Se basa completamente en el "teorema de Bayes" y es un método popular para clasificar conjuntos de datos más pequeños.
- Campo aleatorio de Markov: El campo aleatorio de Markov representa la probabilidad conjunta de variables utilizando gráficos técnicos donde las variables son nodos y los bordes pueden indicar las dependencias dentro de los datos. Es un algoritmo comúnmente utilizado para el procesamiento del lenguaje natural y el modelado de lenguaje a gran escala.
- Modelo oculto de Markov: Un modelo oculto de Markov es un algoritmo estadístico para interpretar y clasificar datos secuenciales donde la salida depende de estados ocultos. Captura la clase correcta a través del estado oculto y la función de activación que determina la clase correcta.
- Asignación de Dirichlet latente: Este modelo generativo se utiliza para el modelado de temas. Asume documentos como una mezcla de temas, genera probabilidades para diferentes temas y asigna probabilidades a cada tema antes de asignarlo a una categoría específica.
Tipos de modelos discriminativos
Los modelos discriminativos son más apropiados para analizar datos existentes que para crear una nueva salida. Utilizan esta información para determinar límites entre categorías u objetos en texto e imágenes. Esto permite a los usuarios identificar tanto patrones como anomalías en grandes conjuntos de datos.
Por ejemplo, la información ingresada en un modelo discriminativo puede separar los datos de calificaciones universitarias en categorías de Aprobado o Reprobado basándose en el etiquetado de datos anterior. Los tipos más comunes se definen aquí.
- Regresión logística es un modelo lineal simple utilizado para la clasificación binaria entre dos grupos distintos en los datos. Los valores de los datos de entrada deben resultar en una salida entre 0 y 1. Por ejemplo, los bancos podrían usar la regresión logística para predecir si una transacción con tarjeta fue genuina (0) o fraudulenta (1): solo hay dos posibles resultados en el análisis de datos, y no se está creando nada nuevo. El modelo simplemente está evaluando las relaciones entre los puntos de datos de entrada.
- Árboles de decisión también se utilizan para trabajos de clasificación. Estos modelos utilizan una estructura de "si esto, entonces aquello" para crear ramas de posibles resultados basados en ciertas elecciones. El árbol divide progresivamente los datos en grupos cada vez más pequeños basados en los atributos de cada punto de datos individual. El árbol continúa ramificándose, con menos piezas de datos en cada rama a medida que el árbol avanza hasta que los datos ya no pueden dividirse más.
- Máquinas de vectores de soporte (SVM) pueden aplicarse tanto a trabajos de clasificación como de regresión. Los límites de dos puntos de datos crean un espacio vacío entre ellos conocido como el vector de soporte o margen. Esto es como una zona de amortiguación entre dos objetos o puntos de datos, por lo que cuanto mayor sea el margen, mejor será el modelo para identificar estos como dos clases separadas. Las SVM tienen numerosas aplicaciones, desde software de reconocimiento facial hasta análisis de sentimientos.
- Redes neuronales (para clasificación): Las redes neuronales procesan principalmente texto secuencial almacenando la entrada en un estado oculto y activando el nodo de salida correcto en el siguiente estado de acuerdo con la entrada anterior. El tipo más popular de red neuronal es la red neuronal artificial (ANN), RNNs y CNNs.
Los modelos discriminativos se utilizan en gran medida para la clasificación de imágenes y la detección de objetos en el aprendizaje automático, ya que utilizan redes neuronales a gran escala que imitan la comprensión humana para identificar las cualidades de una imagen. También pueden usarse para tareas de procesamiento del lenguaje natural (NLP) como el análisis de sentimientos y las revisiones de traducción multilingüe.
Algoritmos adicionales de modelos discriminativos
- K vecino más cercano: K vecino más cercano es una técnica supervisada donde la clase de un punto de datos se calcula en función del límite de decisión de "K" puntos de datos que están cerca de él. La clase de "K" puntos tiene un alto potencial y se le asigna.
- Campo aleatorio condicional: Los campos aleatorios condicionales son modelos discriminativos para tareas de predicción estructurada. Crea un gráfico no dirigido para capturar dependencias, correlacionar características y generar etiquetas para secuencias.
- Bosque aleatorio: El algoritmo de bosque aleatorio agrupa múltiples árboles de decisión para entrenar el algoritmo en todos los posibles rangos de entrada y generar salida para grandes conjuntos de datos o grupos de imágenes.
Industrias que utilizan modelos generativos
Con los modelos generativos creando nuevas salidas, las industrias que ya tienen una gran cantidad de datos pueden usarlos de varias maneras para hacer su trabajo más productivo y eficiente.
Salud
El campo médico tiene que superar numerosos desafíos para salvar las vidas de los pacientes. Las herramientas de inteligencia artificial (IA) predictiva y generativa ayudan a los profesionales médicos a informar sobre imágenes, descubrir nuevos medicamentos a través de investigaciones sintetizadas y personalizar el tratamiento para los pacientes según sus necesidades e historial médico.
Los modelos generativos también pueden dar a los médicos y farmacéuticos más tiempo en su día al simplificar y automatizar tareas como transcribir notas de pacientes y resumir información de pacientes para su revisión.
Marketing
En el mundo de la publicidad, los especialistas en marketing utilizan modelos generativos para crear campañas que lleguen a nuevos mercados. Tareas como escribir descripciones de productos o crear etiquetas de imágenes optimizadas para motores de búsqueda (SEO) consumen un tiempo significativo, pero las herramientas de IA generativa pueden acelerar este proceso y dejar a los equipos capaces de dedicar más tiempo al desarrollo de estrategias. Los modelos de IA también pueden crear recomendaciones personalizadas para los clientes basándose en los datos sobre sus experiencias anteriores.
Manufactura
Los ingenieros y fabricantes pueden acelerar su proceso de diseño utilizando herramientas de IA generativa para crear nuevas ideas que se ajusten a las restricciones de un proyecto y coincidan con proyectos similares completados en el pasado.
Los modelos generativos también pueden usarse para rastrear las necesidades de mantenimiento continuo de equipos basándose en datos históricos y alertar a los equipos sobre posibles problemas antes de que una máquina falle.
Medios
Los nuevos medios, como el contenido visual y de audio, pueden producirse utilizando herramientas generativas. Las empresas de deportes o eventos en vivo pueden crear fácilmente resúmenes destacados con IA generativa para proporcionar información a los fanáticos más rápido que cuando los humanos hacen el trabajo solos.
Para los medios de comunicación y publicaciones en línea que gestionan miles de piezas de datos y contenido, la IA generativa puede facilitar mucho la localización y actualización de archivos existentes.
Industrias que utilizan modelos discriminativos
Aunque los modelos discriminativos no crean nuevos datos por sí mismos, todavía tienen muchos usos. Muchas industrias se benefician de estas herramientas para mejorar la toma de decisiones de la empresa y mejorar su rendimiento empresarial.
Venta al por menor y comercio electrónico
Cuando eres un vendedor, debes entender las tendencias del mercado y el impacto potencial que tienen en las ventas futuras, ya sea en línea o en una tienda física. Utilizando modelos discriminativos, los propietarios de negocios pueden tomar datos históricos anteriores y hacer predicciones más precisas sobre cómo se verá el ingreso.
Los modelos discriminativos simplifican las decisiones proactivas que afectan el resultado final de su negocio. Puede optimizar mejor sus estrategias de productos, como predecir la estacionalidad y la popularidad de los productos, así como obtener una mejor comprensión del comportamiento del cliente.
Publicidad y marketing
Vender productos y servicios requiere una comprensión de cómo piensan y se comportan los clientes. Utilizando datos existentes en un modelo discriminativo, los especialistas en marketing pueden segmentar a los clientes basándose en patrones en su comportamiento y crear campañas dirigidas en torno a esta segmentación.
Por ejemplo, los clientes que encajan en la categoría de padres podrían recibir marketing dirigido para ventas de regreso a clases, aumentando la probabilidad de que realicen una compra porque la publicidad se adapta a sus circunstancias.
Finanzas
Aunque las finanzas todavía se consideran una industria anticuada, su funcionamiento interno está cambiando rápidamente para ponerse al día con la tecnología, incluido el uso de modelos de IA discriminativos. Los financieros han hecho popular el modelado predictivo, principalmente cuando se centra en hacer pronósticos sobre acciones o tasas de interés utilizando datos pasados e informes económicos.
Los profesionales financieros también confían en el análisis predictivo para examinar datos de traducción para encontrar anomalías que puedan indicar actividad fraudulenta o determinar niveles de riesgo.
Vehículos y maquinaria autónomos
El modelado discriminativo es particularmente útil en vehículos autónomos, ya que puede identificar límites de objetos en la clasificación y etiquetado de imágenes. Comprender objetos en el mundo real, en tiempo real, mantiene a los pasajeros y peatones seguros y permite que los vehículos autónomos mapeen con precisión el mundo que los rodea con modelado predictivo basado en imágenes.
Modelo generativo vs. modelo discriminativo: beneficios y desafíos
La IA generativa sigue en su infancia, por lo que los usuarios no deberían esperar demasiado de estas herramientas inicialmente. Si la precisión es una prioridad, los modelos discriminativos le convendrán mejor. Pero otros tipos de modelos de IA vienen con desafíos significativos.
Precisión y fiabilidad
La novedad de los modelos generativos significa que a menudo crean datos inexactos cuando existen problemas en el conjunto de datos. Nunca deberíamos confiar completamente en estas herramientas debido al potencial de inexactitud que tienen los datos no etiquetados y no supervisados. Los modelos discriminativos tienen sus propios defectos, pero generalmente son más confiables y precisos ya que solo utilizan datos etiquetados.
Privacidad
La privacidad en el modelado de IA puede ser un problema con ambos tipos, pero especialmente para los generativos. Si el contenido privado o sensible dentro de los conjuntos de entrenamiento se utiliza para crear nuevas salidas, la seguridad de los datos originales podría verse comprometida.
Sesgo y transparencia
El sesgo presenta un desafío especialmente difícil para la IA generativa. Siempre que los conjuntos de entrenamiento tengan sesgo o carezcan de transparencia sobre cómo se ha construido el algoritmo, las salidas creadas por estos modelos heredarán los sesgos implícitos de los datos en los que han sido entrenados. Construir políticas para controlar esto tanto como sea posible es esencial al crear un nuevo modelo generativo.
Primero etiquetar; luego calificar
Si bien los modelos generativos ofrecen funcionalidades para predecir tendencias comunes y clasificar futuros tokens, los modelos discriminativos agrupan datos de manera inteligente creando mapas mentales. Ambas técnicas están siendo adoptadas para procesar conjuntos de datos secuenciales más grandes y crear ondas en industrias como el marketing, la salud, la banca o el comercio minorista. Estos algoritmos mejorarán en rendimiento y podrán desplegarse en sectores industriales más amplios para lograr mayores grados de precisión.
Explore cómo las redes neuronales recurrentes se utilizan para procesar datos secuenciales y generar respuestas coherentes para consultas textuales.

Holly Landis
Holly Landis is a freelance writer for G2. She also specializes in being a digital marketing consultant, focusing in on-page SEO, copy, and content writing. She works with SMEs and creative businesses that want to be more intentional with their digital strategies and grow organically on channels they own. As a Brit now living in the USA, you'll usually find her drinking copious amounts of tea in her cherished Anne Boleyn mug while watching endless reruns of Parks and Rec.
