Métodologías de Clasificación

Retos

 

Cuando se gestionan grandes volúmenes de datos es importante poderlos clasificar de forma que aporten información de valor para un objetivo de negocio determinado.

Enfoque

 

Los algoritmos de segmentación resuelven la problemática de asignar los individuos del universo de estudio a un conjunto de clusters  o segmentos de características similares.

Existen diferentes técnicas dependiendo de la problemática: si se conoce el conjunto de segmentos en los cuales hay que clasificar la muestra de estudio, o si ese conjunto de segmentos es desconocidos y hay que estimarlo.

Grupo AIA dispone de diferentes metodologías y algoritmos para la segmentación automatizada:

  • Aprendizaje Supervisado
  • Segmentación Supervisada
  • Segmentación Semisupervisada
  • Segmentación No Supervisada

Aprendizaje Supervisado

EVA, es una herramienta de aprendizaje supervisado que, a través de un diálogo generado por el propio sistema en el que el experto únicamente debe seleccionar una de las dos opciones presentadas, captura el criterio de decisión utilizado. Como resultado genera un discriminante lineal con los pesos relativos de cada variable relevante, capaz de imitar el comportamiento del experto.

Segmentación Supervisada

Los algoritmos de segmentación supervisada necesitan de un conjunto de datos conocidos (etiquetados) para clasificar el universo de individuos. Son los llamados algoritmos con target conocido, los cuales, en base a un conocimiento a-priori de los segmentos de clasificación, clasifican el conjunto de datos.

Se aplican técnicas de optimización para el conjunto de individuos conocidos y se extrapola al universo de individuos no conocido.

 

Segmentación No Supervisada

Los algoritmos de segmentación no supervisada se aplican cuando el conjunto de segmentos de clasificación no es conocido, y por tanto debe ser estimado sobre el universo completo de individuos. Se trata de algoritmos con un target desconocido, es decir, no se tiene conocimiento a-priori acerca del número o tipo de segmentos en los que se clasificará el universo de individuos.

Metodologías própias :

ADAN, herramienta de aprendizaje automático para la agrupación conceptual de datos

Otras de las técnicas usadas por Grupo AIA son:

  • k-means
  • k-medoid
  • Manhattan distance
  • Binary Divisive Partitioning

 

Segmentación Semisupervisada

Los algoritmos de segmentación Semisupervisada parten de la premisa de que es más fácil y menos costoso obtener información sin etiquetar que etiquetada. Este tipo de algoritmos proporcionan un método matemático para etiquetar todo el universo de individuos en base a un conjunto menor de datos etiquetado.

Los algoritmos de segmentación semisupervisada convierten el trabajo sobre una muestra representativa del universo de individuos con datos reales en un trabajo sobre el total del universo de individuos con datos estimados.

Algunos de los algoritmos que Grupo AIA usa en este tipo de problemática son:

  • Generative Models
  • S3VMs
  • Co-Training
  • MultiView Algorithms

Beneficios

 

  •  Permiten analizar y manipular grandes volúmenes de datos y extraer información que pasaría desapercibida de otra forma
  • Ayuda en el proceso de toma de decisiones, agrupando colectivos de información en grupos con tendencias similares.
  • Permite detectar comportamientos diferenciados entre individuos en base a variables de negocio establecidas.

Casos de Éxito

 

Grupo AIA ha aplicado con éxito algoritmos de segmentación en diferentes áreas:

  • Scoring de Crédito
  • Interpretación de Electrocardiogramas
  • Detección de patrones bancarios
  • Comportamientos de mercado
  • Clasificación de individuos por parámetros sociodemográficos
  • Clasificación de comportamientos en base a la demanda energética.