Técnicas de agrupamiento – Clustering

Las técnicas de agrupamiento – Clustering están dentro de la familia del aprendizaje no supervisado, este tiene lugar cuando no se dispone de datos “etiquetados” para el entrenamiento.

Sólo conocemos los datos de entrada, pero no existen datos de salida que correspondan a un determinado input.

El aprendizaje no supervisado está estrechamente alineado con la inteligencia artificial,

Da la idea de que una computadora pueda aprender a identificar procesos y patrones complejos sin un humano.

CLASIFICACIÓN DE APRENDIZAJE NO SUPERVISADO

El aprendizaje no supervisado paramétrico

Implica la construcción de modelos de mezclas gaussianas y el uso del algoritmo de maximización de expectativas para predecir la clase de la muestra en cuestión.

Aprendizaje no supervisado no paramétrico

Este método se usa comúnmente para modelar y analizar datos con pequeños tamaños de muestra.

A diferencia de los modelos paramétricos, los modelos no paramétricos no requieren que el modelador haga suposiciones sobre la distribución de la población.

Ya que a veces se los conoce como un método libre de distribución.

APRENDIZAJE NO SUPERVISADO – CLUSTERING

Los tipos de algoritmo más habituales en técnicas de agrupamientoClustering, aprendizaje no supervisado son:

  1. Algoritmos de clustering
  2. Análisis de componentes principales
  3. Descomposición en valores singulares
  4. Análisis de componentes principales

Técnicas de agrupamiento – Clustering

El clustering como método de aprendizaje no supervisado tiene como objetivo clasificar en grupos atendiendo a las variables de los datos.

técnicas de agrupamiento - Clustering
Algoritmo de clustering
Clustering

Clustering ejemplo: agrupar casas según sus características

  • Clases existentes: ?
  • Una vez que descubrimos los grupos podemos asignarles nombres. Ej. Estándar, Lujosa, Precaria
  • Características: Área del terreno, área construida, nro de habitaciones, nro de baños.
  • Obtenemos observaciones/puntos (casas en lugares cercanos)
  • Es útil representar gráficamente los datos
  • Para observar que grupos son los que se forman naturalmente

¿Cómo hacemos clustering? – proceso

Obtenemos puntos de entrenamiento

  • Buscamos las características de casas en el mismo vecindario
  • Le asignamos una clase (sólo para medir resultados)

Graficamos los puntos en un plano cartesiano

  • Aquí podemos observar como están distribuidos los grupos, para elegir el mejor modelo de clustering
  • Definimos el número de grupos presente (si la técnica los requiere)
  • Si tenemos más de dos características, debemos usar alguna técnica de reducción de dimensionalidad

Aplicamos el algoritmo de clustering sobre los puntos y encontramos los grupos
Medimos los resultados obtenidos

Clasificación de clustering

Según la forma en que los clusters se relacionan entre sí

Clustering Duro: donde cada objeto pertenece a un solo cluster, por lo que los clusters pasarían a ser algo como una partición de un dataset.

Clustering Blando (o difusa): donde los objetos pertenecen a los clusters según un grado de confianza (o grado de pertenencia).

Según la forma en que los clusters se relacionan entre sí

Partición estricta: cada objeto pertenece exactamente a un cluster.

Partición estricta con outliers: puede haber objetos que no pertenecen a ningún cluster (los outliers).

Clustering con superposiciones: un objeto puede pertenecer a más de un cluster.

Clustering Jerárquico: Los clusters se ordenan jerárquicamente de forma que los objetos que pertenecen a un cluster, debido que también pertenecen a su cluster padre.

Aplicaciones técnicas de agrupamiento – Clustering

Posibles aplicaciones de técnicas de agrupamientoClustering:

Marketing, para segmentar el mercado en pequeños grupos homogéneos donde realizar campañas publicitarias específicas.

Biología, para dividir organismos en estructuras jerárquicas, con el propósito, de describir la diversidad biológica.

Medicina, para diseñar tratamientos específicos para distintos grupos de riesgo.

Psicología, para clasificar individuos en distintos tipos de personalidad, etc.

1 comentario en «Técnicas de agrupamiento – Clustering»

Deja un comentario