Aprendizaje supervisado

En el aprendizaje supervisado, el agente observa pares de datos de entrada y salida, por lo tanto, sirve para aprender una función que modele la salida según la entrada.

Por consiguiente tenemos dos tipos de problemas en el aprendizaje supervisado, los problemas de regresión y los problemas de clasificación.

Problemas de aprendizaje supervisado

La regresión lineal

Es un algoritmo de aprendizaje supervisado que se utiliza en Machine Learning.

En estadísticas, regresión lineal es una aproximación para modelar la relación entre una variable escalar dependiente «y» y una o más variables explicativas nombradas con «X».

Recordemos rápidamente la fórmula de la recta:

Y = mX + b

Donde Y es el resultado, X es la variable, m la pendiente (o coeficiente) de la recta y b la constante o también conocida como el «punto de corte con el eje Y»

La Regresión Lineal puede ser simple si solo existe una variable independiente, o múltiple si existe más de una.

Este modelo es rápido y robusto, pero para asegurar su buen funcionamiento debe haber cierta relación lineal entre la entrada y la salida.

Un ejemplo de Regresión Lineal simple es predecir el número de paraguas que se venderán en función de la cantidad de lluvia según el histórico del año anterior.

Aprendizaje supervisado
Aprendizaje supervisado

La Regresión Polinomial

Trata de encontrar un polinomio de grado «n» que se ajuste a la distribución de datos mediante una curva.

Es útil cuando la Regresión Lineal no es capaz de ajustarse lo suficiente a los datos debido a algún tipo de no linealidad entre ellos.

Los modelos polinomiales ganan mucha flexibilidad con respecto a los lineales, ya que en función del grado del polinomio se obtienen curvas más o menos ajustadas.

Por ejemplo, la demanda horaria de energía en función de la temperatura exterior sigue un comportamiento no lineal que se ajusta con un polinomio de grado cuatro

La regresión polinomial es importante en el aprendizaje supervisado

Regresión Logística

Es un algoritmo de clasificación empleado para predecir el resultado de una variable categórica binaria en función de las variables independientes.

Medir el signo de dicha relación y predecir la probabilidad de que se produzca el suceso Y=1 en función de los valores de las variables independientes.

Ejemplos clásicos:

  • Clasificar si el correo que llega es Spam o No es Spam
  • Dados unos resultados clínicos de un tumor clasificar en «Benigno» o «Maligno».
  • El texto de un artículo a analizar es: Entretenimiento, Deportes, Política ó Ciencia
  • A partir de historial bancario conceder un crédito o no

Es importante tener en cuenta que, aunque la regresión logística permite clasificar, se trata de un modelo de regresión que modela el logaritmo de la probabilidad de pertenecer a cada grupo.

La asignación final se hace en función de las probabilidades predichas.

La regresión Logística nos ayudará en el aprendizaje supervisado

K-vecinos más cercanos

Es un algoritmo de clasificación que etiqueta a cada dato en función de la etiqueta que tengan los datos más próximos a él.

Por lo tanto, se define la variable k, que corresponde al número de vecinos más cercanos que se escogen para llevar a cabo la clasificación.

En función de esta variable se tienen unas predicciones u otras.

Es un método que simplemente busca en las observaciones más cercanas a la que se está tratando de predecir.

Por consiguiente clasifica el punto de interés basado en la mayoría de datos que le rodean.

¿Dónde se aplica?

Aunque sencillo, se utiliza en la resolución de multitud de problemas, como en sistemas de recomendación, búsqueda semántica y detección de anomalías.

3 comentarios en «Aprendizaje supervisado»

Deja un comentario