Máquinas de Vectores de Soporte

Las máquinas de vectores de soporte son muy populares en aplicaciones como el procesamiento del lenguaje natural, el habla, el reconocimiento de imágenes y la visión artificial.

Es un algoritmo de aprendizaje supervisado que se puede emplear para clasificación binaria o regresión.

Algoritmos de Clasificación

Se usan cuando el resultado deseado es una etiqueta discreta, en otras palabras, son útiles cuando la respuesta al problema cae dentro de un conjunto finito de resultados posibles.

Algoritmos de Regresión

Por otro lado, la regresión es útil para predecir productos que son continuos, eso significa que la respuesta a su pregunta se presenta mediante una cantidad que puede determinarse de manera flexible en función de las entradas del modelo en lugar de limitarse a un conjunto de etiquetas.

Máquinas de vectores de soporte (SVM)

Es un algoritmo de aprendizaje supervisado que se puede emplear para clasificación binaria o regresión.

Las máquinas de vectores de soporte son muy populares en aplicaciones como el procesamiento del lenguaje natural, el habla, el reconocimiento de imágenes y la visión artificial.

Se basa en el concepto de planos de decisión que definen los límites de decisión.

Un plano de decisión o hiperplano es uno que realiza una separación entre un conjunto de objetos que tienen diferentes membresías de clase, es decir, de diferentes grupos.

Hiperplano Máquina de vectores de soporte
Hiperplano Máquina de vectores de soporte

Clasificación óptima con máquinas de vectores de soporte

Con dos dimensiones es fácil entender lo que está haciendo, sin embargo, los problemas de aprendizaje automático tienen muchísimas dimensiones.

Así que en vez de encontrar la línea óptima, el SVM encuentra el hiperplano que maximiza el margen de separación entre clases.

Los vectores de soporte son los puntos que definen el margen máximo de separación del hiperplano que separa las clases.

Se llaman vectores, en lugar de puntos, porque estos «puntos» tienen tantos elementos como dimensiones tenga nuestro espacio de entrada.

Es decir, estos puntos multi-dimensionales se representan con vector de n dimensiones.

Máquinas de vectores de soporte
Máquinas de vectores de soporte

Regularización máquinas de vectores de soporte

Es bastante frecuente que los datos tenga ruido, que no estén etiquetados perfectamente o que el problema sea tan difícil.

Que para unos pocos puntos, sea muy complicado clasificarlos correctamente. Para controlar la cantidad de regularización, podemos usar el hiper-parámetro C

El truco de Kernel en máquinas de vectores de soporte

Hay veces en las que no hay forma de encontrar un hiperplano que permita separar dos clases., es por eso que en estos casos decimos que las clases no son linealmente separables.

Para resolver este problema podemos usar el truco del kernel

El truco de Kernel
El truco de Kernel

Aplicaciones de las máquinas de vectores de soporte

Algunos casos de éxito son:

  • Reconocimiento óptico de caracteres
  • Detección de caras para que las cámaras digitales enfoquen correctamente
  • Filtros de spam para correo electrónico
  • Reconocimiento de imágenes a bordo de satélites (saber qué partes de una imagen tienen nubes, tierra, agua, hielo, etc.)

Ventajas y desventajas de máquinas de vectores de soporte

Las ventajas que podemos nombrar son:

  • Efectivo en espacios de altas dimensiones.
  • Sigue siendo efectivo en casos donde el número de dimensiones es mayor que el número de muestras.
  • Utiliza un subconjunto de puntos de entrenamiento en la función de decisión (llamados vectores de soporte), por lo que también es eficiente en la memoria.
  • Versátil: se pueden especificar diferentes funciones de Kernel para la función de decisión, se proporcionan núcleos comunes, pero también es posible especificar núcleos personalizados.

Las desventajas de las máquinas de vectores de soporte incluyen:

  • Si el número de características es mucho mayor que el número de muestras, evite el ajuste excesivo al elegir las funciones del núcleo y el término de regularización es crucial.
  • Los SVM no proporcionan directamente estimaciones de probabilidad, estas se calculan utilizando una costosa validación cruzada de cinco veces.

Resumen

Las Máquinas de Vectores de Soporte (Support Vector Machines) permiten encontrar la forma óptima de clasificar entre varias clases.

La clasificación óptima se realiza maximizando el margen de separación entre las clases. Los vectores que definen el borde de esta separación son los vectores de soporte.

En el caso de que las clases no sean linealmente separables, podemos usar el truco del kernel para añadir una dimensión nueva donde sí lo sean.

1 comentario en «Máquinas de Vectores de Soporte»

Deja un comentario