Data Science| Modelo de Clustering

Geekscoach
2 min readAug 28, 2020

Estos modelos supervisado tiene como finalidad agrupar nuestra información, crear clusters, tomando características similares.

Antes de continuar, es importante hacer la distinción entre clasificar y agrupar …. no es lo mismo.

Clasificar es un método supervisado e implica identificar y usar dentro de nuestro dataset el resultado (variable dependiente). A esto se le llama labeled dataset.

La columna Defaulted es nuestra variable dependiente

Agrupar, es un método no supervisado y no se indica cual es la variable dependiente.

En este caso Defaulted no se marca como variable dependiente

Los métodos de clustering se ocupan para:

  • Identificar patrones de compra.
  • Recomendaciones
  • Detección de fraude bancario.
  • Seguros de riesgos.

Por ultimo les dejo una imagen con alguno de los tipos de modelos que hay para clustering.

👏Gracias por tu tiempo …para leer esta historia 👍

👀También puedes seguirme en YouTube como Geeks Coach

--

--