Regresión Polinómial
En esta historia …. no cuento vemos que es una Regresión Polinómial y como calcularla con numpy y sklearn (scikit).
Es cuando la relación entre la variable dependiente e independiente(s) tiene una forma curva en una gráfica de dispersión.
Esta es la diferencia con la regresión lineal simple y multiple. En nuestra historia anterior hablamos de ello.
Una Regresión polinómial puede ser cuadrática, cubica o de mayor orden, entre mayor sea el exponente mayor la complejidad de la formula y por eso el uso de numpy es muy útil.
Para este ejemplo usaremos el rendimiento de millas por galón para pronosticar el precio de un auto.
Con numpy generamos un regresión de grado 3.
Realizando la gráfica de dispersión vemos como la relación entre las variables tiene una forma curva.
Realizando un regresión de grado 11 vemos como nuestro modelo se ajusta mejor a los datos.
- También existe otras formas de calcular usando sklearn.
Para eso se debe importa el módulo de PolynomialFeatures y despues solo hay que definir el grado que queremos generar.😉
- Por ultimo usaremos Pipelines, para ello importaremos dos módulos.
La ventaja de esta forma es que se normaliza la información.
Definimos los parámetros y creamos nuestro objeto Pipeline
Por ultimo alimentamos nuestro modelo, Z es el dataframe con las variables independientes y la variable dependiente es el precio “y”
Por ultimo hacemos la predicción.
- Adicional …
También se puede realizar una regresión lineal multiple
👏Gracias por tu tiempo … aplauso/comentario … follow se agradece 👍
👀También puedes seguirme en YouTube