Evaluación de modelo Regresión lineal
En esta historia …. no cuentos vamos a ver si el modelo de Regresión Lineal es el adecuado para contestar nuestras preguntas.
Veremos la evaluación para Regresión Lineal Simple:
- Gráfica
- Correlación
- Gráfico residual parcial — Residual plot
También veremos:
- Evaluación para Regresión Lineal Multiple.
- R cuadrada (R² )
- Error cuadrático medio (Mean Squared Error — MSE)
En un post anterior vimos como aplicar el modelo de RL a nuestra información.
- Evaluación Gráfica — Regresión Lineal Simple
Es Simple porque solo existe una variable dependiente.
En este caso se puede hacer la evaluación del modelo de manera visual con una gráfica de dispersión, donde la linea azul representa la regresión lineal.
En la gráfica vemos la linea azul con pendiente negativa coincide con la tendencia de los puntos graficados (highway-mpg vs precio). En este caso este modelo es valido para nuestras predicciones.
En este segundo ejemplo, vemos que la Regresión Lineal no marca tendencia de los puntos graficados (rpm Vs precio), por lo cual estos datos no es el modelo adecuado para realizar predicciones.
- Evaluación usando Correlación
La manera numérica de hacer la validación es creando la correlación. Si tenemos un valor cercano a 1 quiere decir que nuestro modelo es adecuado y por el contrario si tiende a 0 no es la mejor opción.
En la image confirmamos lo representado en las gráficas. La regresión lineal para mpg Vs precio es mas adecuado (-0.70)😉 que cuando se hizo el modelo para las rpm Vs precio (-0.10)🤔.
El signo negativo representa la pendiente negativa.
- Evaluación con Gráfico residual
Primero definamos que residual es la diferencia entre el valor observado (test de prueba) y el valor pronosticado (regresión lineal).
Siguiendo con el primer ejemplo mpg Vs precio vemos que los puntos no tienen una tendencia por lo cual es adecuado como hemos visto con en las otras evaluaciones.
- Regresión Lineal Multiple
A diferencia de los ejemplos anteriores usamos mas de una variable dependiente, para este ejemplo usamos las siguientes variables del data frame
La manera de evaluación del modelo de regresión lineal es con una gráfica de distribución.
La linea roja son los valores reales y la linea azul los valores pronosticados, vemos que las curvas son similares hasta un precio de 30,000 posteriormente nuestro modelo pierde precisión.
- Métodos Estadísticos
Regresión lineal &multiple, usamos el método score para calcular R²
Para el error cuadrático medio usamos sklearn.
En el caso de regresión polinómial. El calculo de R² cambia pero el MSE sigue siendo de la misma forma.
p(x) = es la función polinómial.
Por ultimo ….
MSE se calcula como la diferencia entre el valor actual y el valor pronosticado al cuadrado
- si MSE tiene un valor cercano a 0 es un mejor modelo.
- si R² con el valor mas cercano a 1 es el mejor modelo
👏Gracias por tu tiempo … aplauso/comentario … follow se agradece 👍
👀También puedes seguirme en YouTube