Entendiendo Análisis de la varianza
En esta historia … veremos como encontrar la relación entre variables (precio) entre diferentes categorías (marcas de autos) usando ANOVA. Analysis of Variance.
Conocer si hay diferencia significativa entre el promedio de cada grupo.
Encontrar si las categorías Honda/Subaru se comportan similar (correlación) en comparación al precio.
ANOVA nos da como resultado dos parámetros:
F-test =variación entre los grupos promedio, sobre la variación dentro de cada uno de los grupos de muestra. Variación entre el promedio de los grupos.
P = grado de confianza, que tan significativo es.
Probabilidad, tomando el grado de confianza. Significa que si P=.05 -> es el 95% de probabilidad
Por lo tanto.
- P= 0.001 Correlación fuerte
- P<.05 Moderada
- p<.01 Débil. Esto significa Probabilidad> 90%
- p>.01 No hay correlación. Probabilidad <90%
Haciendo los cálculos:
- from scipy import stats
Dejando una baja correlación entre Honda y Subaru.
— — — — — — — — — — — — — — — — — — — — — — — — — — — — -
El caso contrario donde hay una fuerte correlación la variación entre el promedio de los grupos es mayor.
La muestra es que se esta comparando Honda Vs Jaguar. Estas categorías varían mas sobre el precio
Haciendo los calulos tenemos una F mucho mayor y P con un valor mucho menor.
👏Gracias por tu tiempo … aplauso/comentario … follow se agradece 👍
👀También puedes seguirme en YouTube