Data Science | Pre-procesar & normalizar nuestra información | Pandas
En esta historia vemos que teniendo nuestra información recolectada el siguiente paso es manipularla para que se pueda utilizar para su evaluación en los diferente modelos que deseemos aplicar.
Ilustramos los pasos con la información ya cargada en un data frame para empezar con algunos cambios (pre-procesar)
Los cambios que haremos son:
- Cambiar tipo de datos
- Cambiar datos a un rango (One-hot)
- Filtrar información relevante
- Normalizar
Ajustar el tipo de datos para las fechas
Cambiar los valores a un rango
En este cambio queremos pasar de fechas a saber si fue en fin de semana o no.
Primero pasamos de usar las fechas a indicar el número del día en la semana
Después evaluamos si el número es mayor a 3 (de viernes en adelante) ponemos 1 sino 0.
Lo mismo se puede hacer con la columna de Genero
Cuando se tienen varias categorías en mejor ocupar la técnica de One-Hot
Aquí mi historia a mas detalle.
Seleccionar la información relevante para nuestro modelo
Normalizar la información
Para mas detalle de este paso te dejo esta otra historia.
👏Gracias por tu tiempo … aplauso/comentario … follow se agradece 👍
👀También puedes seguirme en YouTube como Geeks Coach