Data Science | Pre-procesar & normalizar nuestra información | Pandas

Geekscoach
3 min readAug 23, 2020

--

En esta historia vemos que teniendo nuestra información recolectada el siguiente paso es manipularla para que se pueda utilizar para su evaluación en los diferente modelos que deseemos aplicar.

Ilustramos los pasos con la información ya cargada en un data frame para empezar con algunos cambios (pre-procesar)

Los cambios que haremos son:

  • Cambiar tipo de datos
  • Cambiar datos a un rango (One-hot)
  • Filtrar información relevante
  • Normalizar

Ajustar el tipo de datos para las fechas

Cambiar los valores a un rango

En este cambio queremos pasar de fechas a saber si fue en fin de semana o no.

Primero pasamos de usar las fechas a indicar el número del día en la semana

Después evaluamos si el número es mayor a 3 (de viernes en adelante) ponemos 1 sino 0.

Lo mismo se puede hacer con la columna de Genero

Cuando se tienen varias categorías en mejor ocupar la técnica de One-Hot

Aquí mi historia a mas detalle.

Seleccionar la información relevante para nuestro modelo

Normalizar la información

Para mas detalle de este paso te dejo esta otra historia.

👏Gracias por tu tiempo … aplauso/comentario … follow se agradece 👍

👀También puedes seguirme en YouTube como Geeks Coach

--

--

No responses yet