Pandas | Funciones IV

Geekscoach

3 min readAug 13, 2020

Hi!! Esta historia es para seguir conociendo mas funciones de pandas.

Vamos a revisar:

info()
columns
values
tolist()
shape
drop()
rename()
sum()
loc()
iloc()
set_index()
transpose()
sort_values()

df.info()

Muestra el nombre de las columnas del data frame, conteo de registro con valores y tipo de datos.

df.columns

Muestra el nombre de las columnas, el tipo de dato que regresa es pandas.core.indexes.base.Index

df_can.columns.values

En este caso obtenemos el mismo resultado pero como un arreglo

df_can.columns.tolist()

Esta vez obtenemos el nombre de las columnas pero como una lista, de esta manera podemos fácilmente iterar.

df_can.shape

Nos indica la dimension de nuestro DataFrame (filas y columnas), esto es util para saber con cuanta información estamos trabajando y ver si esta completa.

df_can.drop([‘col_name’,’col_name2'], axis=1, inplace=True)

Elimina las columnas del DataFrame.

[‘col_name’,’col_name2'] = lista con los nombres de columnas a elimnar

axis = 1-indica que es una columna | 0 — elimina el indice

inplace = True — los cambios se realizan en el mismo Data Frame | False se regresa un nuevo DF menos las columnas elimnadas

df.rename(columns={‘old_name’:’new_value’}, inplace=True)

Renombra las columnas, el primer parametro es un diccionario con los nombres de las columnas a renombrar, la llave es el valor actual.

df_can.sum(axis=1)

Suma fila por fila los valores de las columnas del data frame. El valor se puede agregar como una nueva columna

df_can[‘Total’] = df_can.sum(axis=1)

df.can.isnull().sum()

Un uso mas interesante es sumar los nulos por columnas

df_can.loc[‘index_label’,[columns] ]

Obtiene las filas que coincida con el nombre del indice, el segundo parámetro es opcional y es el listado con el nombre de columnas

df_can.iloc[‘index_number’,[columns] ]

En lugar de usar el nombre del indice pasamos el número de la posición del indice.

df.transpose()

Cambia el dataframe de filas a columnas

df.sort_values

Ordena por la columna seleccionada, donde axis = 0 es considerando el indice.

df.sort_values(by=’column’, ascending=False, axis=0, inplace=True)

👏Gracias por tu tiempo … aplauso/comentario … follow se agradece 👍

👀También puedes seguirme en YouTube