Pandas | Funciones IV
Hi!! Esta historia es para seguir conociendo mas funciones de pandas.
Vamos a revisar:
- info()
- columns
- values
- tolist()
- shape
- drop()
- rename()
- sum()
- loc()
- iloc()
- set_index()
- transpose()
- sort_values()
df.info()
Muestra el nombre de las columnas del data frame, conteo de registro con valores y tipo de datos.
df.columns
Muestra el nombre de las columnas, el tipo de dato que regresa es pandas.core.indexes.base.Index
df_can.columns.values
En este caso obtenemos el mismo resultado pero como un arreglo
df_can.columns.tolist()
Esta vez obtenemos el nombre de las columnas pero como una lista, de esta manera podemos fácilmente iterar.
df_can.shape
Nos indica la dimension de nuestro DataFrame (filas y columnas), esto es util para saber con cuanta información estamos trabajando y ver si esta completa.
df_can.drop([‘col_name’,’col_name2'], axis=1, inplace=True)
Elimina las columnas del DataFrame.
[‘col_name’,’col_name2'] = lista con los nombres de columnas a elimnar
axis = 1-indica que es una columna | 0 — elimina el indice
inplace = True — los cambios se realizan en el mismo Data Frame | False se regresa un nuevo DF menos las columnas elimnadas
df.rename(columns={‘old_name’:’new_value’}, inplace=True)
Renombra las columnas, el primer parametro es un diccionario con los nombres de las columnas a renombrar, la llave es el valor actual.
df_can.sum(axis=1)
Suma fila por fila los valores de las columnas del data frame. El valor se puede agregar como una nueva columna
- df_can[‘Total’] = df_can.sum(axis=1)
- df.can.isnull().sum()
Un uso mas interesante es sumar los nulos por columnas
df_can.loc[‘index_label’,[columns] ]
Obtiene las filas que coincida con el nombre del indice, el segundo parámetro es opcional y es el listado con el nombre de columnas
df_can.iloc[‘index_number’,[columns] ]
En lugar de usar el nombre del indice pasamos el número de la posición del indice.
df.transpose()
Cambia el dataframe de filas a columnas
df.sort_values
Ordena por la columna seleccionada, donde axis = 0 es considerando el indice.
df.sort_values(by=’column’, ascending=False, axis=0, inplace=True)
👏Gracias por tu tiempo … aplauso/comentario … follow se agradece 👍
👀También puedes seguirme en YouTube