Pandas, seleccionar, filtrar, agrupar datos… Ejemplos básicos

Estos son solo algunos ejemplos de cómo se puede utilizar Pandas para trabajar con datos. La biblioteca ofrece una amplia variedad de funciones y métodos para el análisis y manipulación de datos tabulares y etiquetados.

instalación:

pip install pandas

Importar datos desde un archivo CSV y mostrar los primeros cinco registros:

import pandas as pd
data = pd.read_csv('data.csv')
print(data.head())

Utilizamos la función read_csv para leer los datos de un archivo CSV y almacenarlos en una variable llamada data. Luego, usamos la función head para mostrar los primeros cinco registros del DataFrame.

Selección de columnas y filas específicas:

import pandas as pd
data = pd.read_csv('data.csv')
print(data.loc[0:10, ['columna1', 'columna2']])

En este ejemplo, utilizamos la función loc para seleccionar las filas de 0 a 10 y las columnas «columna1» y «columna2» del DataFrame.

Filtrar datos basados en una condición:

import pandas as pd
data = pd.read_csv('data.csv')
filtro = data['columna1'] > 10
nuevos_datos = data[filtro]
print(nuevos_datos.head())

Creamos una variable filtro que contiene una condición booleana basada en la columna «columna1». Luego, utilizamos esta variable para filtrar los datos y crear un nuevo DataFrame llamado nuevos_datos.

Agrupar datos y aplicar una función:

import pandas as pd
data = pd.read_csv('data.csv')
grupo = data.groupby('columna1')
resultado = grupo['columna2'].sum()
print(resultado)

En este ejemplo, agrupamos los datos por la columna «columna1» y aplicamos la función sum a la columna «columna2» para obtener la suma de los valores agrupados.