Pandas para series de tiempo

Pandas para series de tiempo

Procesamiento de datos en Python

Este artículo explica los métodos de pandas para series de tiempo. Tratemos la serie de tiempo como profesionales.

Foto de Aron Visuals en Unsplash

Desde que me uní a la fuerza laboral como científico de datos, la mayoría de los datos con los que trabajo son series de tiempo. Bueno, hay muchas definiciones para una serie de tiempo, generalmente se define como un conjunto de puntos de datos recopilados durante un período de tiempo. O hablando de manera Pythonica, se refiere a un conjunto de datos con un índice de fecha y hora, y al menos una columna con valores numéricos.

Puede ser el precio de una acción en los últimos meses, las ventas de un hipermercado en las últimas semanas, o incluso los registros de nivel de azúcar en sangre recopilados a lo largo de los meses para un paciente.

En este artículo, mostraré cómo aplicar pandas a un conjunto de datos de series de tiempo, con un ejemplo de registros generados de nivel de azúcar en sangre.

Con eso, este artículo se estructurará de la siguiente manera:

  1. Manipulación del formato de fecha y hora: cambiar la serie de fecha y hora al formato deseado
  2. Conversión de fecha y hora a un período específico: convertir cada punto de datos al período de tiempo específico
  3. Filtrar series de fecha y hora basadas en una condición: filtrar puntos de datos basados en un período de tiempo seleccionado
  4. Desplazamiento de tiempo: desplazar puntos de datos hacia abajo por un número específico de períodos
  5. Remuestreo de series de tiempo: agrupar puntos de datos según el período de tiempo especificado
  6. Gráfico de línea

¡Comencemos!

Como siempre, el primer paso en cualquier análisis con Python es importar la biblioteca necesaria.

Importar bibliotecas

import pandas as pdimport randomimport numpy as npfrom datetime import datetime 

Crear datos

Luego, generemos un conjunto de datos de registros de nivel de azúcar en sangre para esta demostración.

def create_demo_data():    random.seed(365)    np.random.seed(365)    number_of_data_rows = 2160        # generar una lista de fechas    dates = pd.bdate_range(datetime(2020, 7, 1), freq='4H', periods=number_of_data_rows).tolist()        # crear un diccionario con los...

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

PyTorchEdge presenta ExecuTorch Potenciando la inferencia en dispositivos móviles y de borde

En un movimiento innovador, PyTorch Edge presentó su nuevo componente, ExecuTorch, una solución de vanguardia que est...

Inteligencia Artificial

Top 40+ Herramientas Generativas de IA (Diciembre 2023)

ChatGPT – GPT-4 GPT-4 es el último LLM de OpenAI, que es más inventivo, preciso y seguro que sus predecesores. Tambié...

Inteligencia Artificial

RELU vs. Softmax en Vision Transformers ¿Importa la longitud de la secuencia? Ideas de un artículo de investigación de Google DeepMind

Hoy en día, una arquitectura común de aprendizaje automático es la arquitectura de transformer. Una de las partes pri...

Inteligencia Artificial

Regs necesarias para la IA de alto riesgo, dice ACM Es el Viejo Oeste

El documento de ACM recomienda que se establezcan nuevas leyes para limitar el uso de IA generativa en ciertas situac...

Inteligencia Artificial

Conoce FlexGen un motor de generación de alto rendimiento para ejecutar grandes modelos de lenguaje (LLM) con memoria limitada de GPU.

Recientemente, los modelos de lenguaje grandes (LLMs, por sus siglas en inglés) han mostrado un rendimiento impresion...

Inteligencia Artificial

Chip fotónico 'se ajusta como un Lego

Un nuevo chip semiconductor compacto de fotónica de silicio expande significativamente el ancho de banda de radiofrec...