Wie man den Durchschnitt eines pandas pd.Timestamp berechnet

Problem

Wenn Sie ein Array von pd.Timestamp-Objekten haben, können Sie den Durchschnitt nicht direkt berechnen, da sie nicht direkt summiert werden können:

average_timestamp_problem.py
import pandas as pd

# Ein Array von fünf festen pd.Timestamp-Objekten erstellen
timestamps = [
    pd.Timestamp('2023-01-01 12:00:00'),
    pd.Timestamp('2023-01-02 12:00:00'),
    pd.Timestamp('2023-01-03 12:00:00'),
    pd.Timestamp('2023-01-04 12:00:00'),
    pd.Timestamp('2023-01-05 12:00:00')
]

# FEHLER: Dies wird einen TypeError auslösen
average = sum(timestamps) / len(timestamps)

Dies wird einen TypeError auslösen:

error.txt
TypeError                                 Traceback (most recent call last)
Cell In[1], line 13
      4 timestamps = [
      5     pd.Timestamp('2023-01-01 12:00:00'),
      6     pd.Timestamp('2023-01-02 12:00:00'),
   (...)
      9     pd.Timestamp('2023-01-05 12:00:00')
     10 ]
     12 # FAIL: This will raise a TypeError
---> 13 average = sum(timestamps) / len(timestamps)

File timestamps.pyx:483, in pandas._libs.tslibs.timestamps._Timestamp.__radd__()

File timestamps.pyx:465, in pandas._libs.tslibs.timestamps._Timestamp.__add__()

TypeError: Addition/subtraction of integers and integer-arrays with Timestamp is no longer supported.  Instead of adding/subtracting `n`, use `n * obj.freq`

Lösung

Sie können ts.value summieren/durchschnitten statt ts direkt zu summieren, und nach dem Durchschnittsbilden es zurück in einen Timestamp konvertieren:

average_timestamp_solution.py
average = pd.Timestamp(sum(ts.value for ts in timestamps) / len(timestamps))

Vollständiges Beispiel:

average_timestamp_full_example.py
import pandas as pd

# Ein Array von fünf festen pd.Timestamp-Objekten erstellen
timestamps = [
    pd.Timestamp('2023-01-01 12:00:00'),
    pd.Timestamp('2023-01-02 12:00:00'),
    pd.Timestamp('2023-01-03 12:00:00'),
    pd.Timestamp('2023-01-04 12:00:00'),
    pd.Timestamp('2023-01-05 12:00:00')
]

# Ergebnis: Timestamp('2023-01-03 12:00:00')
average = pd.Timestamp(sum(ts.value for ts in timestamps) / len(timestamps))

Check out similar posts by category: Pandas, Python