数据重采样是将时间序列从一个频率转换至另一个频率的过程,它主要有两种实现方式,分别是降采样和升采样,降采样指将高频率的数据转换为低频率,升采样则与其恰好相反,说明如下:
方法 说明 降采样 将高频率(间隔短)数据转换为低频率(间隔长)。 升采样 将低频率数据转换为高频率。
Pandas 提供了 resample() 函数来实现数据的重采样。
降采样
通过 resample() 函数完成数据的降采样,比如按天计数的频率转换为按月计数。
import pandas as pd
import numpy as np
rng = pd.date_range('1/1/2021',periods=100,freq='D')
ts = pd.Series(np.random.randn(len(rng)),index=rng)
ts.resample('M').mean()
输出结果:
2021-01-31 0.210353
2021-02-28 -0.058859
2021-03-31 -0.182952
2021-04-30 0.205254
Freq: M, dtype: float64
如果您只想看到月份,那么您可以设置kind=period如下所示:
ts.resample
Original: https://blog.csdn.net/ccc369639963/article/details/124703790
Author: 睿科知识云
Title: Pandas resample数据重采样
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/743595/
转载文章受原作者版权保护。转载请注明原作者出处!