python pct_change_在pct_change（）和缺失值之前重新采样

2023年7月7日上午8:43 • 人工智能 • 阅读 93

我有一个数据帧：import pandas as pd

df = pd.DataFrame([[‘A’, ‘G1’, ‘2019-01-01’, 11],

[‘A’, ‘G1’, ‘2019-01-02’, 12],

[‘A’, ‘G1’, ‘2019-01-04’, 14],

[‘B’, ‘G2’, ‘2019-01-01’, 11],

[‘B’, ‘G2’, ‘2019-01-03’, 13],

[‘B’, ‘G2’, ‘2019-01-06’, 16]],

columns=[‘cust’, ‘group’, ‘date’, ‘val’])

python pct_change_在pct_change（）和缺失值之前重新采样

^{pr2}$

数据帧被分组，现在我想计算pct_change，但前提是有以前的日期。

如果我这样做：df[‘pct’] = df.groupby([‘cust’, ‘group’]).val.pct_change()

我将得到pct_change，但不考虑丢失的日期。

例如，在组(‘A’, ‘G1’)中，日期2019-01-04的pct应该是{}，因为没有(上一个)日期2019-01-03。在

也许解决方案是按天重新采样，其中每个新行将np.nan作为val，然后再做{}。在

我试图使用df.resample(‘1D’, level=2)，但是我得到一个错误：TypeError: Only valid with DatetimeIndex, TimedeltaIndex or PeriodIndex, but got an instance of ‘MultiIndex’

对于组(‘B’, ‘G2’)，所有pct_change应该是np.nan，因为没有一行有上一个日期。在

预期结果为：

如何计算关于缺失日期的pct_change？在

解决方案：new_df = pd.DataFrame()

for x, y in df.groupby([‘cust’, ‘group’]):

resampled=y.set_index(‘date’).resample(‘D’).val.mean().to_frame().rename({‘val’: ‘resamp_val’}, axis=1)

resampled = resampled.join(y.set_index(‘date’)).fillna({‘cust’:x[0],’group’:x[1]})

resampled[‘resamp_val_pct’] = resampled.resamp_val.pct_change(fill_method=None)

new_df = pd.concat([new_df, resampled])

new_df = new_df[[‘cust’, ‘group’, ‘val’, ‘resamp_val’, ‘resamp_val_pct’]]

new_df

Original: https://blog.csdn.net/weixin_29046035/article/details/114389630
Author: 许清风
Title: python pct_change_在pct_change（）和缺失值之前重新采样

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/675876/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

PyTorch–模型剪枝案例

一、基础知识： 1.模型剪枝：通俗理解就是将神经网络某些冗余连接层的权重置为0，使得模型更加具有稀疏化，从而提升模型性能下图通过掩码图，根据掩码图对应权重矩阵将对应位置上的值替…

人工智能 2023年7月21日
0094
TensorFlow和CUDA、cudnn、Pytorch以及英伟达显卡对应版本对照表

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月25日
0045
机器学习之KNN算法（python代码实现）

kNN（k-Nearest Neighbors，k近邻）是机器学习中非常基础的一种算法，算法原理简单而且容易实现，结果精度高，无需估计参数，无需训练模型，而且不仅可以用于分类任务，…

人工智能 2023年6月23日
0063
BN和神经网络调优

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月14日
00104
OLAP多维分析

数据立方体(Data Cube)是一种多维模型的表现。当然，这并不是指这个数据只有三维，数据立方体可以被看成是具有多维度的数据。我们以一个例子来理解数据立方体 cube。上图是数…

人工智能 2023年7月17日
0053
决策树(Hunt、ID3、C4.5、CART)

决策树 1、决策树 2、决策树算法 * 2.1 Hunt算法 2.2 构建决策树的问题 – 2.2.1 怎样为不同类型的属性指定测试条件 2.2.2 怎样选择最佳划分 …

人工智能 2023年7月3日
0055
Global Tracking Transformers (多目标跟踪2022CVPR)

Global Tracking Transformers 论文地址：https://arxiv.org/abs/2203.13250代码： https://github.com/x…

人工智能 2023年7月10日
0093
【TensorFlow2.0】高级API中关于tf.keras.layers.Conv2D()函数的参数详细说明(建议保存）

关于函数的官方文档，然后逐一对每个参数的含义和用法进行解释： tf.keras.layers.Conv2D(filters, kernel_size, strides=(1, 1…

人工智能 2023年5月26日
00129
Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Process

摘要这篇文章是对最近比较火的”prompt”的一个总结，一篇非常好的综述，做NLP方向建议都要读一读：）本文将这种方法称之为”prompt-…

人工智能 2023年5月28日
0069
cv2.error: OpenCV(4.5.5) D:…opencvmodulesdnnsrctensorflowtf_importer.cpp:2984: error: (-215

项目场景：人脸识别 import cv2 as cvimport time def getFaceBox(net, frame, conf_threshold=0.7):frame…

人工智能 2023年5月26日
0037
完美解释：wenet-流式与非流式语音识别统一模型

Unified Streaming and Non-streaming Two-pass End-to-end Model for Speech Recognition[1] ，本…

人工智能 2023年7月28日
0064
人工智能 | ShowMeAI资讯日报 #2022.06.01

ShowMeAI 日报系列全新升级！覆盖AI人工智能工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文等方向。点…

人工智能 2023年5月31日
00127
K均值聚类

最近在自学图灵教材《Python机器学习基础教程》，在csdn以博客的形式做些笔记。 k均值聚类是最简单也最常用的聚类算法之一。它试图找到代表数据特定区域的簇中心。算法交替执行以…

人工智能 2023年6月2日
0061
机器学习期末考试

机器学习期末考试一、机器学习链接 1、机器学习期末复习试卷_zhouyan2000的博客-CSDN博客_机器学习期末考试} 2、机器学习笔试题 3、机器学习面试题 4、一天1个机…

人工智能 2023年6月15日
0082
【视音频编程学习】开源音频加速方案Sonic、SoundTouch对比及实时处理音频的实验分析

语速不改变声调的意思是保持语调和语义不变，语速变快或变慢。该过程显示，谱图在时间轴上像手风琴一样被压缩或展开。也就是说，基频值几乎不变，与音调相对应；整个时间过程被压缩或扩展，声门…

人工智能 2023年5月23日
0067
神经网络——感知机的基本计算

感知机由两层神经元组成（如下图），输入层（不进行函数运算）接受信号并传递给输出层，输出层有M-P神经元（阈值逻辑单元）组成。M-P神经元对其每个输入值及对应的权值进行相乘并求和，若…

人工智能 2023年7月1日
0053

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

python pct_change_在pct_change（）和缺失值之前重新采样

大家都在看