python统计缺失值数据_计算pandas datafram中缺失值的分组数据

2023年8月8日下午6:33 • Python • 阅读 46

我正在尝试这样做，但是在更大的数据帧(称为Clean)上：d={‘rx’: [1,1,1,1,2.1,2.1,2.1,2.1],

‘vals’: [NaN,10,10,20,NaN,10,20,20]}

df=DataFrame(d)

arrays = [df.rx,df.vals]

index = pd.MultiIndex.from_arrays(arrays, names = [‘rx’,’vals’])

df.index = index

Hist=df.groupby(level=(‘rx’,’vals’))

Hist.count(‘vals’)

这似乎工作得很好，但当我在Clean dataframe的一个子集上运行相同的概念(用列”LagBin”代替”vals”)时，我会得到一个错误：

^{pr2}$

具体来说历史计数(‘LagBin’)产生值错误：ValueError: Cannot convert NA to integer

我看了一下数据结构，一切看起来都是一样的。在

以下是产生错误的数据：rx LagBin rx LagBin

139.1 nan 139.1

139.1 0 139.1 0

141.1 nan 141.1

141.1 10 141.1 10

141.1 20 141.1 20

193 nan 193

193 50 193 50

193 20 193 20

193 3600 193 3600

193 50 193 50

193 0 193 0

193 20 193 20

193 10 193 10

193 110 193 110

193 80 193 80

193 460 193 460

193 30 193 30

193 0 193 0

而最初的工作程序会产生以下结果：rx vals rx vals

1 nan 1

1 10 1 10

1 20 1 20

2.1 nan 2.1

2.1 10 2.1 10

2.1 20 2.1 20

这些产生此错误的数据集有什么不同？在

Original: https://blog.csdn.net/weixin_34007888/article/details/114456860
Author: 天盗盗
Title: python统计缺失值数据_计算pandas datafram中缺失值的分组数据

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/742900/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Pytest 参数参考

pytest -k “dir” 可运行dir目录下的用例 pytest -k “dir2” 无法获取dir2目录下的用例 &#821…

Python 2023年9月13日
0044
程序员都无法理解的代码

df = df.append(pd.read_html(url), ignore_index=True) df.to_csv(‘NAB11.csv’,hea…

Python 2023年8月7日
0054
快速入门python看过的一些资料

我快速入门python看过的一些资料 B站的视频 10天自学Python，轻松掌握Python基础【千锋】廖雪峰 – Python教程 https://www.lia…

Python 2023年5月23日
0076
ptorch常用代码梯度篇（梯度裁剪、梯度累积、冻结预训练层等）

在训练比较深或者循环神经网络模型的过程中，我们有可能发生梯度爆炸的情况，这样会导致我们模型训练无法收敛。我们可以采取一个简单的策略来避免梯度的爆炸，那就是梯度截断 Clip, …

Python 2023年10月28日
0048
python常用标准库（时间模块time和datetime）

常用的标准库 time时间模块 import time time — 获取本地时间戳时间戳又被称之为是Unix时间戳，原本是在Unix系统中的计时工具。它的含义是从…

Python 2023年11月2日
0034
vue3的基本使用(超详细)

一、初识vue3 1.vue3简介 2020年9月18日，vue3发布3.0版本，代号大海贼时代来临，One Piece 特点：无需构建步骤，渐进式增强静态的 HTML 在任何页…

Python 2023年10月11日
0054
前端之CSS初识

一、CSS介绍 CSS（ Cascading Style Sheet，层叠样式表)定义如何显示HTML元素。当浏览器读到一个样式表，它就会按照这个样式表来对文档进行格式化（渲染…

Python 2023年6月6日
0094
『现学现忘』Git后悔药 — 33、revert撤销（二）

提示：接上一篇文章。 4、一次移除某几次提交上一篇文章的演示中，只有两个提交需要 revert，我们可以一个个回退。但如果有几十个呢？一个个回退肯定效率太低而且容易出错。（接上…

Python 2023年10月19日
0042
Django–关于路由配置与模板层心得

*路由配置与path转换器 settings文件中的ROOT_URLCONF指明了包含主路由配置列表（urlpatterns）的文件位置 url后第一个参数正则或非正则都可，前两条…

Python 2023年8月5日
0062
flask入门教程之数据库保存

计算机操作数据时，一般是在内存中对数据进行处理，但是计算机的内存空间有限，服务器操作大量数据时，容易造成内存不足，且一旦计算机关机，则内存数据就丢失。所以我们需要将数据进行存储。 …

Python 2023年8月10日
0071
长期稳定的项目—steam搬砖

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

Python 2023年9月7日
0036
pandas dataframe 基础知识(python数据分析活用pandas库)

1.加载数据集 2.查看列，行和单元格 2.1获取列子集 2.2获取行子集 2.2.1通过索引标签获取行子集:loc 2.2.2 通过行号获取行:iloc 2.3 混合 2.3.1…

Python 2023年8月8日
0074
python入门基础(8)–python中的嵌套

嵌套：将一系列字典存储在列表中，或将列表作为值存储在字典中，这称为嵌套。既可以在列表中嵌套字典，也可以在字典中嵌套列表，甚至在字典中嵌套字典。一、列表中嵌套字典 1）一般创建方式…

Python 2023年11月3日
0034
漫谈计算机网络：应用层 —– 从DNS域名解析到WWW万维网再到P2P应用

2022-12-04 18:31:01 纪念一下博主的《漫谈计算机网络》连载博客浏览量破500了! 今天更新完结篇! 面试答不上？计网很枯燥? 听说你学习计网每次记了都会忘？…

Python 2023年10月13日
00107
Markdown常用语法

一、标题使用n个”#”表示n级标题。 #一级标题 ##&#…

Python 2023年6月9日
0055
Python实现贝叶斯岭回归模型(BayesianRidge算法)并使用K折交叉验证进行模型评估项目实战

说明：这是一个机器学习实战项目（附带数据+代码+文档+视频讲解），如需数据+代码+文档+视频讲解可以直接到文章最后获取。 1.项目背景房价问题已经成为中国社会关注的焦点问题。…

Python 2023年8月31日
0043

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

python统计缺失值数据_计算pandas datafram中缺失值的分组数据

大家都在看