pandas数据统计函数

2023年8月20日下午3:09 • Python • 阅读 37

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

前言
一、视频链接
二、使用步骤
*
0.数据处理
1.df.describe()针对所有数据列
2.针对非数字类型的列（唯一去重和按值计数）
3.相关系数和协方差
总结

前言

提示：这里可以添加本文要记录的大概内容：

数据统计有三种方式：1、汇总类统计。2、唯一去重和按值计数。3、相关系数和协方差

提示：以下是本篇文章正文内容，下面案例可供参考

一、视频链接

二、使用步骤

0.数据处理

代码如下（示例）：

import pandas as pd
import numpy as np
df=pd.read_excel(r"C:\Users\lenovo\Desktop\b.xls")
df.loc[:,"bwendu"]=df["bwendu"].str.replace("℃","").astype('int32')
df.loc[:,"ywendu"]=df["ywendu"].str.replace("℃","").astype('int32')

1.df.describe()针对所有数据列

对连续值来说：
count:每一列非空值的数量
mean: 每一列的平均值
std:每一列的标准差
min：最小值
25%：25%分位数，排序之后排在25%位置的数
50%：50%分位数
75%：75%分位数
max:最大值
对离散值来说特有的：
unique：不重复的离散值数目，去重之后的个数
top: 出现次数最多的离散值
freq: 上述的top出现的次数
————————————————
版权声明：本文为CSDN博主「_qz」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/m0_45210226/article/details/108942526：

#提取dataframe中所有数据列的汇总统计信息
df.describe()
df["bwendu"].mean()#查看bwendu的平均值
df["bwendu"].max()#查看bwendu的最大值
df["bwendu"].min()#查看bwendu的最小值

2.针对非数字类型的列（唯一去重和按值计数）

2.1唯一性去重df.unique()
一般不用于数值列，用于枚举、分类列

2.2按值计数

df["姓名"].value_counts()

3.相关系数和协方差

用途：比如：两只股票是同涨同跌？程度多大？正相关还是负相关？
产品销量的波动，跟哪些因素正相关、负相关、程度有多大？

对于两个变量x、y：
1、协方差：衡量同向反向程度，如果协方差为正，说明x、y同向变化，协方差越大说明同向程度越高。如果协方差为负数，说明x、y反向运动，协方差越小说明反向程度越大
2、相关系数：衡量相似程度。当相关系数为1时，说明两个变量变化时的正向相似程度最大；当相关系数为-1时，说明两个变量变化的反向相似程度最大

df.cov()#协方差矩阵
df.corr()#相关系数矩阵
#单独查看空气质量和最高温度的相关系数
df["aqi"].corr(df["bwendu"])
#!!这就是特征工程对于机器学习重要性的一个例子

总结

提示：这里对文章进行总结：
协方差和相关系数的数学基础不是很清楚

Original: https://blog.csdn.net/qq_23605533/article/details/124529727
Author: qq_23605533
Title: pandas数据统计函数

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/754911/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

MySQL实现主从复制(Windows)的明细操作步骤

文章目录 * – 一、教学视频地址 – 二、设计思路 – 三、具体步骤一、教学视频地址视频地址：视频链接二、设计思路准备两个 5.7版本…

Python 2023年9月30日
0057
Numpy库

Numpy库入门一维数据：由对等关系的有序或无序数据构成，采用线性方式组织。二维数据由多个一维数据构成，是一维数据的组合形式。（表格）多维数据由一维或二维数据在新维度上扩展形…

Python 2023年8月25日
0042
数字孪生十大问题有哪些？通俗解释指的是什么？

数字孪生（Digital Twins）之火热，已经成为了一个不争的事实。数字孪生的概念，起源于制造业，现在已广泛应用到了智慧城市、智慧交通、智慧农业、智慧医疗、智能家居等行业。数字…

Python 2023年9月26日
0033
面试心经

背景本人一出校园，除了在帝都工作过一年，回到故乡省会城市后，一直在一家单位工作，2016年到现在，已经6个年头，当年1个人，1台电脑的居民楼小单位，逐渐演变成了一家5个部门，好多…

Python 2023年10月16日
0034
价值10K+的Python面试题，珍藏已久，分享给大家！

headers = { ‘cookie’: ‘TADCID=foOmU9bDp6JGIXg2ABQCFdpBzzOuRA-9xvCxaMyI12wTEaQSQ4euq_1sNSDm…

Python 2023年11月9日
0033
如何从DataFrame中选择一列数据

查看数据 import pandas as pd movie= pd.read_csv(‘movie.csv’) movie.head() RankTitleGenreDescri…

Python 2023年8月21日
0076
python学习笔记-24. pytest测试框架(3)

提示：这里可以&#…

Python 2023年9月14日
0038
npm 和 maven 使用 Nexus3 私服 | 前后端一起学

前文《Docker 搭建 Nexus3 私服》介绍了在 docker 环境下安装 nexus3 以及 nexus3 的基本操作和管理，本文分别介绍 npm（前端）和 maven（…

Python 2023年10月23日
0093
Bugku

Bugku web 滑稽 WPCtrl+u或F12查看源代码即可Bugku web 计算器输入长度被限制，将源代码中的maxlength改为9即可Bugku web GET在网址输…

Python 2023年8月10日
0050
vscode配置django 推荐插件

安装插件打开 vscode，按下 Ctrl + Shift + X 打开插件管理侧边栏。依次安装下列插件 Git historyPythonDjangoDjaneiro # 自动补…

Python 2023年8月5日
0043
浅浅学习一下Markdown语法

Markdown标题语法 #引导标题，几个 #就是几级标题。代码：一级标题 ## 二级标题 ### 三级标题 #### 四级标题 ##### 五级标题 ###### 六级标题 …

Python 2023年6月12日
0097
Django获取request header信息

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

Python 2023年8月6日
0051
二、Python数据挖掘（Matplotlib库）

二、Python数据挖掘（Matplotlib库）目录：二、Python数据挖掘（Matplotlib库） * – + 一、Matplotlib 简介二、Matp…

Python 2023年9月5日
0044
linux python环境

安装python sudo apt-get install python3 sudo apt-get install pylint sudo apt install python3…

Python 2023年8月4日
0046
北大曹健老师的TensorFlow笔记中，在pycharm中安装sklearn、pandas失败，Could not find conda environment: tensorflow

电脑里面有sklearn、pandas包啊如果在cmd窗口中输入 pip list ，或者在vscode的终端窗口输入 conda list，或者在pycharm的Termina…

Python 2023年9月7日
0056
基于 iframe 的微前端框架 —— 擎天

vivo 互联网前端团队- Jiang Zuohan 一、背景 VAPD是一款专为团队协作办公场景设计的项目管理工具，实践敏捷开发与持续交付，以「项目」为核心，融合需求、任务、缺陷…

Python 2023年10月22日
0036

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31