python必知必会的数据处理知识2(pandas))

本节重点是统计运算。通常用pandas做事情,涉及数值运算的少。

一、数值运算

数值运算只对数值列起作用。

可以直接使用 +,也可以使用函数 add()
DataFrame.add(other, axis='columns', fill_value=None)

  • other:另一个DataFrame或Series;
  • axis:如果other是Series,指定Series的索引去和DataFrame的行匹配,还是和列匹配(+号是默认和列匹配);
  • fill_value:这个参数是指两个DataFrame只有一个值缺失的情况,缺失的值怎么处理。两者都缺失,那么就是NaN。

其余的操作: -, ×, /, //,%, **
相应的函数形式: sub(), mul(), div(), floordiv(), mod(), pow()
这几个操作和 + 以及 add()完全相同。

此外,还有 divmod()函数作为python的内建函数,支持对Series进行逐个元素操作。

d,r = divmod(s1, 2)

将s1用2做除法,商是d,余数是r

  • abs()
    调用方法很简单: df.abs()
  • cumxxx()
    累计运算,从开始到当前数据结束获取一个值。 xxx可以是 max, min, sum, prod(连乘)
    DataFrame.cumxxx(axis='index')
    其中axis可以使index或者columns
  • clip()
    DataFrame.clip(lower=None, upper=None)
    将数据裁剪到一定范围内
  • rank()
    将数据排序,输出为对应值在排序中的序号
    DataFrame.rank(axis=0, method='average', ascending=True, pct=False)
  • axis:0(’index’)-按列方向,1(‘columns’)-按行方向
  • method:对于值相同的数怎么标记顺序,
    • ‘average’: 先排序,值相同的序号统一为平均序号
    • ‘min’: 先排序,值相同的序号统一为最小序号
    • ‘max’: 先排序,值相同的序号统一为最大序号
    • ‘first’:先排序,值相同的序号按照出现次序排
    • ‘dense’:值相同为一组,按照组值排序,组内取相同次序,和min不同,中间没有跳跃
  • ascending:True or False,升序还是降序;
  • pct:percent,按照百分比显示,将显示的次序除以列、或行元素个数。
  • round()
    Series.round(decimals=0)
  • decimals:控制小数位数,小数点后几位,0意思是只取整数

二、数值统计运算

这些统计操作,只对元素类型为数值型的列有效,返回以列索引或行索引为索引的Series

  • df.sum() 和
  • df.mean() 均值
  • df.std() 标准差
  • df.var() 方差
  • df.min() 最小
  • df.max() 最大
  • df.median() 中值
  • cov() 协方差
  • corr() 相关系数
  • corrwith() 对不同DF进行运算
    DataFrame.corrwith(other, axis=0, drop=False, method='pearson')
  • other:另一个DataFrame或Series
  • axis:’index or 0’或’columns or 1’,index,计算列相关性。columns,计算行相关性。默认为 index。
  • drop:是否丢掉axis对应的索引取交时被过滤的了那些索引
  • method:计算相关性的方法
  • count() 查看非NaN元素个数

Original: https://blog.csdn.net/allenhsu6/article/details/121949498
Author: little_miya
Title: python必知必会的数据处理知识2(pandas))

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/755961/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • [HCTF 2018]admin1

    Flask的session使用: https://www.jianshu.com/p/278d4f59839d 进去看见注册登录框以为是sql注入,想到和sql-labs有一关有点…

    Python 2023年8月12日
    049
  • Pygame学习与实战02:搭建Pygame框架与主线程

    啊哦~你想找的内容离你而去了哦 内容不存在,可能为如下原因导致: ① 内容还在审核中 ② 内容以前存在,但是由于不符合新 的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。 可…

    Python 2023年9月20日
    053
  • 26个数据分析案例——第三站:基于python的药店销售数据分析

    目录 26个数据分析案例——第三站:基于python的药店销售数据分析 * 实验环境 数据说明 资料包 实验步骤 – 第一步:加载数据并查看数据详情 + 1、导入数据:…

    Python 2023年8月1日
    085
  • HC32L110(五) Ubuntu20.04 VSCode的Debug环境配置

    本文介绍在Ubuntu20.04下, VSCode中如何设置对 HC32L110 进行 debug 如果转载, 请注明出处. 本文使用的软硬件环境已经在前面介绍 基于 HC32L1…

    Python 2023年10月23日
    052
  • flask的路由

    路由处理本质 @app.route将url和视图函数打包放在rule里,添加到map对象,map再放到app中 可以用装饰器的方式也可以用函数的方式 点击查看代码 from fla…

    Python 2023年6月3日
    069
  • 绘制3D图表

    matplotlib不仅专注于二维图表的绘制,也具有绘制3D图表、统计地图的功能,并将这些功能分别封装到工具包mpL1oolkits.mplot3d、mpL_toolkits.ba…

    Python 2023年9月2日
    0130
  • 用python放烟花,节约又环保

    Original: https://www.cnblogs.com/123456feng/p/16040139.htmlAuthor: 蚂蚁ailingTitle: 用python…

    Python 2023年11月9日
    029
  • 【定制开发】【M3】基于Python+pygame实现的人机AI对战五子棋游戏(保姆级入门讲解)

    一、效果展示 二、功能介绍 五子棋是一种两人对弈的纯策略型棋类游戏。五子棋有两种玩法。 玩法一:双方分别使用黑白两色的棋子,下在棋盘直线与横线的交叉点上,先形成五子连线者获胜。玩法…

    Python 2023年9月19日
    048
  • 如何在Linux快速搭建一套ADB环境

    一、ADB简介 1.什么是ADB Android Debug Bridge,安卓调试桥,它借助adb.exe(Android SDK安装目录platform-tools下),用于电…

    Python 2023年6月12日
    070
  • FR+Django实现报表导入DBF数据

    FR+Django实现报表导入DBF数据 DBF格式文件是一种类似于excel的行列式存储且支持sql查询的数据文件,其广泛的应用于事业单位中的数据交换目前FR不支持DBF格式文件…

    Python 2023年8月4日
    054
  • pygame实现 飞机大战-第三版-仿写版

    目录 一、功能介绍: 二、原代码 (一)精灵定义部分 (二)游戏运行部分 三、代码解析 (一)游戏开始界面的实现 (二)双人单人游戏控制 (三)利用自定义事件 (四)利用精灵Spr…

    Python 2023年9月24日
    032
  • matplotlib绘制关联图

    相关性矩阵图 相关性矩阵存在的必要性 相关性矩阵,又叫做热力图,是关联图中最重要的一张图像,它能够为我们展现多个变量凉凉之间的相关性。 惯量图的目标是探索两个事件之间的关系,它为我…

    Python 2023年9月2日
    067
  • Data Wrangling with Python学习笔记

    Chapter 3 Numpy、pandas、Matplotlib 一、Numpy数组操作 1、数组可以由整数、浮点数、布尔值、字符串甚至混合类填充,大多数情况下数字数据类型占主导…

    Python 2023年8月27日
    063
  • 当 chatGPT 被职场 PUA ,笑麻了

    大家最近是不是被 chatGPT 刷屏了?简单来说,chatGPT 是一个智能聊天引擎。 那 chatGPT 和小爱同学、 siri 有什么区别呢? 如果体验过的朋友,能感受到区别…

    Python 2023年11月3日
    068
  • windows 修改(pip/conda)镜像源

    前言 本文仅介绍了 Windows 环境下的 pip 和 conda 的镜像源修改方法, linux系统请移步主页另一篇博文。 1、什么是镜像源? 国内的下载资源,国外源pip i…

    Python 2023年9月7日
    064
  • 用Python中的Numpy实现简单高效的扑克牌API(附代码)

    用Python中的Numpy实现简单高效的扑克牌API 扑克牌可以用字典或者列表来表示,但是这样的话会浪费很多的空间。因此,本项目将使用 Numpy来实现,这样的话能保证性能的情况…

    Python 2023年8月25日
    052
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球