数据分析（5）merge()、groupby()、索引相关操作

2023年8月20日上午9:29 • Python • 阅读 41

1、join:默认情况下他是把行索引相同的数据合并到一起。

merge:按照指定的列把数据按照一定的方式合并到一起。

通过merge函数合并两个DataFrame。on代表指明拿什么作为key来进行匹配。how这里分为left,right,inner,outer等方式。

t1.merge(t2,left_on=”a”,right_on=”f”,how=”inner”)

默认的合并方式inner，交集

merge outer，并集，NaN补全

merge left，左边为准，NaN补全

merge right，右边为准，NaN补全

2、在pandas中类似的分组的操作 df.groupby(by=”columns_name”)

grouped是一个DataFrameGroupBy对象，是可迭代的，grouped中的每一个元素是一个元组。

如果我们需要对国家和省份进行分组统计：

（1）grouped = df.groupby(by=[df[“Country”],df[“State/Province”]]) 这种情况df可以省略，因为Country和State/Province已经包含在df中。

获取分组之后的某一部分数据的计数：

（2）df.groupby(by=[“Country”,”State/Province”])[“Country”].count()

对某几列数据进行分组计数：

（3）df[“Country”].groupby(by=[df[“Country”],df[“State/Province”]]).count() 这种情况df必须写，因为Country和State/Province不存在于前边的Country中。

(1)(2)(3)的返回结果是一样的。如果只返回一列数据，返回的是一个Series类型；(1)(2)(3)返回的是多列数据，所以返回的是一个DataFrame类型。

3、简单的索引操作：
获取index：df.index
指定index ：df.index = [‘x’,’y’]
重新设置index : df.reindex(list(“abcedf”))实则是对dataframe进行取行
指定某一列作为index ：df.set_index(“Country”,drop=False)默认为True，drop为False表示之前列充当索引的列名称依然保存
返回index的唯一值：df.set_index(“Country”).index.unique()

index是可以重复的。

索引也是可以复合的，复合索引，Series复合索引取值可以直接写在括号中，如t1[“one”,”h”]指one和h行，而DataFrame复合索引则不行，x.loc[“one”].loc[“h”]。

4、level相当于符合索引的里外层，交换了level之后，里外索引交换使用t1.swaplevel()

Original: https://blog.csdn.net/Kira_1899/article/details/118568705
Author: Kira_1899
Title: 数据分析（5）merge()、groupby()、索引相关操作

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/754693/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python编写动量交易策略

目录 1. 概念介绍 2.计算动量 * 2.1 作差法求动量 2.2 作除法求动量 3.定义求动量与作图函数 4. 绘制K线图与动量图 5. 动量交易策略的制定概念介绍动量交易…

Python 2023年8月22日
0096
四十分钟带你玩儿转Python-OpenCV（一）

14天学习训练营导师课程：李宁《Python Pygame游戏开发入门与实战》李宁《计算机视觉OpenCV Python项目实战》1李宁《计算机视觉OpenCV Python项目实…

Python 2023年8月1日
0062
YOLOv5的Tricks | 【Trick6】学习率调整策略（One Cycle Policy、余弦退火等）

如有错误，恳请指出。文章目录 0. Yolov5的学习率调整方案 1. LR Range Test 2. Cyclical LR 3. One Cycle Policy 4. S…

Python 2023年8月2日
0066
python解决控制问题系例之一：解决微分方程-状态方程求解作图问题

python解决控制问题系例之一：解决微分方程-状态方程求解作图问题文章目录 python解决控制问题系例之一：解决微分方程-状态方程求解作图问题 * 1. 利用scipy.in…

Python 2023年9月3日
0060
开关电源PFC电路原理详解及matlab仿真

PFC全称”Power Factor Correction”，意为” 功率因数校正“。 PFC电路即能对功率因数进行校正，或者说能提…

Python 2023年11月7日
0056
SqlAlchemy使用的详细总结

前言：SqlAlchemy 和 flask-SqlAlchemy是不一样的，flask-SqlAlchemy是flask封装了SqlAlchemy的结果，相对来说，flask-S…

Python 2023年8月10日
0065
关于conda下虚拟环境能否调用GPU的问题

我是N卡用户，笔记本是RTX2060 为了在自行创建的虚拟环境里调用N卡真的是折磨我半天原问题如下：我在anaconda prompt里激活了一个自己创建的虚拟环境，然后进入p…

Python 2023年9月9日
0085
Pandas数据分析—使用stack和pivot实现数据透视

; 15.Pandas使用stack和pivot实现数据透视文章目录 15.Pandas使用stack和pivot实现数据透视前言一、经过统计得到多维度指标数据二、使用un…

Python 2023年8月7日
0051
数据分析——Pandas（进阶）

编辑器：jupyter notebook 一、数据统计 import numpy as np import pandas as pd 1. 创建DataFrame对象生成100行…

Python 2023年8月9日
0058
学习笔记——pygame最常用的15个模块

1、Color类 class pygame.Color Pygame 中用于描述颜色的对象。Color(name) -> Color Color(r, g, b, a) -&…

Python 2023年9月20日
0067
记录Pytest自动化测试脚本中的小点滴

1.背景 2.问题合集 1）Pytest+allure自动化框架 2）Pytest中几个好用插件 3）判断一个字典在另一个字典中 4）retrying的使用 5）yaml中的变量替…

Python 2023年9月10日
0040
[C++] 习题 2.14 用队列实现桶排序

前置技能队列桶排序具体实现由用户输入n个10以内的数，每输入i（0≤i≤9），就把它插入第i号队列中，最后把10个队列中的非空队列，按队列号从小到大的顺序串成一条链，并输出…

Python 2023年6月6日
0092
scrapy 处理数据的一些方法补充一些知识点

response.xpath()如果还要继续使用xopath 那么需要加(‘./’)这样写才可以 1)response.xpath方法的返回结果是一个类似l…

Python 2023年10月6日
0037
只有程序员才能读懂的西游记

一、我佛造经传极乐话说我佛如来为度化天下苍生，有三藏真经，可劝人为善。就如图中所示，真经所藏之处，在于云端。佛祖所管辖之下，有四个区域Region，称为四大部洲，一是东胜神洲…

Python 2023年6月12日
0087
java 弹力球_pygame实现弹力球及其变速效果

本文实例为大家分享了pygame实现弹力球及其变速效果的具体代码，供大家参考，具体内容如下期望： 1.球体接触到框体后反弹 2.设置速度按键，按下后改变球体速度、颜色状态具体实…

Python 2023年9月24日
0047
pytest框架的小知识（一）- 安装+命名规则+运行方式

pytest安装命令： pip install pytest 查看安装是否成功 pip –version 1、pytest命名规则pytest文件：必须以test开头或…

Python 2023年9月10日
0051

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

数据分析（5）merge()、groupby()、索引相关操作

大家都在看