pandas学习（五）merge

2023年7月8日下午8:01 • 人工智能 • 阅读 62

pandas学习（五）merge

.concat() 通常用来连接DataFrame对象。默认情况下是对两个DataFrame对象进行纵向连接，当然通过设置参数，也可以通过它实现DataFrame对象的横向连接。
.merge() 和pd.concat()不同，pd.merge()只能用于两个表的拼接，而且通过参数名称也能看出连接方向是左右拼接，一个左表一个右表，而且参数中没有指定拼接轴的参数，所以pd.merge()不能用于表的上下拼接。
.append() ,的默认操作效果跟concat()相同，都是实现两个DataFrame的纵向连接。事实上可以把它看做concat()的早期版本：

1.数据集1

1.1 创建数据集

raw_data_1 = {
        'subject_id': ['1', '2', '3', '4', '5'],
        'first_name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'],
        'last_name': ['Anderson', 'Ackerman', 'Ali', 'Aoni', 'Atiches']}

raw_data_2 = {
        'subject_id': ['4', '5', '6', '7', '8'],
        'first_name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'],
        'last_name': ['Bonder', 'Black', 'Balwner', 'Brice', 'Btisan']}

raw_data_3 = {
        'subject_id': ['1', '2', '3', '4', '5', '7', '8', '9', '10', '11'],
        'test_id': [51, 15, 15, 61, 16, 14, 15, 1, 61, 16]}

data1 = pd.DataFrame(raw_data_1, columns = ['subject_id', 'first_name', 'last_name'])
data2 = pd.DataFrame(raw_data_2, columns = ['subject_id', 'first_name', 'last_name'])
data3 = pd.DataFrame(raw_data_3, columns = ['subject_id','test_id'])

1.2 沿行拼接两个数据集


all_data = pd.concat([data1, data2])
all_data

1.3 沿列拼接两个数据集

all_data_col = pd.concat([data1, data2], axis = 1)
all_data_col

1.4 按subject_id合并数据集

pd.merge(all_data, data3, on='subject_id')

1.5 仅合并在 data1 和 data2 上具有相同”subject_id”的数据

pd.merge(data1, data2, on='subject_id', how='inner')

1.6 合并 data1 和 data2 中的所有值，并在可用的情况下使用来自两端的匹配记录。

pd.merge(data1, data2, on='subject_id', how='outer')

2.数据集2

2.1 合并两个数据集

cars = cars1.append(cars2)
cars

2.2 创建一个从 15，000 到 73，000 的随机数序列。

nr_owners = np.random.randint(15000, high=73001, size=398, dtype='l')
nr_owners

Original: https://blog.csdn.net/weixin_44026026/article/details/126338295
Author: 我叫辰辰啦
Title: pandas学习（五）merge

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/679205/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

解决mmdetection训练过程loss为nan的问题

我之前遇到多次loss为nan，一次是由于数据标注出现问题，换不同的模型参数均出现此问题，因此需要仔细检查数据格式；有一次是换了个neck的结构，loss变为nan，后面通过将…

人工智能 2023年7月9日
0067
stata回归分析与系数检验专题【计量经济系列（三）】

stata实证分析专题【计量经济系列（三）】文章目录 1. 数据 2. 有常数项的回归 3. 无常数项的回归 4. 多元回归 5. 对部分满足条件数据做回归 6. predict…

人工智能 2023年7月14日
00491
cuda11.3+torch1.12.0+torchvision0.13.0

前言本电脑之前已安装CUDA，但一些老版本的torchvision并不支持新的网络，为了构建网络方便，就重新安装了CUDA、cuDNN、torch和torchvision。 CU…

人工智能 2023年7月21日
0080
c# Hashtable vs Dictionary

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月30日
0083
一日一技：Python + Excel——飞速处理数据分析与处理

Python 可以为 Excel 做些什么？如果你经历过工作簿意外崩溃、计算出错，并且需要执行枯燥的手动操作，那么肯定想知道这个问题的答案。这本书是为工作表软件用户准备的一本全面又…

人工智能 2023年6月19日
00103
基于yolov5的农业害虫图像目标检测

目录前言一、读取标记数据 1.数据下载 2.数据示例 3.数据预处理二、数据分析三、算法介绍 1.卷积神经网络 2.yolov5 3.数据增强 4.自适应锚框…

人工智能 2023年6月17日
0080
Python 人脸识别系统

简介人脸识别不同于人脸检测。在人脸检测中，我们只检测了人脸的位置，在人脸识别任务中，我们识别了人的身份。本文重点介绍使用库 face_recognition 实现人脸识别，该库…

人工智能 2023年5月26日
0092
【机器学习算法模型】1. SVR模型推导

【机器学习算法模型推导】1. SVR算法介绍与推导文章目录【机器学习算法模型推导】1. SVR算法介绍与推导一、SVR算法 * 1.SVR简介 2.SVR数学模型 &#821…

人工智能 2023年6月15日
0078
Collaborativ

Collaborative Filtering Collaborative Filtering is a recommendation technique used in reco…

人工智能 2024年1月5日
0068
TensorRT：在NVIDIA各种GPU硬件平台下运行的高性能推理C++库【Pytorch-＞ONNX-＞TensorRT】【实现神经网络提速(读取ONNX模型并运行)】【目前对ONNX的支持最好】

tensorRT 基本网络构建创建builder 创建network 创建config network添加输入 network添加层，绑定输入 network mark outp…

人工智能 2023年7月13日
00164
C++ builder XE 关于intraweb TChart转换成IWimage的网页显示处理

//先随机生成三条柱状图形对比,但是如果光是TChart是无法显示在intraweb网页上的，需要转成图片显示 void __fastcall TIWForm1::IWButton…

人工智能 2023年6月27日
0088
OpenCV-Python实战（13）——OpenCV与机器学习的碰撞

OpenCV-Python实战（13）——OpenCV与机器学习的碰撞 * – 0. 前言 – 1. 机器学习简介 – + 1.1 监督学习 +…

人工智能 2023年6月24日
0063
[论文阅读笔记13]Observation-Centric SORT(OCSORT)论文中的公式推导

这篇文章来自CVPR2022, 是我很喜欢的一篇文章, 尝试用更本质的方法优化Kalman滤波. 论文地址: 论文概述这篇文章解决的主要问题是，现有的方法对运动预测都是基于线性…

人工智能 2023年5月26日
0085
2022年各国程序员编程水平排行榜出炉，排名第一的国家没听说过

哪个地方的程序员编程水平最高？相信很多人对这个问题感兴趣，今天就来聊一聊这个话题。 Pentalog 是一个全球数字服务平台，主要帮助企业寻找世界上一流的IT人才，每年都会发布一份…

人工智能 2023年7月29日
00108
语音识别和语音合成中是否使用了深度学习算法

介绍语音识别是将语音信号转换为文本的过程，而语音合成则是将文本转换为语音信号的过程。深度学习算法在语音识别和语音合成领域有着广泛的应用。本文将详细介绍语音识别和语音合成中使用的深…

人工智能 2024年1月3日
0057
Pandas 学习笔记一

文章目录 * – + Pandas 学习 + * 核心数据结构 * – DataFrame – + 属性 – Panel &#821…

人工智能 2023年7月7日
0066

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pandas学习（五）merge

1.数据集1

1.1 创建数据集

1.2 沿行拼接两个数据集

1.3 沿列拼接两个数据集

1.4 按subject_id合并数据集

1.5 仅合并在 data1 和 data2 上具有相同”subject_id”的数据

1.6 合并 data1 和 data2 中的所有值，并在可用的情况下使用来自两端的匹配记录。

2.数据集2

2.1 合并两个数据集

2.2 创建一个从 15，000 到 73，000 的随机数序列。

大家都在看