【python】———merge函数

2023年7月29日上午10:39 • 人工智能 • 阅读 75

@爱学习的DUO

1 数据读取（A、B表）

import pandas as pd
A = pd.read_excel('D:/pp/test.xlsx','Sheet1');A
B = pd.read_excel('D:/pp/test.xlsx','Sheet2');B

A表(左)，B表（右）

2 当右表无重复项

例1：有A(5行)、B（10行）两个表，按 ID和 key进行横向匹配。
（1）首先把B表的列名字【key】改为【ID】，以便于后续匹配。

B=B.rename(columns={'key':'ID'});B

（2）用B表去匹配A表（参数=’left’）。

AB=pd.merge(A,B,on = ['ID'],how='left');AB

结果（左表多少行，匹配结果就多少行）

*（3）用A表去匹配B表（参数=’left’）。

BA=pd.merge(B,A,on = ['ID'],how='left');BA

结果（左表多少行，匹配结果就多少行）

3 当右表有重复项

3.1 数据读取（C表）

C = pd.read_excel('D:/pp/test.xlsx','Sheet3');C

结果

3.2 不对右表去重

AC=pd.merge(A,C,on = ['ID'],how='left');AC

结果（发现左表行数增多）

3.3 对右表去重处理

（1）对C表的ID去重，重命名为C_qc

C_qc=C.drop_duplicates(['ID'])
C_qc

去重的C表（C_qc）

(2) 使用C表去匹配A表（参数=left）

AC1=pd.merge(A,C_qc,on = ['ID'],how='left');AC1

结果

3.4 总结

可以看出，使用merge函数的时候，如果右表有重复值，会导致结果的不准确。所以一般对右表做去重处理，再与左表进行横向匹配。

Original: https://blog.csdn.net/qq_40264559/article/details/124501811
Author: 朵朵zeng
Title: 【python】———merge函数

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/722173/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Diffusion Model扩散模型原理

本文并非原创，只是个人的学习的笔记，作者只对一些步骤进行了简单的推导。具体内容请参考： https://lilianweng.github.io/posts/2021-07-11-…

人工智能 2023年6月16日
0059
【YOLO】在ubuntu上部署yolov5

作为AI助手，我会尽力回答您的问题。以下是在ROS上的步骤： 1. 安装ROS 如果您还没有安装ROS，请参考ROS官方网站的安装指南。 2. 安装darknet 安装darkn…

人工智能 2023年6月16日
0059
4种数据去量纲化方法—标准化、归一化、正则化

1.z-分数标准化主要目的：将不同量级的数据统一转化为同一个量级。使数据服从标准正态分布。 …首先计算出全体数据x的均值µ与标准差σ，然后将每个x带入公式进行标准化。…

人工智能 2023年7月15日
0063
5的分类为负类

问题介绍在机器学习中，分类任务是一个常见的问题。假设我们有一个数据集，其中包含一些数字。我们想要将这些数字进行分类，在这个例子中，我们想要将数字分类为正类和负类。我们的目标是构建…

人工智能 2023年12月31日
0037
9大时序异常检测方法汇总

异常检测（Anomaly detection）是目前时序数据分析最成熟的应用之一，定义是从正常的时间序列中识别不正常的事件或行为的过程。有效的异常检测被广泛用于现实世界的很多领域…

人工智能 2023年6月15日
0077
WebService总结

目录 WebService简介 WebService架构图理解： WebService的开发规范 SOAP协议 soap的组成 WSDL UDDI WebService的优缺点 …

人工智能 2023年6月30日
0081
Python创建类

python 有一个传说”一切皆对象” 面向对象编程是在面向过程编程的基础上发展来的，它比面向过程编程具有更强的灵活性和拓展性。面向对象编程是程序员发展的风…

人工智能 2023年7月5日
0080
KGNN-LS 2019 (KDD) Knowledge-aware Graph Neural Networks with Label Smoothness Regularization for Re

知识图谱作为一种异构网络，节点表示实体，诸如物品，产品，以及他们的属性，特征；边对应为实体之间的关系，知识图谱可以获取一系列实体之间的关系和结构信息。因此，知识图谱提供了不同物品之…

人工智能 2023年6月1日
0071
php jquery ajax 无法传递POST值的问题

今天在修改程序的时候，又碰到了ajax无法传值的问题，在排查程序的过程中，发现了好几片错误，其它这些错误都可以通过给程序打卡子去查找。如 // JavaScript Documen…

人工智能 2023年6月27日
0063
深度学习第3章线性分类实验四 pytorch实现 Softmax回归中篇

目录：第3章线性分类 * 3.2 基于Softmax回归的多分类任务 – 3.2.1 数据集构建 3.2.2 模型构建 + 3.2.2.1 Softmax函数 3….

人工智能 2023年6月18日
0064
【ROS】源码分析-roscore与Master启动

说明本文从源码层面分析ros Master是如何启动的，以及Master（服务注册和发布、参数服务）到底是什么高大尚的东东。 Node启动过程分析以小海龟为例，操作步骤如下 S1…

人工智能 2023年6月10日
00128
【NLP】智能问答系统

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月27日
0081
对mmdetection代码设计的简单理解及代码修改

代码的整体结构及每部分含义网络上已有很多资料，这里不再赘述。但网上很少见到对mmdetection代码设计模式的讲解，所以记录一下自己的理解，及快速修改代码的方式吧（以faster…

人工智能 2023年7月10日
0066
Python语音识别实践【百度AI平台】

这几天想要用Python来体验一下语音识别技术，虽然我知道有很多开源免费的语音识别库，例如，CMU Sphinx，好像以前玩过，但只为了愉快地体验，这次选择百度AI平台来简单实践一…

人工智能 2023年5月25日
00114
深度图像转化为点云

首先我们先知道什么是相机的焦距。摄影机或放映机的金属筒容纳了一组两边或一边有弧度（凸或凹）的透镜，组成一个综合镜头。从物体不同部分射出的光线，通过镜头之后，聚焦在底片的一个点上，…

人工智能 2023年5月26日
0085
神级编程网站，堪称程序员的充电站，我给你找好了不能错过

准备了几个网站，希望能帮助各位朋友。不多说直接来干货内容。刷面类网站 0x00 牛客网—面经和刷面试题牛客网作为国内内容超级丰富的 IT 题库，题库+面试+学习+求职+讨论+考…

人工智能 2023年6月21日
0099

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31