【python】———merge函数

@爱学习的DUO

目录

*
1 数据读取(A、B表)
2 当右表无重复项
3 当右表有重复项

+ 3.1 数据读取(C表)
+ 3.2 不对右表去重
+ 3.3 对右表去重处理
+ 3.4 总结

  • merge()表示将【左表】和【右表】,按某个均有的字段,进行横向匹配。

1 数据读取(A、B表)

import pandas as pd
A = pd.read_excel('D:/pp/test.xlsx','Sheet1');A
B = pd.read_excel('D:/pp/test.xlsx','Sheet2');B
  • A表(左),B表(右)

【python】———merge函数

2 当右表无重复项

例1:有A(5行)、B(10行)两个表,按 IDkey进行横向匹配。
(1)首先把B表的列名字【key】改为【ID】,以便于后续匹配。

B=B.rename(columns={'key':'ID'});B

(2)用B表去匹配A表(参数=’left’)。

AB=pd.merge(A,B,on = ['ID'],how='left');AB
  • 结果(左表多少行,匹配结果就多少行)
    【python】———merge函数
    *(3)用A表去匹配B表(参数=’left’)。
BA=pd.merge(B,A,on = ['ID'],how='left');BA
  • 结果(左表多少行,匹配结果就多少行)
    【python】———merge函数

3 当右表有重复项

3.1 数据读取(C表)

C = pd.read_excel('D:/pp/test.xlsx','Sheet3');C
  • 结果
    【python】———merge函数

3.2 不对右表去重

AC=pd.merge(A,C,on = ['ID'],how='left');AC
  • 结果(发现左表行数增多)
    【python】———merge函数

3.3 对右表去重处理

(1)对C表的ID去重,重命名为C_qc

C_qc=C.drop_duplicates(['ID'])
C_qc
  • 去重的C表(C_qc)
    【python】———merge函数
    (2) 使用C表去匹配A表(参数=left)
AC1=pd.merge(A,C_qc,on = ['ID'],how='left');AC1
  • 结果
    【python】———merge函数

3.4 总结

可以看出,使用merge函数的时候,如果右表有重复值,会导致结果的不准确。所以一般对右表做去重处理,再与左表进行横向匹配。

Original: https://blog.csdn.net/qq_40264559/article/details/124501811
Author: 朵朵zeng
Title: 【python】———merge函数

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/722173/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • Diffusion Model扩散模型原理

    本文并非原创,只是个人的学习的笔记,作者只对一些步骤进行了简单的推导。具体内容请参考: https://lilianweng.github.io/posts/2021-07-11-…

    人工智能 2023年6月16日
    059
  • 【YOLO】在ubuntu上部署yolov5

    作为AI助手,我会尽力回答您的问题。以下是 在ROS上的步骤: 1. 安装ROS 如果您还没有安装ROS,请参考ROS官方网站的安装指南。 2. 安装darknet 安装darkn…

    人工智能 2023年6月16日
    059
  • 4种数据去量纲化方法—标准化、归一化、正则化

    1.z-分数标准化 主要目的:将不同量级的数据统一转化为同一个量级。使数据服从标准正态分布。 …首先计算出全体数据x的均值µ与标准差σ,然后将每个x带入公式进行标准化。…

    人工智能 2023年7月15日
    063
  • 5的分类为负类

    问题介绍 在机器学习中,分类任务是一个常见的问题。假设我们有一个数据集,其中包含一些数字。我们想要将这些数字进行分类,在这个例子中,我们想要将数字分类为正类和负类。我们的目标是构建…

    人工智能 2023年12月31日
    037
  • 9大时序异常检测方法汇总

    异常检测(Anomaly detection)是目前时序数据分析最成熟的应用之一,定义是从正常的时间序列中识别不正常的事件或行为的过程。 有效的异常检测被广泛用于现实世界的很多领域…

    人工智能 2023年6月15日
    077
  • WebService总结

    目录 WebService简介 WebService架构图 理解: WebService的开发规范 SOAP协议 soap的组成 WSDL UDDI WebService的优缺点 …

    人工智能 2023年6月30日
    081
  • Python创建类

    python 有一个传说”一切皆对象” 面向对象编程是在面向过程编程的基础上发展来的,它比面向过程编程具有更强的灵活性和拓展性。面向对象编程是程序员发展的风…

    人工智能 2023年7月5日
    080
  • KGNN-LS 2019 (KDD) Knowledge-aware Graph Neural Networks with Label Smoothness Regularization for Re

    知识图谱作为一种异构网络,节点表示实体,诸如物品,产品,以及他们的属性,特征;边对应为实体之间的关系,知识图谱可以获取一系列实体之间的关系和结构信息。因此,知识图谱提供了不同物品之…

    人工智能 2023年6月1日
    071
  • php jquery ajax 无法传递POST值的问题

    今天在修改程序的时候,又碰到了ajax无法传值的问题,在排查程序的过程中,发现了好几片错误,其它这些错误都可以通过给程序打卡子去查找。如 // JavaScript Documen…

    人工智能 2023年6月27日
    063
  • 深度学习 第3章线性分类 实验四 pytorch实现 Softmax回归 中篇

    目录: 第3章 线性分类 * 3.2 基于Softmax回归的多分类任务 – 3.2.1 数据集构建 3.2.2 模型构建 + 3.2.2.1 Softmax函数 3….

    人工智能 2023年6月18日
    064
  • 【ROS】源码分析-roscore与Master启动

    说明 本文从源码层面分析ros Master是如何启动的,以及Master(服务注册和发布、参数服务)到底是什么高大尚的东东。 Node启动过程分析以小海龟为例,操作步骤如下 S1…

    人工智能 2023年6月10日
    0128
  • 【NLP】智能问答系统

    抵扣说明: 1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

    人工智能 2023年5月27日
    081
  • 对mmdetection代码设计的简单理解及代码修改

    代码的整体结构及每部分含义网络上已有很多资料,这里不再赘述。但网上很少见到对mmdetection代码设计模式的讲解,所以记录一下自己的理解,及快速修改代码的方式吧(以faster…

    人工智能 2023年7月10日
    066
  • Python语音识别实践【百度AI平台】

    这几天想要用Python来体验一下语音识别技术,虽然我知道有很多开源免费的语音识别库,例如,CMU Sphinx,好像以前玩过,但只为了愉快地体验,这次选择百度AI平台来简单实践一…

    人工智能 2023年5月25日
    0114
  • 深度图像转化为点云

    首先我们先知道什么是相机的 焦距。摄影机或放映机的金属筒容纳了一组两边或一边有弧度(凸或凹)的透镜,组成一个综合镜头。从物体不同部分射出的光线,通过镜头之后,聚焦在底片的一个点上,…

    人工智能 2023年5月26日
    085
  • 神级编程网站,堪称程序员的充电站,我给你找好了不能错过

    准备了几个网站,希望能帮助各位朋友。不多说直接来干货内容。 刷面类网站 0x00 牛客网—面经和刷面试题 牛客网作为国内内容超级丰富的 IT 题库,题库+面试+学习+求职+讨论+考…

    人工智能 2023年6月21日
    099
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球