merge规则 python_python dataframe 在merge时产生笛卡尔积

2023年8月22日下午3:29 • Python • 阅读 51

在pandas中，concat, merge, join的使用方法可以参考以下资料：

http://blog.csdn.net/stevenkwong/article/details/52528616

主要讲下笛卡尔积：

import pandas as pd

from pandas import DataFrame

df1=DataFrame({‘a’:[1,2,3], ‘b’:[4,5,6], ‘key’:[0,0,0]})

df2=DataFrame({‘c’:[3,2,1], ‘d’:[6,5,4], ‘key’:[0,0,0]})

data = pd.merge(df1, df2, on=’key’)

这里merge默认为内连接。

df1:

a b key

0 1 4 0

1 2 5 0

2 3 6 0

df2:

c d key

0 3 6 0

1 2 5 0

2 1 4 0

data:

a b key c d

0 1 4 0 3 6

1 1 4 0 2 5

2 1 4 0 1 4

3 2 5 0 3 6

4 2 5 0 2 5

5 2 5 0 1 4

6 3 6 0 3 6

7 3 6 0 2 5

8 3 6 0 1 4

由此可知，当两个表连接时，有相同的key值就产生积。

如果，需要进行merge的次数过多时，每次都产生笛卡尔积，最终就会产生内存爆炸的现象。

所以，在merge时，一定要避免相同的key值，可以分批次merge，最后再concat。

Original: https://blog.csdn.net/weixin_36378793/article/details/113903140
Author: 桔梗一身骄傲
Title: merge规则 python_python dataframe 在merge时产生笛卡尔积

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/756768/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Javaweb-购物商城实现展示商品,实现购物车购物,结算(Servlet+mysql+jsp+tomcat)

演示视频: 购物网站代码: https://github.com/wu1369955/shopping 购物网站首页首先说明:这个是花几天搭建出来玩的,从github上拉到找好…

Python 2023年11月7日
0046
基于Bootstrap+Django+Python的点菜信息管理系统

目录1 引言 11.1课题背景 11.2选题意义 12 系统可行性分析 12.1 技术可行性分析 12.2 经济可行性分析 12.3 操作可行性分析 23系统分析 23.1 系统…

Python 2023年8月3日
0038
【PyTorch深度学习项目实战100例】—— 基于CNN卷积神经网络实现中文手写汉字识别 | 第60例

前言大家好，我是阿光。本专栏整理了《PyTorch深度学习项目实战100例》，内包含了各种不同的深度学习项目，包含项目原理以及源码，每一个项目实例都附带有完整的代码+数据集。 …

Python 2023年9月28日
0063
神经网络与深度学习（二）：前馈神经网络

神经元连续并可导（允许少数点上不可导）的非线性函数。可导的激活函数可以直接利用数值优化的方法来学习网络参数。激活函数及其导函数要尽可能的简单有利于提高网络计算效率。…

Python 2023年10月15日
0076
Python工具箱系列（六）

相比较于windows下安装python，在Linux下安装python实际上是一个非常困难的选择。首先要解决的就是选择哪个发行版本的问题。Linux的内核掌握在技术团队中，但是L…

Python 2023年10月31日
0038
使用supervisor实现后台管理进程

[unix_http_server]file=/tmp/supervisor.sock ; socket文件的路径，supervisorctl用XML_RPC和supervisor…

Python 2023年5月24日
0074
python使用matplotlib绘制饼状图

python使用matplotlib绘制饼状图 Python绘图需要下载安装matplotlib模块，它是一个数学绘图库，我们将使用它来制作简单的图表。绘制饼状图代码一： imp…

Python 2023年8月30日
0052
[Python项目]使用Pygame开发贪吃蛇小游戏笔记

Pygame 贪吃蛇 Python贪吃蛇 * 1. 规则 – 开始和结束运动和控制食物和得分 2. 类的设计和模块准备 – 类的设计模块的确定和装备 …

Python 2023年9月21日
0060
前端无法渲染CSS文件

问题描述：启动前端后，发现前端的页面渲染不符合预期，看情况应该是css文件没有生效。排查步骤：查看有无报错信息。查看后台输出，没有可用的提示信息，如图：确认 css 的路…

Python 2023年10月17日
0072
PYTHON+YOLOV5+OPENCV，实现数字仪表自动读数，并将读数结果进行输出显示和保存

最近完成了一个项目，利用python+yolov5实现数字仪表的自动读数，并将读数结果进行输出和保存，现在完成的7788了，写个文档记录一下，若需要数据集和源代码可以私信。最后…

Python 2023年8月3日
0076
postman7种断言的使用

🚀 优质资源分享 🚀 学习路线指引（点击解锁）知识定位人群定位🧡 Python实战微信订餐小程序 🧡 进阶级本课程是python flask+微信小程序的完美结合，从项目搭建到腾讯…

Python 2023年8月11日
0077
Linux软件安装 conda

基础 conda简介 conda安装 miniconda下载官方镜像&国内镜像下载：通常服务器在国内的选择清华或者北外，如果服务器在国外选择官网浏览器搜索：ctrl+F…

Python 2023年9月8日
0043
强化学习-学习笔记2 | 价值学习

Value-Based Reinforcement Learning : 价值学习 2. 价值学习 2.1 Deep Q-Network DQN 其实就是用一个神经网络来近似 (Q…

Python 2023年10月25日
0042
python入门基础(8)–python中的嵌套

嵌套：将一系列字典存储在列表中，或将列表作为值存储在字典中，称为嵌套。您可以在列表中嵌套词典，也可以在词典中嵌套列表，甚至可以在词典中嵌套。 [En] Nesting: stori…

Python 2023年5月24日
0062
pytest自动化框架集成jenkins+gitee+allure，使用git下拉代码和本地代码实现，基于windows

pytest自动化框架集成jenkins+gitee+allure 插件下载插件配置新建任务 * 新建任务-gitee版新建任务-本地代码版构建前后的运行脚本格式设置 py…

Python 2023年9月11日
0042
【GO】读写文件遇到的不同操作系统的问题

最近使用Go写了一个小工具，过程使用OS库操作文件的时候，遇到了一些一个跨系统的问题，在Windows可以正常运行的代码，打包到Linux就无法运行了，在此记录一下。除此之外还有通…

Python 2023年6月11日
0061

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

merge规则 python_python dataframe 在merge时 产生笛卡尔积

大家都在看

merge规则 python_python dataframe 在merge时产生笛卡尔积