将DataFrame中出现过一次的行进行删除；两个DataFrame求交集、求差

2023年7月6日下午10:17 • 人工智能 • 阅读 64

import pandas as pd  # 导入包

data = pd.DataFrame({
    'a':[1,1,3,5],
    'b':[1,2,3,4],
    'c':[1, 3, 5, 6]
})  #创建一个表

将DataFrame中出现过一次的行进行删除；两个DataFrame求交集、求差

a = list(data["a"].value_counts())  # 获取a列不同数值出现的个数

b = list(data["a"].value_counts().index)  # 获取出现个数的具体数

y = []
for i,j in enumerate(a):
        if j == 1:
                index = data.loc[data.a==b[i]].index.to_list()
                y.append(index[0])
                sec_data = data.loc[y] # 找到表格中只出现过一行的数据，组成sec_data

data – sec_data两个DataFrame进行相减，如下

data_1 = pd.concat([data, sec_data, sec_data]).drop_duplicates(keep=False)
data_1  # 两个dataframe进行求差

这样就可以把出现过一次记录的行全部删除了；下面内容是两个DataFrame求交集

data_2 = pd.merge(sec_data, data, how='inner')
data_2  # 两个dataframe求交集

本人水平有限，想到的思路目前是这样的，后续如有更好的方法会再进行改进，也希望读者批评指正！

Original: https://blog.csdn.net/m0_51099057/article/details/122342642
Author: 小杨的海洋
Title: 将DataFrame中出现过一次的行进行删除；两个DataFrame求交集、求差

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/674896/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

openmmlab教程3-MMSeg 使用

文章目录 openmmlab教程3-MMSeg 使用 * 3. MMSeg 使用 – 3.1 运行demo + 1) 准备数据集 2) 配置文件 3) 训练 4) 测试…

人工智能 2023年7月6日
0097
【深度学习笔记1】-pytorch的dataloader参数shuffle设置true或false

作为一名深度学习的小白，最近在做LSTM预测股票问题，发现训练集的shuffle必须为true而测试集的shuffle必须为false。如果训练集的shuffle不设置为true的…

人工智能 2023年6月23日
00123
python列表双中括号_python – Pandas中双括号`[[…]]`和单括号`[….

考虑一下：来源DF： In [79]: df Out[79]: Brains Bodies 0 42 34 1 32 23 选择一列 – 导致Pandas.Series： In …

人工智能 2023年7月7日
0064
【Python实现视频转文字操作】

一. 安装moviepy模块 1.如果你用的PyCharm,导包的时候报错后可以直接按Alt+Shift+Enter ( install moviepy)2.也可以在终端输入pi…

人工智能 2023年5月27日
0078
基于jena的下载与推理

搞了很久的知识抽取部分，陆陆续续踩了很多坑，最终终于！把抽取丢给队友，自己跑来弄知识推理了，哈哈哈哈哈哈之前想着把弄好了的结构化数据存neo4j数据库，但是neo4j不支持推理，…

人工智能 2023年6月1日
0085
【2022】保姆级Anaconda安装与换国内源教程

一、Anaconda的安装由于Anaconda官网在境外，为了提升下载速度，我们选择从北京外国语大学镜像站下载Anaconda的安装包。截止到写作时，Anaconda3最新版本…

人工智能 2023年7月25日
0043
清华镜像用不了？conda安装tensorflow教程以及多种报错的解决（windows环境）

conda安装tensorflow教程以及报错处理（windows环境） 1.在很多教程中，作者会让我们先创建一个虚拟环境，在这个虚拟环境创建时一般会指定python的版本，如下面…

人工智能 2023年5月23日
00290
图像去雾算法综述

图像去雾算法图像去雾算法研究综述（魏红伟，田杰，肖卓朋）图像去雾算法的综述及分析（王道累，张天宇）一. 基于图像增强的去雾算法1. 直方图均衡化（1）直方图均衡化…

人工智能 2023年6月18日
0096
如何在Tensor对象上执行逻辑运算（如and、or等）

介绍本问题是关于如何在Tensor对象上执行逻辑运算（如and、or等）的解决方法。我们将使用Python编程语言和TensorFlow库来展示具体的操作步骤和代码示例。算法原…

人工智能 2024年1月1日
0043
python爬虫re+requests+bs4爬取汽车之家全部过程，附代码。支持互联网免费至上，看了全部关于汽车之家的文章都是收费的，我很看不过去

爬虫项目讲解我做的是爬取汽车之家全部车型以及配置表的爬虫代码我们要爬取的就是这个网站https://www.autohome.com.cn 这边我已经爬取完毕，但是有一些错误，…

人工智能 2023年6月19日
00127
构建模型——用Python构建logit、负二项回归、决策树与随机森林机器学习模型

目录 1、请采用计数数据分析模型（Count Data Model），对Crash Frequency.xls文件的数据进行建模分析，并回答以下问题： * 1.1、首先导入相关数…

人工智能 2023年6月17日
0085
本科生如何入门GNSS算法（四）- rtklib单点定位解算源码说明

目录单点定位 LSQ 设计矩阵残差阵后记欢迎关注个人公众号单点定位单点定位的过程就是最小二乘平差的过程，所涉及到的卫星位置计算/大气误差计算等都是为了计算残差。关于最小…

人工智能 2023年7月15日
0075
3D点云数据分析与处理-传统方法与深度学习

0.摘要基于 3D视觉的新兴应用场景蓬勃发展，3D点云越来越受到人们的广泛关注。点云有着广泛的应用领域包括机器人技术、3D图形、自动驾驶、虚拟现实（AR/VR/MR）等。为了跟上…

人工智能 2023年6月16日
0077
HALCON联合C#检测表面缺陷——显示实时灰度值以及灰度值的用处

接上一节，上一节窗口一点缩放我们已经完成了，这一篇实现图片实时灰度值的显示。这是很重要的部分，blob分析中，主要运用的就是灰度值之间的差异去检测异常，所以我们在得到一副图片的时…

人工智能 2023年6月21日
0052
高通平台解析dump日志方法

1、抓取dump文件首先，一旦我们的设备进入ramdump，我们打开QPST Configuration 后会自动抓取DUMP LOG . 其中 Ports 项显示设备状态是 S…

人工智能 2023年6月28日
0055
Openpcdet 安装过程

Openpcdet 安装过程硬件配置3060+5800h 需要安装的工具 Anaconda3cuda_11.1.1_455.32.00_linux.run (安装cuda)cud…

人工智能 2023年6月16日
00116

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

将DataFrame中出现过一次的行进行删除；两个DataFrame求交集、求差

大家都在看