python对csv去除重复行_Python 去重csv文件中相同的重复行

2023年8月6日下午3:42 • Python • 阅读 55

读取CSV

读取CSV文件由两种方式：

第一种

import csvwith open(‘data.csv’,’r’,encoding = ‘utf8’) as fp: reader = csv.reader(fp) for row in reader: print(row)

第二种

import pandas as pd #需要导入pandas库df = pd.read_csv(‘data.csv’)print(df)

用pandas库的.drop_duplicates函数

1 import shutil

2 import pandas as pd

5 frame=pd.read_csv(‘E:/bdbk.csv’,engine=’python’)

6 data = frame.drop_duplicates(subset=[‘名称’], keep=’first’, inplace=False)

7 data.to_csv(‘E:/baike.csv’, encoding=’utf8′)

通常会分为两种情况，一种是去除完全重复的行数据，另一种是去除某几列重复的行数据，就这两种情况可用下面的代码进行处理。

去除完全重复的行数据

data.drop_duplicates(inplace=True)

去除某几列重复的行数据

data.drop_duplicates(subset=[‘A’,’B’],keep=’

Original: https://blog.csdn.net/weixin_33920303/article/details/114426455
Author: 沼泽无它
Title: python对csv去除重复行_Python 去重csv文件中相同的重复行

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/737859/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【OpenCV】人脸识别

目录一：前言二：人脸识别案例实现步骤及完整代码步骤1 灰度化处理步骤2 将灰度图再次进行行列压缩步骤3 直方图均值化步骤4 使用模型对每一个像素点遍历图像甄别 …

Python 2023年9月28日
0050
React魔法堂：size-sensor源码略读

echarts-for-react在对 echarts进行轻量级封装的基础上，额外提供图表尺寸自适应容器尺寸的这小而实用的功能，而这功能的背后就是本文想介绍的 size-senso…

Python 2023年10月17日
0045
【Python】实现循环最快的方式

Original: https://www.cnblogs.com/123456feng/p/16082064.htmlAuthor: 蚂蚁ailingTitle: 【Python…

Python 2023年5月24日
0072
Conda 环境离线迁移（服务器断网情况下搭建虚拟环境envs）

通常我们通过配置镜像源并使用 conda create 以及 pip/conda install 创建虚拟环境并安装包但若本地/服务器离线（无法联网）这样的方法便不可用你需…

Python 2023年9月7日
00181
Pytest–生成测试报告

一、Pytest-html插件生成测试报告 1.在pytest.ini配置文件 #即在当前目录下生成report.html测试报告文件 [pytest] addopts= –ht…

Python 2023年9月13日
0050
MongoDB Node 驱动使用指南

MongoDB Node 驱动介绍 1. MongoDB数据库连接指南使用原生的 mongodb Node驱动连接MongoDB数据库。 1.1 数据库连接URI 数据库连接UR…

Python 2023年10月27日
0049
关于针对XSS漏洞攻击防范的一些思考

众所周知，XSS几乎在最常见、危害最大的WEB漏洞。针对这个危害，我们应该怎么防范呢。下面简单说一下思路。作者：轻轻的烟雾（z281099678）一、XSS漏洞是什么 XSS…

Python 2023年10月18日
0042
Sonar 扫描之SonarScanner介绍

SonarScanner用于在构建系统没有指定scanner时使用。项目配置在你的项目根目录中创建一个名为 sonar-project.properties的配置文件 &amp…

Python 2023年6月6日
00168
centos7离线安装PHP7.4.30+nginx1.23

环境 centos7.9 PHP7.4.30 nginx1.23.2 准备工作在编译PHP时会提示一些包版本不够或者缺少某些包，一般选择yum来安装缺少的包，但因为是离线安装，所…

Python 2023年10月16日
0038
【车载开发系列】CAN总线通信—总线报文格式

【车载开发系列】CAN总线通信—总线报文格式 CAN总线通信—总线报文格式【车载开发系列】CAN总线通信—总线报文格式 * 一.什么是ISO15765 二…

Python 2023年9月7日
0063
Linux 下模拟制作块设备并挂载

Linux 下模拟制作块设备并挂载作者：Grey 原文地址：博客园：Linux 下模拟制作块设备并挂载 CSDN：Linux 下模拟制作块设备并挂载环境 CentOS-7 下…

Python 2023年10月18日
0049
【多智能体强化学习环境】SMAC环境配置安装

文章目录 * – 引子 – 开始安装 – + github上拉取文件 + 修改install_sc2.sh文件 + 安装SMAC + 手动安装S…

Python 2023年9月20日
0034
python之24点牌游戏

-*- coding: UTF-8 -*- from itertools import combinations from itertools import permutation…

Python 2023年9月19日
0030
python 根据判断产生新列_pandas DataFrame 根据多列的值做判断,生成新的列值实例…

环境：Python3.6.4 + pandas 0.22 主要是DataFrame.apply函数的应用，如果设置axis参数为1则每次函数每次会取出DataFrame的一行来做处…

Python 2023年8月8日
0057
30个Python小游戏，上班摸鱼我能玩一天【内附源码】

大家好，我是辣条。今天给大家带来30个py小游戏，一定要收藏！目录有手就行 1、吃金币 2、打乒乓 3、滑雪 4、并夕夕版飞机大战 5、打地鼠简简单单 6、小恐龙 7、消消…

Python 2023年11月6日
0060
名言小抄（六）

1.一个人对世界最大的贡献就是让自己快乐起来。 4.人生最好的三个词久别重逢、失而复得、虚惊一场却没有，和好如初，只因和好容易，如初太难。很多东西，一旦打破，就很难圆满。有些故…

Python 2023年6月9日
0058

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

python对csv去除重复行_Python 去重csv文件中相同的重复行

大家都在看