pandas DataFrame拼接

2023年8月9日上午5:20 • Python • 阅读 44

在 pandas模块中，通常我们都需要对类型为 DataFrame的数据进行操作，其中最为常见的操作便是拼接了。比如我们将两个 Excel表格中的数据读入，随后拼接完成后保存进一个新的 Excel表格文件中。之前查找了相关的博客，发现网络上鱼龙混杂。有些代码完全无法执行，为了提高效率，这里做一个详细地记录。

DataFrame数据拼接方法一：使用 .append()方法。


import pandas as pd

df1 = pd.DataFrame([[1, 2], [3, 4]])
df2 = pd.DataFrame([[5, 6], [7, 8]])

df = df1.append(df2)

print("df1的值为:")
print(df1)
print("df2的值为:")
print(df2)
print("df的值为:")
print(df)
"""
运行结果：
df1的值为:
   0  1
0  1  2
1  3  4
df2的值为:
   0  1
0  5  6
1  7  8
df的值为:
   0  1
0  1  2
1  3  4
0  5  6
1  7  8
"""

我们可以看到，首先我们使用了类似于 list列表的操作方式，使用 .append()方法对 df1与 df2数据进行了操作， 但是需要注意的是，不同于对列表对象的操作，这里的 df1 仍旧为原来的 df1 所拥有的内容，而我们赋值的对象 df 才是保存了二者拼接以后的结果。 所以记得一定要单独执行赋值才可以得到正确的结果！！！其次我们看到结果其实是有些问题的， df结果中的纵向索引值为 0，1，0，1，仍旧保留了我们拼接前各自的索引值，这是不被我们需要的，因此我们需要设置 ignore_index=True来对索引值进行重新排列。代码如下：


import pandas as pd

df1 = pd.DataFrame([[1, 2], [3, 4]])
df2 = pd.DataFrame([[5, 6], [7, 8]])

df = df1.append(df2,  ignore_index=True)

print("df1的值为:")
print(df1)
print("df2的值为:")
print(df2)
print("df的值为:")
print(df)
"""
运行结果：
df1的值为:
   0  1
0  1  2
1  3  4
df2的值为:
   0  1
0  5  6
1  7  8
df的值为:
   0  1
0  1  2
1  3  4
2  5  6
3  7  8
"""

我们可以看到，此时的纵向索引值变正常了。

注意: df1 = pd.DataFrame([[1, 2], [3, 4]])创建 DataFrame类型的数据时要使用双层中括号，单层中括号会导致数据纵向排列。

DataFrame数据拼接方法二：使用 .concat()方法。


import pandas as pd

df1 = pd.DataFrame([[1, 2], [3, 4]])
df2 = pd.DataFrame([[5, 6], [7, 8]])

df = pd.concat([df1, df2], ignore_index=True)

print("df1的值为:")
print(df1)
print("df2的值为:")
print(df2)
print("df的值为:")
print(df)
"""
运行结果：
df1的值为:
   0  1
0  1  2
1  3  4
df2的值为:
   0  1
0  5  6
1  7  8
df的值为:
   0  1
0  1  2
1  3  4
2  5  6
3  7  8
"""

我们可以看到成功实现了拼接。

但是这样并不美观，我们发现，我们的纵向 index还是用 0，1在表示，那么我们可不可以自定义纵向 index呢？答案是可以的，请看如下代码：

import pandas as pd

df1 = pd.DataFrame([[1, 2], [3, 4]], columns=["column1", "column2"])
df2 = pd.DataFrame([[5, 6], [7, 8]], columns=["column1", "column2"])

df = pd.concat([df1, df2], ignore_index=True)

print("df1的值为:")
print(df1)
print("df2的值为:")
print(df2)
print("df的值为:")
print(df)
"""
运行结果：
df1的值为:
   column1  column2
0        1        2
1        3        4
df2的值为:
   column1  column2
0        5        6
1        7        8
df的值为:
   column1  column2
0        1        2
1        3        4
2        5        6
3        7        8
"""

至此， DataFrame的拼接问题暂时告一段落，当然还存在其他方法，以后有机会了再补充，这两种方法均为比较直观和简洁的方法。推荐使用。此外， pd.concat()函数也适用于多个 DataFrame的拼接，只要将第一个参数变为一个列表，涵盖所有的 DataFrame名称即可，如 [df1, df2, df3]。

码字不易，如果大家觉得有用，请高抬贵手给一个赞让我上推荐让更多的人看到吧~

Original: https://blog.csdn.net/u011699626/article/details/116406070
Author: 勤奋的大熊猫
Title: pandas DataFrame拼接

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/744015/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

.NET7 gRPC JSON转码+OpenAPI

gRPC JSON转码 gRPC JSON 转码允许浏览器应用调用 gRPC 服务，就像它们是使用 JSON 的 RESTful API 一样。浏览器应用不需要生成 gRPC 客…

Python 2023年10月15日
0039
获取稀疏型张量（sparse tensor）的数值

方法一：使用sparse的._indices()和._values() 方法二：使用Dgl的graph.adj_sparse(‘coo’) 有时候tenso…

Python 2023年8月25日
0037
Python ❀ 软件安装与环境部署

文章目录 1、运行Python代码 2、Python下的第一个程序 2.1 在不同操作系统下的Python编译环境 2.1.1 在Linux系统中安装P…

Python 2023年5月25日
0087
python自动化神器专题1：介绍

整理之前的一些关于clicknium的文章，争取做个集合发到这里也可以参见B站的视频介绍 Visual Studio Code 的 Clicknium 扩展通过单击目标 UI …

Python 2023年10月3日
0027
人工智能–遗传算法求解TSP问题

文章目录前言一、遗传算法的概念 * – 遗传算法（Genetic Algorithm, GA）：二、解决的问题对象三、程序步骤 * 1.针对TSP问题，确定编…

Python 2023年8月1日
0047
Python数据可视化三部曲之 Matplotlib 从上手到上头

Python数据可视化三部曲之 Matplotlib 从上手到上头文章目录 –安装命令– 1.plot()方法基本 * 1.1 方法概述 1.2 不设置…

Python 2023年8月30日
0063
Python数据分析学习笔记4

Matplotlib库入门 4.1 Matplotlib库介绍导入方式： import matplotlib.pyplot as plt 范例：代码解释看注释： import …

Python 2023年9月6日
0033
网络编程学习（2）—— 基于SOCKET简单套接字通信的 bug 修复

基于socket简单套接字通信的 bug 修复 * – 目前实现的添加了通信循环的套接字通信的一些问题 – + 客户端向服务端发送消息时发现地址已被使用 +…

Python 2023年10月4日
0041
快速入门scrapy爬虫框架

scrapy爬虫框架 scrapy爬虫框架简介 scrapy爬虫框架入门简介网页爬虫代码简介通过实战快速入门scrapy爬虫框架 scrapy爬虫框架入门简介下载scra…

Python 2023年5月24日
0074
如何利用python提取字符串中的数字

目录一、isdigit() 函数二、filter() 函数三、提取一段字符串中的数字四、匹配指定字符串开头的数字参考资料一、isdigit() 函数 isdigit()…

Python 2023年8月1日
0037
30分钟掌握 Webpack

为什么使用 Webpack 在我们进行传统网页开发中，会在 index.html 中引入大量的 js 和 css 文件，不仅可能会导致命名冲突，还会使页面体积变大，因为如果引用了第…

Python 2023年6月12日
0084
Linux安装Anaconda教程

1. 首先上Linux官网下载最新对应版本的Anaconda安装包链接: Anaconda官网下载 2. 因为我们是在Linux系统下安装Anaconda，所以选择Linux…

Python 2023年8月1日
0055
技术 | Python工具箱系列(一)

Python 2023年5月24日
0055
python编程思路 – 基于rsplit importlib getattr 实现功能

根据配置文件来实现对功能的增删，比如django中的中间件，flask中的类方式引入配置文件，不需要修改源代码，只修改配置文件就可以实现中间件的使用或者不使用。 rsplit im…

Python 2023年8月10日
0040
数据科学库Python——Pandas数据合并与分组聚合_2（join和merge）

目录一、数据合并之join 二、数据合并之merge （1）连接键 on （2）索引连接 lef/right_index 三、应用实例分组与聚合调用聚合方法问题：统计中国每…

Python 2023年8月8日
00122
python边缘检测代码_Python中的边缘检测

我试着写一个程序，用户输入一个数字，它在屏幕上画出那么多的矩形，但是三角形不能重叠。我对最后一部分有问题，我正在寻求帮助。我借用了Al-Sweigart的一本书中的边缘检测方法，他…

Python 2023年9月21日
0042

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

pandas DataFrame拼接

大家都在看