python里数据框拆分_python – 在Pandas DataFrame中分割列表

2023年8月16日下午10:51 • Python • 阅读 38

如果你想留在纯大熊猫,你可以扔一个棘手的小组,并应用哪个最终沸腾到一个班轮,如果你不计算列重命名.

In [1]: import pandas as pd

In [2]: d = {‘date’: [‘4/1/11′,’4/2/11′],’ts’: [[pd.Timestamp(‘2012-02-29 00:00:00’),pd.Timestamp(‘2012-03-31 00:00:00’),pd.Timestamp(‘2012-04-25 00:00:00’),pd.Timestamp(‘2012-06-30 00:00:00’)],[pd.Timestamp(‘2014-01-31 00:00:00’)]]}

In [3]: df = pd.DataFrame(d)

In [4]: df.head()

Out[4]:

date ts

0 4/1/11 [2012-02-29 00:00:00,2012-03-31 00:00:00,201…

1 4/2/11 [2014-01-31 00:00:00]

In [5]: df_new = df.groupby(‘date’).ts.apply(lambda x: pd.DataFrame(x.values[0])).reset_index().drop(‘level_1’,axis = 1)

In [6]: df_new.columns = [‘date’,’ts’]

In [7]: df_new.head()

Out[7]:

date ts

0 4/1/11 2012-02-29

1 4/1/11 2012-03-31

2 4/1/11 2012-04-25

3 4/1/11 2012-06-30

4 4/2/11 2014-01-31

由于目标是使用列(在这种情况下为日期)的值,并重复该列,您将从列表中创建的多个行的所有值,考虑熊猫索引是有用的.

我们希望日期成为新行的单个索引,所以我们使用groupby将所需的行值放入索引.然后在那个操作里面,我想分割这个日期的这个列表,这是适用于我们的.

我正在通过应用一个由单个列表组成的熊猫系列,但是我可以通过.values [0]访问该列表,该值将系列的唯一行推送到具有单个条目的数组.

要将列表转换成一组将被传回到索引日期的行,我可以将其设置为DataFrame.这引起了追加额外索引的惩罚,但是我们最终会丢弃它.我们可以使这个索引本身,但这将排除dupe值.

一旦这个被传回来,我有一个多索引,但是我可以强制这个我们希望通过reset_index的行格式.然后我们简单地删除不需要的索引.

这听起来很重要,但是我们只是利用大熊猫功能的自然行为来避免显式的迭代或循环.

速度明智这往往是非常好的,因为它依赖于应用在这里应用工作的任何并行技巧.

可选地,如果您希望它对于具有嵌套列表的多个日期是稳健的：

df_new = df.groupby(‘date’).ts.apply(lambda x: pd.DataFrame([item for sublist in x.values for item in sublist]))

在这一点上,一个衬垫变得密集,你应该可以抛入一个功能.

Original: https://blog.csdn.net/weixin_35655990/article/details/113679982
Author: Jael Goodrich
Title: python里数据框拆分_python – 在Pandas DataFrame中分割列表

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/751553/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Pandas的应用-1

Pandas是Wes McKinney在2008年开发的一个强大的分析结构化数据的工具集。Pandas以NumPy为基础（数据表示和运算），提供了用于数据处理的函数和方法，对数据分…

Python 2023年8月8日
0043
Pandas(1)

pandas的数据结构分析分为series和DataFrame，其中series是一维的数据结构，DataFrame是二维的表格型的数据结构 series series是一个一维…

Python 2023年8月22日
0029
Tomcat安装步骤及详细配置教程（2022最新版）

网上的tomcat安装及配置教程一大堆，但是好多都过时了，根本不适用现在的版本，今天凯歌整理一篇Tomcat安装步骤及详细配置教程，2022年最新版~ Tomcat安装及配置教程主…

Python 2023年9月15日
0058
Scrapy爬取ajax加载页面且post提交参数是Request Payload的方法

1. 怎么发起请求 scrapy.FormRequest()目前还不支持Payload参数提交方法可以采用request的post方式： scrapy.Request(url, h…

Python 2023年10月4日
0036
自定义View的学习笔记1-1

这一系列主要是跟随扔物线的学习笔记。自定义View主要是三个部分，绘制，布局，触摸反馈。绘制是这三个部分中，最重要的一个。先说绘制，所谓绘制，指的就是控件内容的显示。啥意思，…

Python 2023年11月6日
0028
Python 中删除列表元素的三种方法

列表基本上是 Python 中最常用的数据结构之一了，并且删除操作也是经常使用的。那到底有哪些方法可以删除列表中的元素呢？这篇文章就来总结一下。一共有三种方法，分别是 remo…

Python 2023年11月3日
0048
【数据科学】02 pandas库-Series&DataFrame数据结构及其基本操作

import pandas as pd df = pd.read_csv(‘students.csv’,header=0,encoding=’gbk’) Series Series…

Python 2023年8月26日
0030
Flask服务器与客户端基本通信【Unity网络编程（三）】

这里先演示基于Python的客户端和服务器的登录实现。 1.Flask服务器端（GET和POST请求接收实现） 1.GET和POST区别：（简单理解） 1.GET因为是读取，就可以…

Python 2023年8月10日
0055
“Open3d:ImportError: DLL load failed: 找不到指定的模块”解决思路和方法

（1）问题分析：在python3.9的pip中下载open3d和open3d-python，版本为0.15.1和0.3.0.然后导入open3d包，import open3d a…

Python 2023年8月2日
0043
IDA pro中python3和python2相关接口对照表

Before After Notes if the chooser is , will receive (and must return) a list of selected i…

Python 2023年6月15日
0062
基于5G技术的低轨卫星物联网技术

【摘要】基于5G技术的低轨卫星物联网融合了地面5G技术灵活有效与低轨卫星网络广域覆盖的优势，是实现全球海量物联终端广域连续性泛在接入的必然选择。针对地面5G技术与低轨卫星物联网的…

Python 2023年10月10日
0036
线程

一、线程概念的引入进程之前我们已经了解了操作系统中进程的概念，程序并不能单独运行，只有将程序装载到内存中，系统为它分配资源才能运行，而这种执行的程序就称之为进程。程序和进程的区…

Python 2023年5月24日
0081
Python读取.xlsx指定行列

本文以Python3.9.1读取data.xlsx中包含的西瓜数据集3.0数据为例，数据集如下：编号色泽根蒂敲声纹理脐部触感密度含糖率好瓜1青绿蜷缩浊响清晰凹陷硬滑0.6970….

Python 2023年8月1日
0029
python——pandas基础篇

pandas基础篇（二）这部分主要整理介绍pandas的基本数据结构及其基础语法pandas的基本数据结构有两种数据类型：（1）Series(2) DataFrame 1. Se…

Python 2023年8月7日
0036
Flask框架——第一个Flask程序

目录 Flask框架介绍 Flask框架作用 Flask框架常用扩展包 Flask项目启动文件——app.py 运行Flask程序本系列文章的目的是让零基础的小伙伴从零开始一步…

Python 2023年8月13日
0057
在三维空间中表示平面和直线

平面和直线是三维计算机视觉和计算机图形学中有用的几何实体。将它们表示为一组点是低效的，这会导致很大的内存需求，具体取决于用于生成点的步长。在本文中，我将讨论如何使用向量方程表示平…

Python 2023年8月25日
0077

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

python里数据框拆分_python – 在Pandas DataFrame中分割列表

大家都在看