python里数据框拆分_python – 在Pandas DataFrame中分割列表

如果你想留在纯大熊猫,你可以扔一个棘手的小组,并应用哪个最终沸腾到一个班轮,如果你不计算列重命名.

In [1]: import pandas as pd

In [2]: d = {‘date’: [‘4/1/11′,’4/2/11′],’ts’: [[pd.Timestamp(‘2012-02-29 00:00:00’),pd.Timestamp(‘2012-03-31 00:00:00’),pd.Timestamp(‘2012-04-25 00:00:00’),pd.Timestamp(‘2012-06-30 00:00:00’)],[pd.Timestamp(‘2014-01-31 00:00:00’)]]}

In [3]: df = pd.DataFrame(d)

In [4]: df.head()

Out[4]:

date ts

0 4/1/11 [2012-02-29 00:00:00,2012-03-31 00:00:00,201…

1 4/2/11 [2014-01-31 00:00:00]

In [5]: df_new = df.groupby(‘date’).ts.apply(lambda x: pd.DataFrame(x.values[0])).reset_index().drop(‘level_1’,axis = 1)

In [6]: df_new.columns = [‘date’,’ts’]

In [7]: df_new.head()

Out[7]:

date ts

0 4/1/11 2012-02-29

1 4/1/11 2012-03-31

2 4/1/11 2012-04-25

3 4/1/11 2012-06-30

4 4/2/11 2014-01-31

由于目标是使用列(在这种情况下为日期)的值,并重复该列,您将从列表中创建的多个行的所有值,考虑熊猫索引是有用的.

我们希望日期成为新行的单个索引,所以我们使用groupby将所需的行值放入索引.然后在那个操作里面,我想分割这个日期的这个列表,这是适用于我们的.

我正在通过应用一个由单个列表组成的熊猫系列,但是我可以通过.values [0]访问该列表,该值将系列的唯一行推送到具有单个条目的数组.

要将列表转换成一组将被传回到索引日期的行,我可以将其设置为DataFrame.这引起了追加额外索引的惩罚,但是我们最终会丢弃它.我们可以使这个索引本身,但这将排除dupe值.

一旦这个被传回来,我有一个多索引,但是我可以强制这个我们希望通过reset_index的行格式.然后我们简单地删除不需要的索引.

这听起来很重要,但是我们只是利用大熊猫功能的自然行为来避免显式的迭代或循环.

速度明智这往往是非常好的,因为它依赖于应用在这里应用工作的任何并行技巧.

可选地,如果您希望它对于具有嵌套列表的多个日期是稳健的:

df_new = df.groupby(‘date’).ts.apply(lambda x: pd.DataFrame([item for sublist in x.values for item in sublist]))

在这一点上,一个衬垫变得密集,你应该可以抛入一个功能.

Original: https://blog.csdn.net/weixin_35655990/article/details/113679982
Author: Jael Goodrich
Title: python里数据框拆分_python – 在Pandas DataFrame中分割列表

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/751553/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • Pandas的应用-1

    Pandas是Wes McKinney在2008年开发的一个强大的分析结构化数据的工具集。Pandas以NumPy为基础(数据表示和运算),提供了用于数据处理的函数和方法,对数据分…

    Python 2023年8月8日
    043
  • Pandas(1)

    pandas的数据结构分析 分为series和DataFrame,其中series是一维的数据结构,DataFrame是二维的表格型的数据结构 series series是一个一维…

    Python 2023年8月22日
    029
  • Tomcat安装步骤及详细配置教程(2022最新版)

    网上的tomcat安装及配置教程一大堆,但是好多都过时了,根本不适用现在的版本,今天凯歌整理一篇Tomcat安装步骤及详细配置教程,2022年最新版~ Tomcat安装及配置教程主…

    Python 2023年9月15日
    058
  • Scrapy爬取ajax加载页面且post提交参数是Request Payload的方法

    1. 怎么发起请求 scrapy.FormRequest()目前还不支持Payload参数提交方法可以采用request的post方式: scrapy.Request(url, h…

    Python 2023年10月4日
    036
  • 自定义View的学习笔记1-1

    这一系列主要是跟随扔物线的学习笔记。 自定义View主要是三个部分,绘制,布局,触摸反馈。 绘制是这三个部分中,最重要的一个。 先说绘制,所谓绘制,指的就是控件内容的显示。啥意思,…

    Python 2023年11月6日
    028
  • Python 中删除列表元素的三种方法

    列表基本上是 Python 中最常用的数据结构之一了,并且删除操作也是经常使用的。 那到底有哪些方法可以删除列表中的元素呢?这篇文章就来总结一下。 一共有三种方法,分别是 remo…

    Python 2023年11月3日
    048
  • 【数据科学】02 pandas库-Series&DataFrame数据结构及其基本操作

    import pandas as pd df = pd.read_csv(‘students.csv’,header=0,encoding=’gbk’) Series Series…

    Python 2023年8月26日
    030
  • Flask服务器与客户端基本通信【Unity网络编程(三)】

    这里先演示基于Python的客户端和服务器的登录实现。 1.Flask服务器端(GET和POST请求接收实现) 1.GET和POST区别:(简单理解) 1.GET因为是读取,就可以…

    Python 2023年8月10日
    055
  • “Open3d:ImportError: DLL load failed: 找不到指定的模块”解决思路和方法

    (1) 问题分析:在python3.9的pip中下载open3d和open3d-python,版本为0.15.1和0.3.0.然后导入open3d包,import open3d a…

    Python 2023年8月2日
    043
  • IDA pro中python3和python2相关接口对照表

    Before After Notes if the chooser is , will receive (and must return) a list of selected i…

    Python 2023年6月15日
    062
  • 基于5G技术的低轨卫星物联网技术

    【摘 要】基于5G技术的低轨卫星物联网融合了地面5G技术灵活有效与低轨卫星网络广域覆盖的优势,是实现全球海量物联终端广域连续性泛在接入的必然选择。针对地面5G技术与低轨卫星物联网的…

    Python 2023年10月10日
    036
  • 线程

    一、线程概念的引入 进程 之前我们已经了解了操作系统中进程的概念,程序并不能单独运行,只有将程序装载到内存中,系统为它分配资源才能运行,而这种执行的程序就称之为进程。程序和进程的区…

    Python 2023年5月24日
    081
  • Python读取.xlsx指定行列

    本文以Python3.9.1读取data.xlsx中包含的西瓜数据集3.0数据为例,数据集如下: 编号色泽根蒂敲声纹理脐部触感密度含糖率好瓜1青绿蜷缩浊响清晰凹陷硬滑0.6970….

    Python 2023年8月1日
    029
  • python——pandas基础篇

    pandas基础篇(二) 这部分主要整理介绍pandas的基本数据结构及其基础语法pandas的基本数据结构有两种数据类型:(1)Series(2) DataFrame 1. Se…

    Python 2023年8月7日
    036
  • Flask框架——第一个Flask程序

    目录 Flask框架介绍 Flask框架作用 Flask框架常用扩展包 Flask项目 启动文件——app.py 运行Flask程序 本系列文章的目的是让零基础的小伙伴从零开始一步…

    Python 2023年8月13日
    057
  • 在三维空间中表示平面和直线

    平面和直线是三维计算机视觉和计算机图形学中有用的几何实体。将它们表示为一组点是低效的,这会导致很大的内存需求,具体取决于用于生成点的步长。 在本文中,我将讨论如何使用向量方程表示平…

    Python 2023年8月25日
    077
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球