随笔记录——pandas 中 Dataframe.to_dict()

2023年7月6日下午9:12 • 人工智能 • 阅读 67

在工作中，使用pandas时，常常需要将dataframe中的数据按照指定的格式输出给下游使用，很多时候，下游指定的格式并不是很特别，而是比较常见的，这时，我们就不需要自己专门定义方法去处理了，可以先看一下有没有现成的方法可以调用，会节省我们很多时间，提高我们程序的效率。

下面我介绍一下dataframe的一个格式化输出的方法，to_dict()

df = pd.DataFrame({'col1': [1, 2],
                   'col2': [0.5, 0.75]},
                  index=['row1', 'row2'])
df
Out[3]:
      col1  col2
row1     1  0.50
row2     2  0.75

df.to_dict()
Out[4]: {'col1': {'row1': 1, 'row2': 2}, 'col2': {'row1': 0.5, 'row2': 0.75}}

默认情况下输出时，会是dict类型，key为列名，值也是dict类型，每一个key对应 index,值为对应行列具体值。

df.to_dict('series')
Out[5]:
{'col1':
 row1    1
 row2    2
 Name: col1, dtype: int64,
 'col2':
 row1    0.50
 row2    0.75
 Name: col2, dtype: float64}

指定series参数时，输出仍为dict，并且key仍为列名，但是对应的value是Series类型了

df.to_dict('split')
Out[6]:
{'index': ['row1', 'row2'],
 'columns': ['col1', 'col2'],
 'data': [[1, 0.5], [2, 0.75]]}

指定split参数时，输出仍为dict。这时是将df的各个部分分开输出， value为列表类型， data对应的是二维数组。

df.to_dict('records')
Out[7]: [{'col1': 1, 'col2': 0.5}, {'col1': 2, 'col2': 0.75}]

指定records时，丢弃了index信息，输出了一个列表，列表中每个元素为一行数据，是dict类型，每个key是列名，value是列对应的值。

df.to_dict('index')
Out[8]: {'row1': {'col1': 1, 'col2': 0.5}, 'row2': {'col1': 2, 'col2': 0.75}}

相比record来说，保留了index信息，输出为dict类型，key为index名称，value是对应行的内容。

df.to_dict(into=OrderedDict)
Out[10]:
OrderedDict([('col1', OrderedDict([('row1', 1), ('row2', 2)])),
             ('col2', OrderedDict([('row1', 0.5), ('row2', 0.75)]))])

dd = defaultdict(list)

df.to_dict('records', into=dd)
Out[12]:
[defaultdict(list, {'col1': 1, 'col2': 0.5}),
 defaultdict(list, {'col1': 2, 'col2': 0.75})]

完结。。。
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_dict.html

Original: https://blog.csdn.net/weixin_36893273/article/details/123844553
Author: 就是一顿骚操作
Title: 随笔记录——pandas 中 Dataframe.to_dict()

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/674791/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【深度学习】猫狗识别TensorFlow2实验报告

实验二：猫狗识别一、实验目的利用深度学习实现猫狗动物识别，采用Kaggle提供的公开数据集，训练深度学习模型，对测试集猫狗中的图片准确分类。通过该实验掌握深度学习中基本的CV处…

人工智能 2023年5月25日
0075
PyTorch 入门：训练一个深度神经网络(DNN)

准备知识 1. NumPy 为什么要学 NumPy？弄懂了 NumPy 的 array，可以轻松上手 PyTorch 的 tensor。请看这个对比：torch v.s. nump…

人工智能 2023年6月25日
0076
DN-DETR: Accelerate DETR Training by Introducing Query DeNoising阅读笔记

DN-DETR阅读笔记 * – (一) Title – (二) Summary – (三) Problem Statement – …

人工智能 2023年7月10日
0059
中文分词多领域语料库

中文分词多领域语料库 * – 数据处理各位NLPer，大家好！如果你还在从事中文分词领域的相关研究，你一定会发现，随着时间推移，中文分词的研究越来越少，BERT出现后…

人工智能 2023年5月28日
0059
聊一聊时间序列聚类

今天来聊一聊时间序列，嗯……为什么聊这个呢，因为近期处理的都是时间序列数据。由于组里是做事后验证的，所以常用的方法其实还是以描述型为主，较少涉及建模预测。当…

人工智能 2023年5月31日
0046
Linux:文件目录类指令(内含：文件目录所有用法总结摘要+所有用法案例)

1.总结/摘要文件目录： pwd:显示当前工作目录的绝对路径 ls -a:显示当前目录所有的文件和目录，包含隐藏的 ls -l:以列表的方式显示信息。 cd:切换到指定目录(cd…

人工智能 2023年6月29日
0058
opencv图像处理—案例实战：全景图像拼接：特征匹配方法

目录 Brute-Force蛮力匹配 1对1的匹配 k对最佳匹配随机抽样一致算法（Random sanple consensus,RANSAC）单应性矩阵实战演练：图像拼接…

人工智能 2023年6月22日
0097
MacBook M1配置Pytorch

提示：没有提示文章目录前言一、Pytorch官网二、详细步骤 * 1.查看Conda版本以及已经创建的虚拟环境 2.创建一个新的虚拟环境，安装pytorch 3.激活这个新…

人工智能 2023年7月21日
0050
什么是知识图谱？有哪些典型应用？终于有人讲明白了

导读：本文将详细阐述知识图谱的基本概念，包括知识图谱的背景、定义以及典型应用。作者：邵浩张凯李方圆张云柯戴锡强来源：大数据DT（ID：hzdashuju） 01 知识图…

人工智能 2023年6月1日
00100
基于Opencv实现的简易汉字识别

使用C++结合Opencv库实现简易汉字识别。文章目录 Opencv实现汉字识别 * 程序实现思路 – 图像预处理 + 思路实现实例对比方法模型训练识别过程 …

人工智能 2023年5月26日
00102
【机器学习】聚类算法中的 K-means 算法及其原理

系列文章目录第十四章 Python 机器学习入门之聚类算法目录系列文章目录前言一、什么是聚类二、K-means 聚类算法的直观理解三、K-means 聚类算法公式四…

人工智能 2023年6月15日
0095
OpenCV安装及其开发环境配置(C++)

目录第一章 Opencv安装及其环境变量配置 1.1下载并安装OpenCV 1.2 OpenCV环境变量配置第二章 Visual Studio 2019 编译器下载安装第三章…

人工智能 2023年7月19日
0060
Anaconda环境中PyTorch GPU版本安装（史上最全面，适用于新手的教程）

一.准备anaconda 没有anaconda可以去官网下载一下，https://www.anaconda.com/，有人觉得官网下载过慢的话，这里给你提供一个镜像网址：https…

人工智能 2023年7月21日
0081
基于旋转高频注入法的永磁同步电机无位置传感器控制

基于旋转高频注入法的永磁同步电机无位置传感器控制一、原理解说 PMSM 无位置传感器控制主要分为两类:一种是在中高速范围内利用反电动势和电角速度的关系，通过计算反电动势获取转子位…

人工智能 2023年7月27日
0063
增量学习简介（incremental learning）

文章目录 * – + 前言 + 基于正则化的增量学习 + 基于回放的增量学习 + GAN 前言个人认为增量学习的定义的边界并不明显，其与其他概念例如：持续学习(Con…

人工智能 2023年6月23日
0069
（五）比赛中的CV算法（中）目标检测的常见概念和术语

性能指标与mAP（mean average precision） mAP是目标检测中最常见的测试检测器性能的指标。在次之前先让我们看看混淆矩阵，这是机器学习中所有分类器都要确定的一…

人工智能 2023年7月2日
0070

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

随笔记录——pandas 中 Dataframe.to_dict()

大家都在看