pandas——Dataframe的多种创建方式

2023年8月9日上午4:50 • Python • 阅读 59

理解Dataframe

Dataframe是pandas中的一种数据结构，表示二维矩阵的数据表，区别于列表和字典这种一维的结构。二维具体表示为行和列，类似于sql中表的格式（或者简单理解为类似于excel中的一张表），每一列可储存不同的数据类型，比如字符型、数值型、布尔型或者object类型。

创建Dataframe

从字典中创建

import pandas as pd
d = {'广东':['广州','深圳'], '福建':['福州', '厦门']}
df = pd.DataFrame(d)

注：

使用第一种方法一般需要字典的值为列表，如果是

d = {'广东':23, '福建':8, '江苏':13}
df = pd.DataFrame(d)

会报错：ValueError: If using all scalar values, you must pass an index，意思是需要确定并传入索引index。

解决办法一可以根据想要表达的意思传入索引：

d = {'广东':23, '福建':8, '江苏':13}
df = pd.DataFrame(d, index=[0])

传入几个索引，DataFrame就会有几行，不过在这里每一行都是相同的：

d = {'广东':23, '福建':8, '江苏':13}
df = pd.DataFrame(d, index=[0,1,2])

解决办法二也可以使用list(d.items())：

list(d.items())的得到的结果是这样的，将字典转化为一对对键值对：

[('广东', 23), ('福建', 8), ('江苏', 13)]

传入Dataframe：

d = {'广东':23, '福建':8, '江苏':13}
df = pd.DataFrame(list(d.items()))

这样更接近我想要的结果

这时可以给Dataframe的列命名，相当于原来字典的key为一列，value为一列

d = {'广东':23, '福建':8, '江苏':13}
df = pd.DataFrame(list(d.items()), columns=['省', '地级市'])

解决办法三使用DataFrame.from_dict()

d = {'广东':23, '福建':8, '江苏':13}
df = pd.DataFrame.from_dict(d, orient='index')

从numpy ndarray创建

df = pd.DataFrame(np.array([['广州', '厦门', '乌鲁木齐'],
                            ['深圳', '福州', '喀什'],
                            ['汕头', '泉州', '石河子']]),
                    columns=['广东', '福建', '新疆'])

np.array与dict构造DataFrame不一样，array里面每一个list长度必须一样，代表DataFrame每一行，类似于sql insert插入表，值顺序对应好列名。

使用pd.read_csv等读取csv文件创建，或者pd.read_excel等

参考链接：https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.html?highlight=dataframe#pandas.DataFrame

Original: https://blog.csdn.net/Jason_hzs/article/details/126283076
Author: 藤原豆腐速递
Title: pandas——Dataframe的多种创建方式

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/743963/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python模块打包上传pypi-演示pytest hook函数二次开发

python模块打包上传pypi pytest hook函数二次开发修改默认编码显示中文用例名称官方文档 : https://packaging.python.org/en/…

Python 2023年9月12日
0052
基于HTML+CSS构建界面的人脸表情识别系统（有完整代码，可做为毕业设计）

基于Python Flask+HTML构建界面的人脸表情识别系统（有完整代码，可作为毕业设计）这是本科期间发表的某SCI二区论文中的部分内容，深度学习框架使用的Keras，该文仅…

Python 2023年8月13日
0077
Python中的函数

目录 Python内置函数函数式编程匿名函数(lambda) 函数作为参数返回函数(闭包) 装饰器 Python中内置的…

Python 2023年5月25日
0091
Python 中的鸭子类型和猴子补丁

大家好，我是老王。 Python 开发者可能都听说过鸭子类型和猴子补丁这两个词，即使没听过，也大概率写过相关的代码，只不过并不了解其背后的技术要点是这两个词而已。我最近在面试…

Python 2023年11月3日
0043
深度学习–浅谈torch和numpy的reshape()和view()方法的区别

reshape的使用 1、reshape(-1) * 结果：按照行的顺序将数据拉长 2、reshape维度不变 * 结果：按照行的顺序将数据重新排列 3、reshape增加一个维度…

Python 2023年8月25日
0044
数据的聚合与分组运算

目录一、分组与聚合的原理二、groupby()方法拆分成组三、数据集合一、分组与聚合原理 (1)、分组是使用特定的条件将元数据进行划分为多个组。聚合是对每个分组中的数据执行…

Python 2023年8月16日
0049
【数据分析】认识Pandas：DataFrame和Series结构、属性

数据分析工具——Pandas 认识Pandas * Dataframe 结构 – DataFrame 构造方法 dtype参数 Series 结构 – Se…

Python 2023年8月15日
0061
Pytest框架 — 07、Pytest的Fixture（部分前后置）(二)

4、Fixture的相互调用示例： import pytest 第一层fixture @pytest.fixture() def fixture_1(): data = &quo…

Python 2023年11月1日
0031
stata实现经济生态的空间杜宾模型

文章目录摘要一. Stata 实现空间杜宾模型过程 * 1.空间权重矩阵的生成 – 1.1 获取地图json数据文件 1.2 获取市级行政单元Shapefile 1…

Python 2023年10月8日
0046
python机器学习实战|机器学习入门笔记1-机器学习流程+matplotlib简单应用

文章目录 1.机器学习工作流程 2.数据集的介绍 * 2.1数据简介 2.2数据类型构成： 3.数据处理 * 3.1数据划分 3.2数据基本处理 4.特征工程 * 4.1特征提取 …

Python 2023年9月4日
0048
三、微积分

一、微积分 ; 定义函数u = f(x) = 3x² – 4x，求x = 1时的导数 %matplotlib inline import numpy as np fro…

Python 2023年9月2日
0099
输出分组_python(pandas)分组与聚合统计

Pandas分组聚合语法：df [Condition1] .groupby ([Column1, Column2], as_index=False) .agg({Column3: …

Python 2023年8月7日
0060
【数据库课程设计】SQLServer数据库课程设计（学生宿舍管理），课设报告+源码+数据库关系图

数据库课程设计——学生宿舍管理，需要全部源码可以关注私信我，把邮箱发在评论区前言一、课题背景和开发环境 * 1、课题背景 2、开发环境二、系统功能及示意图 * 1、系统实现功…

Python 2023年9月27日
0062
Pandas数据分析——常用操作

引言 Pandas是一种常见且便捷的数据处理库，为便于使用和复习，个人针对一些常用操作进行了总结。目录引言一、pandas是什么？二、pandas常用操作有哪些？ * 1….

Python 2023年8月7日
0059
pytest — Allure报告

执行和生成报告： 1）在main文件中加入如下代码： 1）在main文件中加入如下代码： if __name__ == ‘__main__’: # 指定临时json文件生成位置 p…

Python 2023年9月11日
0049
基于Java的图书管理系统（附源码和课件）

项目介绍图书管理系统作为图书馆数字化、智能化平台,是提升书籍管理能力的重要举措,为更好地发挥管理系统的技术优势,针对管理系统使用需求,本文尝试以Java技术为框架,通过必要的编码…

Python 2023年9月16日
0061

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pandas——Dataframe的多种创建方式

大家都在看