DataFrame索引的创建与基础用法

2023年7月16日下午8:40 • 人工智能 • 阅读 66

DataFrame 是一个表格型的数据结构（数据框），它含有一组有序的列，每列可以是不同的数据类型。
DataFrame 既有行索引，也有列索引，可以看作是由多个Series索引组成的字典(共用一个索引)，数据是以二维结构存放的。

索引：是指有序列表中的位置。
Python字符串可以看作是字符列表；
每个字符都有一个从零（开始）到长度减一（结束）的索引。
对于字符串”Python”，索引按如下方式分解：
P y t h o n
0 1 2 3 4 5
此外，Python支持负索引，在这种情况下，它从末尾开始计算。最后一个字符的索引为-1，倒数第二个字符的索引为-2，等等：

字典类：

数组、列表或元组构成的字典构造 DataFrame
Series构成的字典构造 DataFrame
字典构成的字典构造 DataFrame

列表类：

2D ndarray 构造 DataFrame
Series构成的列表构造 DataFrame
字典构成的列表构造 DataFrame

>>> import numpy as np
>>> import pandas as pd

1.1 字典类构造DataFrame

注意：数组，列表或元组的元素个数要相同，否则报错


>>> dict = {'a':[1,2,3,4], 'b':(5,6,7,8), 'c':np.arange(1,5)}
>>> dict
{'a': [1, 2, 3, 4], 'b': (5, 6, 7, 8), 'c': array([1, 2, 3, 4])}
>>> frame = pd.DataFrame(dict)
>>> frame
   a  b  c
0  1  5  1
1  2  6  2
2  3  7  3
3  4  8  4

np.arange()：函数返回一个有终点和起点的固定步长的排列。
参数个数情况：
np.arange(a, b, c) 函数分为一个参数，两个参数，三个参数三种情况
1）一个参数时，参数值为终点，起点取默认值0，步长取默认值1。
2）两个参数时，第一个参数为起点，第二个参数为终点，步长取默认值1。
3）三个参数时，第一个参数为起点，第二个参数为终点，第三个参数为步长。其中步长支持小数
如：[1,2,3,4,5]，起点是1，终点是6，步长为1

指定索引行和列：
注意：指定的列索引数量可以大于原来的，如果值不是原来的会返回NAN。指定的行索引可随意变化。

>>> df = pd.DataFrame(dict, index=['A','B','C','D'], columns=['a','b','c','d'])
>>> df
   a  b  c    d
A  1  5  1  NaN
B  2  6  2  NaN
C  3  7  3  NaN
D  4  8  4  NaN

注意：不可指定索引行列名。字典键为列索引，行索引默认为位置索引。

>>> df = pd.DataFrame({'m':pd.Series(np.arange(3)),
                   'n':pd.Series(np.arange(3,5))})
>>> df
    m   n
0   0   3.0
1   1   4.0
2   2   NaN

注意：不可指定索引行列名，因为内字典键为行索引，外字典将键为列索引

>>> data = {
    'a':{'apple':3.1,'mango':4},
    'b':{'apple':3.4,'mango':5},
    'c':{'apple':3.6}}

>>> df = pd.DataFrame(data)
>>> df
        a     b     c
apple   3.1   3.4   3.6
mango   4.0   5.0   NaN

1.2 列表类构造dataframe

Original: https://blog.csdn.net/m0_53999934/article/details/125115432
Author: Hi_Night
Title: DataFrame索引的创建与基础用法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/697184/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

自然语言处理学习笔记十一（文本分类）

在文本聚类中，体验了无须标注语料库的便利性，但是无监督学习总归无法按照我们的意志预测出文档的类别，限制了文本聚类的应用场景。为了解决更多的需要将文档分门别类地归入具体的类别中，于是…

人工智能 2023年7月2日
0071
Python爬虫 BeautifulSoup（bs4）– bs4介绍、安装bs4、bs4基础语法

BeautifulSoup简介 BeautifulSoup简称： bs4 。什么是BeatifulSoup？ BeautifulSoup，和lxml一样，是一个html的解析器，…

人工智能 2023年7月5日
0089
李宏毅HLP笔记(一): End-to-End ASR Model (LAS)

LAS: Listen, Attend and Spell [Chorowski et al., NIPS’15] 基于Attention机制的end-to-end语音…

人工智能 2023年5月25日
0093
时间序列的数据分析(四):STL分解

之前已经完成了三篇关于时间序列的博客，还没有阅读过的读者请先阅读：时间序列的数据分析(一):主要成分时间序列的数据分析(二):数据趋势的计算时间序列的数据分析(三):经典时间…

人工智能 2023年7月6日
00156
Pytorch：目标检测网络-非极大值抑制(NMS)

Pytorch: 目标检测-非极大值抑制(NMS)及其变种 Copyright: Jingmin Wei, Pattern Recognition and Intelligent …

人工智能 2023年7月12日
0081
【数据结构与算法】图的基本概念

🔥 本文由程序喵正在路上原创，CSDN首发！💖 系列专栏：数据结构与算法🌠 首发时间：2022年11月8日🦋 欢迎关注🖱点赞👍收藏🌟留言🐾🌟 一以贯之的努力不得懈怠的人生阅…

人工智能 2023年6月28日
0072
电影分析案例-分析导演、演员拍电影盈利和票房（2021/07/25）

次案例主要是对数据计算的应用。如题，数据还是movie数据，分别通过以下指标分析导演和演员的盈利能力 1.计算导演的总票房gross，排名 2.计算导演的总利润gross-bud…

人工智能 2023年7月9日
0074
使用 LSTM 进行多变量时间序列预测

使用 LSTM 进行端到端时间序列预测的完整代码和详细解释。在本文中我们将使用深度学习方法 (LSTM) 执行多元时间序列预测。我们先来了解两个主题—— 什么是时间序列分析？ …

人工智能 2023年6月16日
0058
【机器学习】：如何对你的数据进行分类？

机器学习：如何对你的数据进行分类 🌸个人主页：JoJo的数据分析历险记 📝个人介绍：统计学top3研究生 💌如果文章对你有帮助，欢迎✌ 关&#x6C…

人工智能 2023年7月3日
0078
机器学习之AUC、AUPRC、F1等评价指标的含义

AUC = 0.506031 AUC(area under the curve)是模型评估指标，特别是二分类模型使用的主要离线评测指标之一。参考博客，AUC值是ROC曲线与x轴围…

人工智能 2023年6月15日
00118
用 Python 提取 PDF 文本的简单方法

你好，我是征哥，一般情况下，Ctrl+C 是最简单的方法，当无法 Ctrl+C 时，我们借助于 Python，以下是具体步骤：第一步，安装工具库 1、tika — 用于从各种文件…

人工智能 2023年6月19日
0082
从0到1带你搭建一个vue3.0项目(vue-cli脚手架版）

回答1：要在中使用ant-design-vue，需要先安装ant-design-vue和。可以使用npm或yarn来安装这些依赖项。安装完成后，需要在Vue应用程序中引入a…

人工智能 2023年6月2日
00104
Yolov5环境搭建

YOLOv5环境搭建 1.创建虚拟环境打开Anaconda prompt，创建YOLOv5虚拟环境，我的python版本是3.8 conda create -n yolov5 p…

人工智能 2023年6月17日
0076
图像评价指标（python）

代码： import cv2 import numpy as np import math tmp = [] for i in range(256): tmp.append(0) …

人工智能 2023年6月18日
00102
【NLP】NLTK工具集使用

学习总结文章目录学习总结一、Natural Language Toolkit 二、常用语料库和词典三、常用NLP工具 * 3.1 分句 3.2 标记解析 3.3 词性标注 …

人工智能 2023年5月31日
00112
FPN结构详解

Feature Pyramid Networks FPN主要解决的是物体检测中的多尺度问题，通过简单的网络连接改变，在基本不增加原有模型计算量的情况下，大幅度提升了小物体检测的性能…

人工智能 2023年7月13日
00102

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

DataFrame索引的创建与基础用法

1.1 字典类构造DataFrame

1.2 列表类构造dataframe

大家都在看