Python pandas Series DataFrame 创建及基本属性和方法

2023年8月22日上午10:43 • Python • 阅读 60

&#x4E00;&#x3001;Series &#x7B80;&#x4ECB;&#x3002;
&#x4E8C;&#x3001;Series &#x521B;&#x5EFA;&#x65B9;&#x5F0F;&#x3002;
&#x4E09;&#x3001;Series &#x5C5E;&#x6027;&#x4E0E;&#x65B9;&#x6CD5;&#x3002;
&#x56DB;&#x3001;DataFrame &#x7B80;&#x4ECB;&#x3002;
&#x4E94;&#x3001;DataFrame &#x521B;&#x5EFA;&#x65B9;&#x5F0F;&#x3002;
&#x516D;&#x3001;DataFrame &#x5C5E;&#x6027;&#x4E0E;&#x65B9;&#x6CD5;&#x3002;

一、Series 简介。

Series是一维结构，由一组数据和一组与之相关的数据标签(索引)组成。序列结构只有行索引（row index），没有列名称（column name），但是序列有Name、dtype和index属性，其中Name属性是指序列的名称，dtype属性是指序列值的类型，index属性是序列的索引。

Python pandas Series DataFrame 创建及基本属性和方法

; 二、Series 创建方式。

1. ndarray创建

import pandas as pd
import numpy as np

data = np.array(['a', 'b', 'c', 'd', 'e'])
ds = pd.Series(data)

ds = pd.Series(data, index=np.arange(1,6))

2. 字典创建

import pandas as pd
import numpy as np

data = {
    'a': 1.,
    'b': 2.,
    'c': 3.,
    'd': 4.

}
ds = pd.Series(data)
ds = pd.Series(data, index=['d', 'c', 'b', 'a'])

ds = pd.Series(data, index=['b', 'c', 'a', 'f'])

3. 标量创建

如果数据是标量值，则必须提供索引。将重复该值以匹配索引的长度。

import pandas as pd
import numpy as np

ds = pd.Series(5, index=[0, 1, 2, 3])

三、Series属性与方法

1. 常用属性。

import pandas as pd
import numpy as np

data = {
    'a': 1.,
    'b': 2.,
    'c': 3.,
    'd': 4.

}
ds = pd.Series(data, index=['d', 'c', 'b', 'a'], name='number', dtype='float')

ds.name
ds.index
ds.values
ds.ndim
ds.shape
ds.size
ds.empty

2.常用方法

当然也可以通过单独的函数分别计算出上面的统计量。比如：ds.min(), ds.max(), ds.median(), ds.quantile(), ds.counts()… …

常用的统计函数都可以直接调用

import pandas as pd
import numpy as np

data = {
    'a': 1.,
    'b': 2.,
    'c': 3.,
    'd': 4.

}
ds = pd.Series(data, index=['d', 'c', 'b', 'a'], name='number', dtype='float')

ds.head(2)
ds.tail(2)
ds.describe()

四、DataFrame 简介。

DataFrame存储的是二维数据，数据框的结构由row和column构成，每一行都有一个row label，每一列都有一个column label，把row和column称作axis，把row label和column label称作axis label。通常情况下，column label 是文本类型，是列名称（column name），而row label是数值类型，也称作行索引（row index）。

多维数组存储二维或三维数据时，编写函数要注意数据集的方向，这对用户来说是一种负担，就像上一章讲过的numpy中，经常遇到要填参数axis，多少还是要过脑子思考一下的。不过在处理 DataFrame 等表格数据时，index（行）或 columns（列）比 axis 0 和 axis 1 更直观。用这种方式迭代 DataFrame 的列，代码更易读易懂。用”更恰当”的方式表示数据集的方向。这样做可以让用户编写数据转换函数时，少费点脑子。

; 五、DataFrame 创建方式。

创建一个DataFrame数组可以有多种方式，其中最为常用的方式就是利用包含等长度列表或Numpy数组的字典来创建。

1.ndarrays/Lists字典创建

import pandas as pd
import numpy as np

data = {'one':[1,2,3,4],'two':[4,3,2,1]}
df = pd.DataFrame(data)

df = pd.DataFrame(data, columns=['two', 'one'])

data = {'one':np.arange(1, 6, 1), 'two':np.arange(5, 0, -1)}
df = pd.DataFrame(data, columns=['two', 'one'], index=['a', 'b', 'c', 'd', 'e'])

2.Series创建

当然除了List和ndarray之外，也支持用pandas原生的Series生成DataFrame类型

import pandas as pd
import numpy as np

data = {
    'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
    'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
}
df = pd.DataFrame(data)

六、DataFrame的属性与方法。

DataFrame和Series有很多属性与方法都是通用的，不过在此基础上还增加了一些更多的方法供我们调用。

1. 常用属性

import pandas as pd
import numpy as np

data = {
    'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
    'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
}
df = pd.DataFrame(data)

df.index
df.columns
df.axes
df.values
type(df.values)
df.ndim
df.size
df.shape

print(df.shape[0])
print(df.shape[1])

2. 常用方法

import pandas as pd
import numpy as np

data = {
    'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
    'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
}
df = pd.DataFrame(data)

df.head(3)
df.tail(3)
df.info()
df.describe()

Original: https://blog.csdn.net/qq_35240689/article/details/126990969
Author: 正在学习中的李斌
Title: Python pandas Series DataFrame 创建及基本属性和方法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/756574/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基于ASP.NET Core 6.0的整洁架构

大家好，我是张飞洪，感谢您的阅读，我会不定期和你分享学习心得，希望我的文章能成为你成长路上的垫脚石，让我们一起精进。背景最近尝试录制了一个系列视频：《ASP.NET Core …

Python 2023年10月23日
0051
python matplotlib 下标的字体设置问题

一、 python matplotlib 下标问题参考：The subscripts are not in times new roman using matplotlib [du…

Python 2023年9月1日
0055
100个Python实战项目（九）制作贪吃蛇游戏（评论抽奖送书）

💂 个人网站:【海拥】【摸鱼小游戏】【开发文档导航】 🤟 风趣幽默的人工智能学习网站：👉人工智能 💅 想寻找共同学习交流的小伙伴，请点击【全栈技术交流群】 *💬 免费且实用…

Python 2023年8月2日
0059
numpy的使用

一、numpy安装 conda install numpy # 或 pip install numpy 二、常用命令 1、查看numpy的版本 numpy._…

Python 2023年8月25日
0062
【Numpy学习笔记1】numpy安装、维度、基本运算、改变数据形态

1.Numpy使用场景需要批量处理数据的时候机器学习，人工智能这些需要进行海量数据运算处理的地方写游戏里面的物体运行逻辑时，经常涉及到矩阵、向量运算机器人模拟环境，背后的环…

Python 2023年8月29日
0064
软件测试案例｜使用 pytest+selenium 进行UI自动化测试

软件测试案例：使用 pytest+selenium 进行UI自动化测试 01、实验概述 pytest是一个非常成熟的全功能的Python测试框架，编写用例格式简单，拥有比较丰富好用…

Python 2023年9月9日
0071
python3.7怎么安装scrapy库_python3.7 Scrapy 在 Windows 平台的安装

python3.7 Scrapy 在 Windows 平台的安装 C:\Users\admin>pip installScrapy-1.6.0-py2.py3-none-an…

Python 2023年10月6日
0065
数据分析基础——Matplotlib库(2D绘图库)

前言：如果你使用的是Anaconda中的Jupyter，则不需要下载Maplotlib库；如果你使用的是pycharm或其他集成环境，则需要下载Maplotlib库。 1.导入库包…

Python 2023年9月2日
0046
Spring Boot 3.x微服务升级经历

前言 Spring Boot 3.0.0 GA版已经发布，好多人也开始尝试升级，有人测试升级后，启动速度确实快了不少，如下为网络截图，于是我也按捺不住的想尝试下。 ; 历程首先就…

Python 2023年9月15日
0053
从零使用TensorFlow搭建CNN（卷积）神经网络

🍅 写在前面👨‍🎓 博主介绍：大家好，这里是hyk写算法了吗，一枚致力于学习算法和人工智能领域的小菜鸟。🔎个人主页：主页链接（欢迎各位大佬光临指导）⭐️近期专栏：机器学习与深度学习…

Python 2023年9月30日
0046
mplayer+科大讯飞离线语音包

文章目录【1】mplayer 【2】科大讯飞离线语音包 ; 【1】mplayer 1.将mplayer放到开发板的bin目录下 system(“mplayer 1.a…

Python 2023年11月7日
0073
京东云开发者｜mysql基于binlake同步ES积压解决方案

1 背景与目标 1.1 背景国际财务泰国每月月初账单任务生成，或者重算账单数据，数据同步方案为mysql通过binlake同步ES数据，在同步过程中发现计费事件表，计费结果表均有…

Python 2023年10月15日
0039
Matplotlib绘图-第三回：布局格式定方圆

本文为DataWhale的Matplotlib训练营链接：https://datawhalechina.github.io/fantastic-matplotlib/index….

Python 2023年9月6日
0056
Flask实现分页显示数据

Flask实现分页显示数据效果图步骤首先是路由(views.py):设计思路是根据查询的页码作为参数，利用FlaskSQLAlchemy的Model进行查询并对查询结果进行分…

Python 2023年8月14日
0044
python桌面应用开发kivy_使用SPI屏幕制作触摸屏Kivy应用程序

我读到一个类似的问题，你不能使用SPI屏幕为Kivy开发。这个问题是去年被问到的，我找不到任何关于是否有任何改变的更新。 Touchscreen Kivy app for Rasp…

Python 2023年9月24日
0046
爬虫-用scrapy框架爬取腾讯视频完整案例

项目介绍这个项目我们的主题是爬腾讯视频的影片信息，包括影片名和描述搭建项目所需环境(确保python已经安装的前提下) 打开终端一个一个安装完成即可 python -m pip…

Python 2023年6月10日
0055

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31