Python数据分析-pandas基础-1-常用类

2023年7月6日下午5:28 • 人工智能 • 阅读 52

Series基本数据结构，一维标签数组，能够保存任何数据类型DataFrame基本数据结构，一般为二维数组，是一组有序的列。Index索引对象，负责管理轴的相关内容groupby分组对象Timestamp时间戳对象，表示时间轴上的一个时刻。Timedelta时间差对象，用来计算两个时间点的差值。

由一组数据以及一组与之对应的标签（索引）组成。Series可以视作Numpy中的ndarray。

1.创建

pd.Series(data,index,name)

data:接收array或dict。

index:接收array或list，表示索引，必须与data长度相同。

import pandas as pd
import numpy as np
pd.Series(data=np.arange(5),index=['a','b','c','d','e'],name='ndarray')
>
a    0
b    1
c    2
d    3
e    4
Name: ndarray, dtype:int32

通过字典创建：

不必设置index的值，字典的键key自动作为其索引。

dict={'a':0,'b':1,'c':2,'d':3,'e':4}
pd.Series(dict)
>
a    0
b    1
c    2
d    3
e    4
dtype: int64

Series的常用属性：

values以ndarray的格式返回Series的所有值index返回索引dtype数据类型shape形状nbytes字节数ndim维度size返回对象个数T转置

2.访问

dict={'a':0,'b':1,'c':2,'d':3,'e':4}
series=pd.Series(dict)
series[1]
>1
series['b']
>1
series[series
a    0
b    1
c    2
d    3
dtype: int64

3.更新、插入、删除

#更新直接进行赋值即可
series['a']=100
series
>
a    100
b      1
c      2
d      3
e      4
dtype: int64

#插入新元素：append
series1=pd.Series({'f':5,'g':6})
series.append(series1)
>
a    100
b      1
c      2
d      3
e      4
f      5
g      6
dtype: int64

#插入单个数据，直接赋值即可
series['f']=6
series
>
a    100
b      1
c      2
d      3
e      5
f      6
dtype: int64

#删除元素：drop
#inplace=True表示同时更改原序列
series.drop('e',inplace=True)
series
>
a    100
b      1
c      2
d      3
f      6
dtype: int64

类似于数据库中的表，每个Series可以看作DataFrame的一列。

1.创建

pd.DataFrame(data,index,columns)

index为索引，即行标签。

columns为列名，即列标签。

#通过字典创建
dict={'col1':[0,1,2,3,4],'col2':['a','b','c','d','e']}
pd.DataFrame(dict,index=['A','B','C','D','E'])
>
    col1    col2
A   0   a
B   1   b
C   2   c
D   3   d
E   4   e

常用属性：

values以ndarray的格式返回所有值index返回索引dtypes数据类型shape形状columns列标签ndim维度size返回对象个数axes轴标签

dict={'col1':[0,1,2,3,4],'col2':['a','b','c','d','e']}
df=pd.DataFrame(dict,index=['A','B','C','D','E'])
df.index
>Index(['A', 'B', 'C', 'D', 'E'], dtype='object')
df.columns
>Index(['col1', 'col2'], dtype='object')
df.axes
>[Index(['A', 'B', 'C', 'D', 'E'], dtype='object'),
 Index(['col1', 'col2'], dtype='object')]

2.访问首尾元素

df.head()
>
    col1    col2
A   0   a
B   1   b
C   2   c
D   3   d
E   4   e
df.tail(1)
>
col1    col2
E   4   e

3.更新、插入、删除

#更新：直接赋值
df['col1']=[2,3,4,5,6]
df
>
  col1  col2
A   2   a
B   3   b
C   4   c
D   5   d
E   6   e

#插入：直接赋值
df['col3']=[5,6,7,8,9]
df
>
  col1 col2 col3
A   2   a   5
B   3   b   6
C   4   c   7
D   5   d   8
E   6   e   9

#删除
#drop(labels,axis,inplace)
#axis=0为删除行，axis=1为删除列。
df.drop('A',axis=0,inplace=True)
df
>
  col1 col2 col3
B   3   b   6
C   4   c   7
D   5   d   8
E   6   e   9

Index对象为其余pandas对象存储轴标签、管理轴标签和其他元数据。

1.创建

可以通过pd.Index函数创建，也可以在创建其他对象时传入index参数的值创建。

常用属性：

is_monotonic当Index的各元素均大于前一个元素时，返回Trueis_unique当Index没有重复值时，返回True

2.常用方法

index1=series.index
index2=df.index
index1.append(index2)#连接
>
Index(['a', 'b', 'c', 'd', 'f', 'B', 'C', 'D', 'E'], dtype='object')

index1.difference(index2)#差集
>Index(['a', 'b', 'c', 'd', 'f'], dtype='object')

index1.intersection(index2)#交集
>Index([], dtype='object')

index1.union(index2)#并集
>Index(['B', 'C', 'D', 'E', 'a', 'b', 'c', 'd', 'f'], dtype='object')

index1.isin(index2)
>array([False, False, False, False, False])

Original: https://blog.csdn.net/weixin_44020827/article/details/121500351
Author: Caspian�
Title: Python数据分析-pandas基础-1-常用类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/674429/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

一步真实解决RuntimeError: result type Float can‘t be cast to the desired output type long int

问题描述：在使用YOLO框架训练自己的数据集时候，你是不是出现了这个问题？ RuntimeError: result type Float can’t be cast…

人工智能 2023年5月30日
0084
机器学习中的时间序列预测模型

1.概述在机器学习的各类方法中，有一类主要能用于时间序列预测的模型，包括但不限于自回归模型AR、滑动平均MA、融合AR与MA的ARIMA、隐马尔可夫模型HMM、卡尔曼滤波KF、循…

人工智能 2023年6月15日
00111
超七成阅读APP都借百度语音技术促用户增长

全国十多亿人在这个春节集体”关门闭户”与手机和网络作伴，除了手游和短视频流量飞涨，在线阅读也迎来”高光时刻”，特别是当手机阅读APP…

人工智能 2023年5月25日
0068
【手把手教你】股票可视化分析之Pyecharts（二）

0 1 引言 Pyechartss 是基于Echarts 的开源可视化库，可以制作非常精美的图表。公众号推文《》，以股票交易数据为例，为大家展示了使用 Pyehcarts 构建直角…

人工智能 2023年7月16日
0066
开源开放 | 计算机科学示意图问答数据集CSDQA（CCKS2021）

OpenKG地址：http://openkg.cn/dataset/csdqa 开源地址：http://zscl.xjtudlc.com:888/CSDQA/ 开放许可协议：CC …

人工智能 2023年6月10日
0065
数据分析报告编写规范

Ⅰ、数据分析报告编写规范 – 资料来源：百度文库一份专业的数据分析报告，除了图表化呈现数据分析结果，还需要介绍此项分析的背景/目的，通过此次分析得到结论，以及结合业务…

人工智能 2023年7月8日
0096
[山东科技大学OJ]1107 Problem A: 编写函数：Swap (I) (Append Code)

Time Limit: 1 Sec Memory Limit: 16 MB Submit: 17642 Solved: 11482 [Submit][Status] Descrip…

人工智能 2023年6月27日
0088
深度学习模型试跑(十三):stylegan3

目录前言一.解读 * 1.1 论文解读 – 1.1.1 整体逻辑 1.1.2 动机 1.1.3 方法 1.1.4 部分代码二.模型搭建(以win 10为例) 三….

人工智能 2023年6月17日
0084
Lesson 7.1&Lesson 7.2 无监督学习算法与K-Means快速聚类&Mini Batch K-Means与DBSCAN密度聚类

Lesson 7.1 无监督学习算法与K-Means快速聚类从本节开始，我们将介绍无监督学习领域内最重要的一类算法——聚类算法。 import numpy as np impor…

人工智能 2023年6月2日
0094
Spring Cloud:微服务基础知识

✨ Spring Cloud:微服务基础知识一、系统架构演变 * 1. 单体应用架构 2. 垂直应用架构 3. 分布式架构 4. SOA架构 – 4.1 SOA概念 …

人工智能 2023年7月31日
0053
【开源规划器】autoware的决策规划控制模块

系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加TODO:写完再整理文章目录系列文章目录前言决策规划模块功能介绍 * 1.规划常用任务 &#8…

人工智能 2023年6月1日
0056
MMSegmentation 训练测试全流程

### 回答1： mms egmentat ion_是一个基于 _PyTorch_的 _图像分割_工具包，可以用于 _训练_和 _测试_各种 _图像分割_模型。Cityscapes…

人工智能 2023年7月23日
0042
ZYNQ图像处理(1)——vdma_hdmi显示环境搭建

1、引言 FPGA是一种现场可编程逻辑门阵列，其并行的特点让其在图像处理、数字通信等领域有广泛的应用。FPGA缺点是不擅长流程控制，对于IIC、SPI等通信方式，往往需要用到状态机…

人工智能 2023年6月18日
0081
纳什均衡求解器

1 实验目的掌握求解纳什均衡的相关算法锻炼数学基础能力及编程求解问题的能力 2 实验内容本次实验要求使用Python语言在给定代码框架下编程求解纳什均衡 (Nash Equi…

人工智能 2023年6月29日
0063
【OpenCV图像处理10】图像直方图

文章目录十、图象直方图 * 1、图像直方图的基本概念 2、使用OpenCV统计直方图 3、使用OpenCV绘制直方图 4、使用掩膜的直方图 5、直方图均衡化十、图象直方图 1、…

人工智能 2023年6月20日
0069
微信小程序是什么？如何快速搭建一个微信小程序？

目录 * – 专栏导读 – 一、微信小程序是什么 – 二、安全管理 – 三、微信小程序的功能 – 四、快速开发一个微信小…

人工智能 2023年7月1日
0071

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Python数据分析-pandas基础-1-常用类

大家都在看