52_Pandas处理日期和时间列（字符串转换、日期提取等）

2023年9月30日下午4:01 • Python • 阅读 87

52_Pandas处理日期和时间列（字符串转换、日期提取等）

将解释如何操作表示 pandas.DataFrame 的日期和时间（日期和时间）的列。字符串与 datetime64[ns] 类型的相互转换，将日期和时间提取为数字的方法等。

以下内容进行说明。

将字符串转换为 datetime64[ns] 类型（时间戳类型）：to_datetime()

时间戳类型属性/方法

使用 dt 访问器批量处理整个列

对于日期时间索引

从文件读取时将字符串转换为 datetime64[ns] 类型

如何将 datetime64[ns] 类型指定为索引并将其处理为时序数据以及如何使用，请参考以下文章。

以带有以下 csv 文件的 pandas.DataFrame 为例。

import pandas as pd
import datetime

df = pd.read_csv('./data/sample_datetime_multi.csv')

print(df)

将字符串转换为 datetime64[ns] 类型（时间戳类型）：to_datetime()

print(pd.to_datetime(df['A']))

如果格式不标准，请在参数格式中指定格式字符串。

print(pd.to_datetime(df['B'], format='%Y年%m月%d日 %H时%M分'))

即使原始格式不同，如果指示的日期和时间相同，则 datetime64[ns] 类型值是等价的。

print(pd.to_datetime(df['A']) == pd.to_datetime(df['B'], format='%Y年%m月%d日 %H时%M分'))

如果要将转换为 datetime64[ns] 类型的列作为新列添加到 pandas.DataFrame，请指定新列名并分配它。如果您指定原始列名，它将被覆盖。

df['X'] = pd.to_datetime(df['A'])

print(df)

时间戳类型属性/方法

pandas.to_datetime() 函数转换的列的dtype是datetime64[ns]类型，每个元素都是Timestamp类型。

print(df)

print(df.dtypes)

print(df['X'][0])

print(type(df['X'][0]))

Timestamp 类型继承并扩展了 Python 标准库 datetime 的 datetime 类型。

print(issubclass(pd.Timestamp, datetime.datetime))

可以获取年、月、日（年、月、日）、时、分、秒（时、分、秒）、星期几（字符串：weekday_name，数字：dayofweek）等作为属性。

print(df['X'][0].year)

print(df['X'][0].weekday_name)

还可以使用 to_pydatetime() 转换为 Python 标准库 datetime 类型，使用 to_datetime64() 转换为 NumPy datetime64[ns] 类型。

py_dt = df['X'][0].to_pydatetime()
print(type(py_dt))

dt64 = df['X'][0].to_datetime64()
print(type(dt64))

timestamp() 是一种以浮点浮点类型返回 UNIX 时间（纪元秒 = 自 1970 年 1 月 1 日 00:00:00 以来的秒数）的方法。如果需要整数，请使用 int()。

print(df['X'][0].timestamp())

print(pd.to_datetime('1970-01-01 00:00:00').timestamp())

print(int(df['X'][0].timestamp()))

与 Python 标准库中的 datetime 类型一样，strftime() 可用于转换为任何格式的字符串。请参阅下文，了解如何将其应用于列的所有元素。

print(df['X'][0].strftime('%Y/%m/%d'))

使用 dt 访问器批量处理整个列

有一个 str 访问器将字符串处理应用于整个 pandas.Series。

与Timestamp类型一样，年、月、日（年、月、日）、时、分、秒（时、分、秒）、星期几（字符串：weekday_name，数字：dayofweek）等都可以作为属性获得。在 dt 之后写下每个属性名称。 pandas.Series 的每个元素都被处理并返回 pandas.Series。

print(df['X'].dt.year)

print(df['X'].dt.hour)

也可以使用 dayofweek（星期一为 0，星期日为 6）仅提取一周中特定日期的行。

print(df['X'].dt.dayofweek)

print(df[df['X'].dt.dayofweek == 4])

当使用 astype() 方法将 datetime64[ns] 类型的列转换为字符串 str 类型时，它会转换为标准格式的字符串。

print(df['X'].astype(str))

dt.strftime() 可用于一次将列转换为任何格式的字符串。也可以使其成为仅具有日期或仅具有时间的字符串。

print(df['X'].dt.strftime('%A, %B %d, %Y'))

print(df['X'].dt.strftime('%Y年%m月%d日'))

如果要将转换为字符串的列作为新列添加到 pandas.DataFrame，请指定新列名并分配它。如果您指定原始列名，它将被覆盖。

df['en'] = df['X'].dt.strftime('%A, %B %d, %Y')
df['cn'] = df['X'].dt.strftime('%Y年%m月%d日')

print(df)

可以使用 dt.to_pydatetime() 获得一个 NumPy 数组 ndarray，其元素是 Python 标准库的日期时间类型对象。

print(df['X'].dt.to_pydatetime())

print(type(df['X'].dt.to_pydatetime()))
print(type(df['X'].dt.to_pydatetime()[0]))

NumPy的datetime64[ns]类型数组可以用values属性代替方法获取。

print(df['X'].values)

print(type(df['X'].values))
print(type(df['X'].values[0]))

例如，Timestamp 类型有一个返回 UNIX 时间（秒）的方法 (timestamp())，但 dt 访问器没有。在这种情况下，使用 map() 即可。

print(df['X'].map(pd.Timestamp.timestamp))

如果要转换为整数 int 类型，请使用 astype() 方法。

print(df['X'].map(pd.Timestamp.timestamp).astype(int))

对于日期时间索引

在处理时间序列数据时非常有用。有关详细信息，请参阅下面的文章。

在示例中，set_index() 用于将现有列指定为索引，为方便起见，使用 drop() 方法删除多余的列。

df_i = df.set_index('X').drop(['en', 'cn'], axis=1)

print(df_i)

print(df_i.index)

DatetimeIndex 类型索引具有年、月、日（年、月、日）、时、分、秒（时、分、秒）、星期几（字符串：weekday_name，数字：dayofweek）等属性，以及方法如由于提供了 strftime()，因此可以一次处理所有索引元素，而无需通过 dt 属性。

返回类型因属性和方法而异，不是pandas.Series，但如果要在pandas.DataFrame中添加新列，可以指定新列名并分配。

print(df_i.index.minute)

print(df_i.index.strftime('%y/%m/%d'))

df_i['min'] = df_i.index.minute
df_i['str'] = df_i.index.strftime('%y/%m/%d')

print(df_i)

从文件读取时将字符串转换为 datetime64[ns] 类型

从文件中读取数据时，可以在读取时将字符串转换为 datetime64[ns] 类型。对于 pandas.read_csv() 函数，在参数 parse_dates 中指定要转换为 datetime64[ns] 类型的列号列表。请注意，即使只有一个，也必须列出。

df_csv = pd.read_csv('data/sample_datetime_multi.csv', parse_dates=[0])

print(df_csv)

print(df_csv.dtypes)

df_csv_jp = pd.read_csv('./data/sample_datetime_multi.csv',
                        parse_dates=[1],
                        date_parser=lambda date: pd.to_datetime(date, format='%Y年%m月%d日 %H时%M分'))

print(df_csv_jp)

print(df_csv_jp.dtypes)

可以使用参数 index_col 指定要索引的列。

在这种情况下，如果参数 parse_dates=True，索引列将被转换为 datetime64[ns] 类型。

df_csv_jp_i = pd.read_csv('./data/sample_datetime_multi.csv',
                          index_col=1,
                          parse_dates=True,
                          date_parser=lambda date: pd.to_datetime(date, format='%Y年%m月%d日 %H时%M分'))

print(df_csv_jp_i)

print(df_csv_jp_i.index)

读取 Excel 文件的 pandas.read_excel() 函数也有参数 parse_dates、date_parser 和 index_col，因此在读取时也可以进行类似的转换。有关 pandas.read_excel() 函数的信息，请参阅以下文章。

Original: https://blog.csdn.net/qq_18351157/article/details/127703926
Author: 饺子大人
Title: 52_Pandas处理日期和时间列（字符串转换、日期提取等）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/788082/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python命令行式的优缺点_Pytest VS Unittest 简单说一下之间的优缺点

一、什么是单元测试框架？ unittest 是python标准的单元测试框架模块 pytest 是python第三方库的测试框架二、从兼容性方面考虑因unnitest是标准库，…

Python 2023年9月12日
0054
Scrapy爬取博人传漫画

Scrapy框架、为什么要学习scrapy？理由：日常的Requests + Selenium虽然可以爬取网站内容，一旦遇到下载文件/图片，下载速度慢的鸡肋很快就暴露出来，有人说…

Python 2023年10月4日
0064
Java开发学习(三十九)—-SpringBoot整合mybatis

一、回顾Spring整合Mybatis Spring整合 Mybatis需要定义很多配置类 SpringConfig配置类导入 JdbcConfig配置类导入 MybatisC…

Python 2023年10月16日
0054
一个简单的Scrapy项目(房天下)

首先通过命令创建一个Scrapy项目 scrapy startproject xxxx 创建完后通过pycharm软件打开之后通过命令创建py文件指定到你想要爬取的网址 scr…

Python 2023年10月3日
0040
Prometheus 基于Python Django实现Prometheus Exporter

需求描述运行监控需求，需要采集Nginx 每个URL请求的相关信息，涉及两个指标：一分钟内平均响应时间，调用次数，并且为每个指标提供3个标签：请求方法，请求状态，请求URL，并向…

Python 2023年5月25日
0089
Pandas 多层级索引 Python 数据处理案例指南

今天我们来聊一下 Pandas当中的数据集中带有多重索引的数据分析实战通常我们接触比较多的是单层索引，而多级索引也就意味着数据集当中的行索引有多个层级，具体的如下图所示 ; 导入…

Python 2023年8月17日
0069
PHP接口报错：Unable to init from given binary data

前因：事情是这样的，前几天不是使用Laravel做了一个图片比对的功能么，因为需要安装Composer扩展，并且这个扩展的使用，需要开启PHP的GD库的扩展支持。所以本地以及都…

Python 2023年6月12日
0085
8 个例子帮你快速掌握 Pandas 索引操作

如果您使用Python作为数据处理的语言，那么pandas很可能是你代码中使用最多的库之一。pandas的关键数据结构是DataFrame，这是一个类似电子表格的数据表，由行和列组…

Python 2023年8月6日
0069
数据驱动测试-从方法探研到最佳实践

作者：刘红妍导读在自动化测试实践中，测试数据是制造测试场景的必要条件，本文主要讲述了在沟通自动化框架如何分层，数据如何存储，以及基于单元测试pytest下如何执行。并通过实践案…

Python 2023年10月12日
0039
Python番外篇：Flask框架实现一个文件共享服务器

hello，大家好，我是wangzirui32，今天来教大家如何使用Flask框架实现一个文件共享服务器。开始学习吧！学习目录前言 1. 项目架构 2. app.py编写 3….

Python 2023年8月12日
0060
消息的种类与消息队列的处理方式

消息的种类 1.1 按照发送的特点分同步消息异步消息单向消息举例：同步消息我去小吃店要了一套煎饼果子，在门口等了十分钟，煎饼果子好了老板告诉我让我取餐。异步消息我去…

Python 2023年6月11日
0071
Python 将列表数据生成折线图（Pandas使用）

前言本文提供python将列表数据画图的样例代码。主要是给自己的记录，顺便分享一下。主要使用到的库是：pandas、matplotlib。代码下面直接发一下样例代码。 #!/…

Python 2023年11月9日
0049
python中axis和value_python – Pandas错误“*** ValueError：长度不匹配：预期的轴有0个元素,新值有……”…

我在访问Pandas DataFrame df中的数据时遇到错误： ipdb> df.loc[1988,’ATTEND’] *** ValueErro…

Python 2023年8月21日
0062
R3.Matplotlib_绘制散点图和折线统计图

Part_1：散点图 scatter() pyplot中绘制散点图的函数为scatter 格式：matplotlib.pyplot.scatter(x,y,s=None,c=Non…

Python 2023年9月1日
0041
python数据框追加_将行追加到Pandas数据框将添加0列

附加正在尝试将列附加到数据帧。它试图追加的列没有命名，其中有两个None/Nan元素，pandas将(默认情况下)命名为列0。若要成功执行此操作，数据帧追加中的列名必须与当前数据…

Python 2023年8月8日
0072
odoo关于计算字段store=True时导致的安装/更新时间较长问题的解决方案

Odoo安装/更新模块原理 Odoo每次安装/更新模块时，会进行以下几步处理： 1.判断是否需要创建表，如果需要创建且表不存在，则进行表的创建(不进行字段的创建)； 2.获取该表中…

Python 2023年10月30日
0034

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

52_Pandas处理日期和时间列（字符串转换、日期提取等）

52_Pandas处理日期和时间列（字符串转换、日期提取等）

将字符串转换为 datetime64[ns] 类型（时间戳类型）：to_datetime()

时间戳类型属性/方法

使用 dt 访问器批量处理整个列

对于日期时间索引

从文件读取时将字符串转换为 datetime64[ns] 类型

将字符串转换为 datetime64[ns] 类型（时间戳类型）：to_datetime()

时间戳类型属性/方法

使用 dt 访问器批量处理整个列

对于日期时间索引

从文件读取时将字符串转换为 datetime64[ns] 类型

大家都在看