TOOLS_Pandas根据日期列进行分组统计及绘图的使用示例

2023年8月8日下午2:40 • Python • 阅读 66

Pandas根据日期列进行分组统计及绘图的使用示例

导入所需要的库


from logging import warning
import os, sys
import datetime
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

plt.rcParams["font.sans-serif"] = ["SimHei"]
plt.rcParams["axes.unicode_minus"] = False


df = pd.read_excel("./无标题1.xlsx")
df.head()

m_idmax_ivrecord_idrecord_namerecord_sub_namepub_timelanguageversioncreate_timecount_singer0000DmZbU1RUrem49359118379野摩托NaN2021-04-151.0NaN2022-09-28 22:27:5411000SOicI1YXaDP6035981658不可以这样（反英雄）NaN2021-04-151.0NaN2022-09-29 05:29:0212000ibM5x4Jx2f49782425705心存侥幸NaN2021-04-151.0NaN2022-09-29 01:00:0313004OL7tM1gklPK12212310361如果在一起NaN2021-04-151.0NaN2022-09-29 00:03:1714004D5jPe0h8Q6C12194413841钗头凤.十年生死两茫茫NaN2021-04-151.0NaN2022-09-29 00:54:411

日期列非index的处理方式

对日期列series进行apply变换处理，得到用于分组的key：

对 pub_time 列进行 year和month的key提取；
然后将其送入数据框的groupby；
然后对分组内容进行相应统计值的方法调用；


key_year = lambda x:x.year
key_month = lambda x:x.month

df1 = df.groupby([df['pub_time'].apply(key_year),df['pub_time'].apply(key_month)]).count()

df1['m_id']

pub_time  pub_time
2021      4            567
          5           1026
          6           1163
          7           1337
          8           1386
          9           1465
          10          1498
          11          1478
          12          1482
2022      1           1205
          2            761
          3           1224
          4           1410
          5           1324
          6           1347
          7            966
          8            965
          9            909
          10           639
          11           145
Name: m_id, dtype: int64


df1['m_id'].plot()
plt.title('完整时序指数数据每月数量')
plt.xlabel('year,month')
plt.ylabel('m_id count')
plt.grid()
plt.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4JLTHrIi-1668063889609)(output_6_0.png)]

日期作为index的处理方式


df.index = pd.to_datetime(df.pub_time)

df2 = df.groupby([df.index.year, df.index.month]).count()
df2['m_id']

ym_agg = df.groupby([df.index.year, df.index.month]).agg({'max_iv':['max','mean','min','count']})
ym_agg

max_ivmaxmeanmincountpub_timepub_time20214421189066834.20987760275675541295677094.117934600510266274486372879.793637600011637595171778934.391922600313378358016257704.013709600813869455031959929.7672356008146510377105553772.2783716008149811624210472782.0852506001147812636264684906.5296906008148220221202053461655.124481600712052932501575054.32851560167613180821558802.9517976000122441093250081737.102837600914105469069074068.342900600413246458175063106.03489260031347715988460100434.18633560179668107315642211451.45285060019659412523690661.900990600790910145097680869.0203446007639112586974133693.7034486056145

ym_agg.plot()
plt.xlabel('year,month')
plt.ylabel('max_iv analysis')
plt.grid()
plt.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9GFZFVGr-1668063889611)(output_9_0.png)]

ym_agg.max_iv['mean'].plot()
plt.xlabel('year,month')
plt.ylabel('max_iv mean')
plt.grid()
plt.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TMWDeO8s-1668063889611)(output_10_0.png)]

ym_agg.max_iv['max'].plot()
plt.xlabel('year,month')
plt.ylabel('max_iv max')
plt.grid()
plt.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0cPUHXLn-1668063889612)(output_11_0.png)]

ym_agg.max_iv['min'].plot()
plt.xlabel('year,month')
plt.ylabel('max_iv min')
plt.grid()
plt.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0D9D7Il7-1668063889612)(output_12_0.png)]

ym_agg.max_iv['count'].plot()
plt.xlabel('year,month')
plt.ylabel('max_iv count')
plt.grid()
plt.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fi2rCmfL-1668063889613)(output_13_0.png)]

Original: https://blog.csdn.net/baby_hua/article/details/127789265
Author: baby_hua
Title: TOOLS_Pandas根据日期列进行分组统计及绘图的使用示例

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/742480/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

linux 上安装 NTL（wsl2）

说明： NTL_GMP_LIP flag set GMP version check (6.1.2/6.1.2) 安装 m4 sudo apt-get install m4 安装g…

Python 2023年6月10日
0080
【关于pytest.main的使用自动化测试】

pytest 运行用例的时候，一般用命令行去执行，有些小伙伴不太习惯命令行运行用例，（即pytest 命令行运行）可能是之前深受 unittest 框架的影响，习惯在项目的根目录下…

Python 2023年9月12日
0044
Python中的函数

今天天气有些回暖，我们讲一下python的函数，逻辑性比较强，大家看的仔细点，然后练习的时候注意些别打错了。目录一、作业回顾二、Python中函数的作用与使用步骤 * 1、为…

Python 2023年9月19日
0045
【2008NOIP普及组】T3. 传球游戏试题解析

【2008NOIP普及组】T3. 传球游戏试题解析时间限制: 1000 ms 内存限制: 65536 KB【题目描述】上体育课的时候，小蛮的老师经常带着同学们一起做游戏。这次，老…

Python 2023年9月29日
0032
pytest简介及和unittest（pyunit）的区别

1、pytest简介 Pytest是python的一种单元测试框架。入门简单，文档丰富支持单元测试，功能测试支持参数化，重复执行，部分执行，测试跳过 @pytest.mark.s…

Python 2023年9月10日
0054
python dataframe调整列顺序_Python pandas.DataFrame调整列顺序及修改index名的方法

从字典创建DataFrame import pandas dict_a = {‘user_id’:[‘webbang’,&#8217…

Python 2023年8月19日
0072
【机器学习】李宏毅——Explainable ML(可解释性的机器学习)

在前面的学习之中，我们已经学习了很多的模型，它能够针对特定的任务，接受我们的输入并产生目标的输出。但我们并不满足于此，我们甚至希望机器告诉我们，它是如何得到这个答案的，而这就是可…

Python 2023年10月28日
0047
__new__()方法使用

class C2F(float): def __new__(cls,degrees_c): degrees_f = degrees_c*1.8 +32#需要转化的公式 return…

Python 2023年6月15日
0067
一维信号的频域特征分析python

频域分析是按照频率观察信号特征。在一般情况下，我们分析信号习惯从时域方向开始，因为时域的分析更加直观，但频域的表示更加简洁，从这方面去分析对信号了解更加深刻。通过分析振动信号…

Python 2023年10月9日
0071
【Flask】路由和URL

一、路由 @app.route(‘/index’) def view_function(): return "hello kobe" 在程序中获取路由信息在应用…

Python 2023年8月13日
0049
【图像处理】opencv | 图像的载入，显示，保存 | 视频流的载入，显示，保存

文章目录前言一、cv2读取图片并展示 * 1.1、cv2.imread读取图片 1.2、cv2.imshow展示图片 1.3、完整代码 1.4、封装函数调用 1.5、cv2读取…

Python 2023年9月5日
0070
Python学习笔记#1：使用genfromtxt读取txt中数据

Python学习笔记#1：使用genfromtxt读取txt中数据 1. 语法： numpy.genfromtxt(fname, dtype= 从文本文件加载数据，缺失值按指定处理…

Python 2023年8月26日
00118
【C++】怎么样实现一个无限循环

有用户提问：怎么样实现一个无限循环这样实现：要用上以前常用的 while(bool);了，还要用布尔值({ true 和 false})中的一个，那你们猜猜会用哪个呢？回到正…

Python 2023年6月9日
00100
【Python中统计矩阵元素个数 numpy.size()函数】

【小白从小学Python、C、Java】【Python全国计算机等级考试】【Python数据分析考试必会题】 ● 标题与摘要 Python中统计矩阵元素个数 numpy.siz…

Python 2023年8月23日
0076
Python——最全的Numpy Pandas库的学习笔记

文章目录 * – Numpy – + 属性 + 数组的创建 + 数组的变换 + 数组的运算 + 随机数函数 + 统计函数 + 矩阵运算计算特征值 + 排序…

Python 2023年8月25日
0073
Python中apply和map的区别

文章目录一、apply用法二、map用法 apply和map的区别概括：apply：用在dataframe上，用于对row或者column进行计算applymap ：用于da…

Python 2023年8月16日
0048

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

TOOLS_Pandas根据日期列进行分组统计及绘图的使用示例

日期列非index的处理方式

日期作为index的处理方式

大家都在看