pandas 基于日期的统计

2023年11月10日上午12:59 • Python • 阅读 46

概要

分析时间序列数据时，按照日期的维度进行统计几乎是必备的需求。
基于pandas，可以方便的进行各种日期维度（年份，季度，月，周等等）的统计，不用去遍历每行数据去统计。

示例-销售数据统计

演示数据来源一些销售数据，可以点击这里下载。

每行数据包括日期，国家，城市，地区，销售额和利润等字段，我们主要使用日期，销售额和利润3个字段。

下面的演示代码，我是在 jupyter notebook 中运行的。

导入数据

导入数据比较简单，下载的压缩包解压后，有个excel文件，可以通过 pandas 直接导入。

import pandas as pd

xlsx_path = "./通讯产品销售数据.xlsx"

df_sales = pd.read_excel(xlsx_path, sheet_name="SalesData")
df_sales

df_sales.dtypes

按【年份】统计

df_year_sales = df_sales[["日期", "地区","销售额", "利润"]].copy(deep=True)

df_year_sales["日期"] = df_year_sales["日期"].apply(lambda x: x.year)
df_year_sales.groupby(["日期", "地区"]).sum()

按【季度】统计

df_quarter_sales = df_sales[["日期", "地区", "销售额", "利润"]].copy(deep=True)

df_quarter_sales["日期"] = df_quarter_sales["日期"].apply(lambda x: "{}Q{}".format(x.year, x.quarter))
df_quarter_sales.groupby(["日期", "地区"]).sum()

按【月份】统计

df_month_sales = df_sales[["日期", "地区", "销售额", "利润"]].copy(deep=True)

df_month_sales["日期"] = df_month_sales["日期"].apply(lambda x: "{}-{}".format(x.year, x.month))
df_month_sales.groupby(["日期", "地区"]).sum()

按【周】统计

周的数据比较多，这里只取2020年的数据
df_week_sales = df_sales[["日期", "地区", "销售额", "利润"]].copy(deep=True)
df_week_sales = df_week_sales[df_week_sales["日期"] > '2019-12-31']

df_week_sales["日期"] = df_week_sales["日期"].apply(lambda x: "{}年第{:02d}周".format(x.year, x.week))
df_week_sales.groupby(["日期", "地区"]).sum().sort_values(["日期"])

Original: https://www.cnblogs.com/wang_yb/p/15856256.html
Author: wang_yb
Title: pandas 基于日期的统计

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/815057/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

ChatGPT初体验——震撼，好用，贾维斯已来

2022.12.26大概一个月的使用体验，我觉得chagpt的使用还算远远超出我的想象，可以说只有你想不到的，最近需要写一个基于shell的学生选课系统，但是时间实在是紧张的很，一…

Python 2023年11月3日
0053
【Python】文件操作中的a，a+,w，w+几种方式的区别_转

第一步排除文件打开方式错误： r 只读，r+ 读写，不创建 w 新建只写，w+ 新建读写，二者都会将文件内容清零（以w方式打开，不能读出。w+可读写） w+与r+区别： r+：…

Python 2023年11月2日
0030
一文搞懂mysql索引底层逻辑，干货满满！

一、什么是索引二、为什么要用索引例如，我们通过查询语句查询一条记录：select * from table where Col2 = 85,如果没有索引的话，那么它将从第一…

Python 2023年10月22日
0031
python爬取百度贴吧文字内容

爬取百度贴吧文字内容方法1: 点击查看代码 **导入urllib库** from urllib import r…

Python 2023年6月10日
0078
[HFCTF 2021 Final]easyflask

任意文件读取，根据提示读取源码 import os import pickle from base64 import b64decode from flask import Fla…

Python 2023年8月14日
0052
【CTF】buuctf web（五）——[HCTF 2018]admin——flask session伪造+Unicode欺骗

[HCTF 2018]admin 知识点 * FLASK Unicode反转字符利用思路解题方法 * 方法一：flask session伪造方法二：unicode欺骗总结思…

Python 2023年8月14日
0047
基本数据类型与字符串

变量名由字母、数字和下划线组成(数字不能开头) [En] the variable name consists of letters, numbers and underscore…

Python 2023年5月24日
0069
mysql数据库设计规范

一、数据库设计规范1.使用innodb引擎2.数据库和表的字符集统一使用utf83.所有表和字段添加注释4.单表数据量控制二、数据库字段设计规范1.选择符合存储需要的最小的数据类…

Python 2023年6月3日
0054
【cartographer_ros】七：主要配置参数说明

上一节介绍了路标Landmark数据的订阅和发布，各类数据的发布和订阅基本阐述完毕。本节会介绍cartographer的主要配置参数，研究这些参数的使用和对算法的影响。首先还是…

Python 2023年10月25日
0028
使用matplotlib让你的数据更加生动（一）

1 引言 Matplotlib 是 Python 中最受欢迎的数据可视化软件包之一，支持跨平台运行，它是 Python 常用的 2D 绘图库，同时它也提供了一部分 3D 绘图接口。…

Python 2023年9月4日
0076
想知道你未来宝宝长什么样吗？

摘要：本案例可根据一张父亲和母亲的正脸照片，生成孩子的照片，并且可以调节参数，看看不同性别和年龄孩子的长相。本文分享自华为云社区《BabyGAN：根据父母照片生成孩子照片》，作者…

Python 2023年9月6日
0065
Anaconda Navigator打不开，再次运行显示程序已在运行的解决办法

一.问题描述安装好anaconda后，运行Anaconda Navigator一直显示绿圈圈loading，点击绿色圆圈后加载界面消失，再次运行Anaconda Navigato…

Python 2023年8月2日
0066
零售药店管理系统 Python+MySQL数据库

零售药店管理系统【Python+数据库】 1 背景介绍结合本学期所学的Python和数据库完成一个零售药店管理系统 2 问题定义零售药店管理系统通过录入零售药品信息、员工信息…

Python 2023年7月31日
0040
matplotlib饼图百分比可视化

填写自己的mysql连接方式和sql语句即可实现饼图带百分比,线长度自己可以调参数import pymysqlfrom matplotlib import pyplot as pl…

Python 2023年9月2日
0036
xadmin报cannot import name ‘DEFAULT_FORMATS‘ from ‘import_export.admin‘/cannot import name ‘SKIP_ADMI

1、下载xadmin： pip install https://codeload.github.com/sshwsfc/xadmin/zip/django2 2、到settings…

Python 2023年8月5日
0043
第十四届蓝桥杯模拟赛第一期试题【Java解析】

目录 A 二进制位数问题描述答案提交参考答案解析 B 晨跑问题描述答案提交参考答案解析 C 调和级数问题描述答案提交参考答案解析 D 山谷问题描述答案提…

Python 2023年8月2日
0044

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31