dataframe聚合
import pandas as pd
s = pd.read_csv(‘…/conf/dataframe.csv’) #导入数据
print(s.columns)#打印列名
count_list= [‘monitorURLNUM’,’Monitor’]
cloum_list =[‘MonitorAddress’,’inserttime’]
cloum_list.extend(count_list)
s=s[cloum_list]
提取指定列
s[‘inserttime’]=pd.to_datetime(s[‘inserttime’], format=’%Y-%m-%d’)
将时间列指定为时间格式
s.set_index(‘inserttime’, inplace=True)
将时间列作为索引
s = s.groupby(‘MonitorAddress’).resample(‘d’).sum()
按地区和时间聚合
print(type(s))
for indexs in s.index:
print(s.loc[indexs].values[0:-1])
逐行打印
l to_dataframe 从QuerySet返回DataFrame
l to_timeserie 用于创建时间序列的便捷方法,即DataFrame索引是DateTime或PeriodIndex的实例
l to_pivot_table 从QuerySet创建数据透视表的便捷方法
分组后按时间聚合
s = s.groupby(‘MonitorAddress’,as_index=False).resample(‘d’).sum()
按组聚合并查看
s.groupby(‘MonitorAddress’,as_index=False)
for name,data in s:
data.resample(‘d’).sum()
print(type(data))
查看索引
for i in data.index
print(i)
查看数据
for i in data.values:
print(i)
查看分组,聚合索引,返回一个元组
for i in data.items():
print(i)
Original: https://blog.csdn.net/weixin_43075863/article/details/113832330
Author: 沙子2019
Title: dataframe聚合
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/677653/
转载文章受原作者版权保护。转载请注明原作者出处!