今日份笔记:
1 pd.to_datetime
print(pd.to_datetime('2018-07'))
2 groupby
2.1 groupby函数功能
(1)python中groupby函数主要的作用是进行数据的分组以及分组后的组内运算!
(2)根据一个或多个键拆分pandas对象,计算分组摘要统计,如计数、平均值、标准差或用户自定义函数等。
2.2 groupby函数原理
可将groupby函数分组聚合的过程分为两步:
1、分组split:按照指定键值或分组变量对数据分组
2、聚合combine:应用python自带函数或自定义函数进行聚合计算
2.3 举例
print(df[“评分”].groupby([df[“地区”],df[“类型”]]).mean())
上面语句的功能是输出表格所有数据中不同地区不同类型的评分数据平均值
#=========1创建数据=========
import pandas as pd
import numpy as np
df = pd.DataFrame({'key1':['a', 'a', 'b', 'b', 'a'],
'key2':['one', 'two', 'one', 'two', 'one'],
'data1':np.random.randn(5),
'data2':np.random.randn(5)})
print(df)
#=======2进行拆分==========
grouped=df['data1'].groupby(df['key1'])
print(grouped)
#=======3进行聚合计算=====
print(grouped.mean())
Testing started at 23:00 ...
key1 key2 data1 data2
0 a one -0.919658 0.450728
1 a two 0.031374 1.066755
2 b one -2.269761 -0.099858
3 b two -0.690892 0.596098
4 a one -1.251843 -1.643419
<pandas.core.groupby.generic.seriesgroupby object at 0x000000000b47a430>
key1
a -0.713376
b -1.480327
Name: data1, dtype: float64
</pandas.core.groupby.generic.seriesgroupby>
3 range(len())
a=("123","456","789")
for i in range(len(a)):
print(i,a)
运行结果:
0 ('123', '456', '789')
1 ('123', '456', '789')
2 ('123', '456', '789')
for i in range(0, len(arr))
#这里发生的是您获得的增量值基于数组的大小,这样您就可以将该值用作列表的索引。
Original: https://blog.csdn.net/weixin_46039719/article/details/122993570
Author: 荔枝科研社
Title: Python中pd.to_datetime、groupby、range(len())
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/740512/
转载文章受原作者版权保护。转载请注明原作者出处!