Pandas函数方法分类参数说明+实例分析！！

2023年8月21日上午10:03 • Python • 阅读 44

Pandas描述性统计（函数用法说明）

count()            &#x975E;&#x7A7A;&#x6570;&#x636E;&#x7684;&#x6570;&#x91CF;
sum()              &#x6240;&#x6709;&#x503C;&#x4E4B;&#x548C;
mean()             &#x6240;&#x6709;&#x503C;&#x7684;&#x5E73;&#x5747;&#x503C;
median()           &#x6240;&#x6709;&#x503C;&#x7684;&#x4E2D;&#x4F4D;&#x6570;
mode()             &#x503C;&#x7684;&#x6A21;&#x503C;
std()              &#x503C;&#x7684;&#x6807;&#x51C6;&#x504F;&#x5DEE;
min()              &#x6240;&#x6709;&#x503C;&#x4E2D;&#x7684;&#x6700;&#x5C0F;&#x503C;
max()              &#x6240;&#x6709;&#x503C;&#x4E2D;&#x7684;&#x6700;&#x5927;&#x503C;
abs()              &#x7EDD;&#x5BF9;&#x503C;
prod()             &#x6570;&#x7EC4;&#x5143;&#x7D20;&#x7684;&#x4E58;&#x79EF;
cumsum()           &#x7D2F;&#x8BA1;&#x603B;&#x548C;
cuoprod()          &#x7D2F;&#x8BA1;&#x4E58;&#x79EF;
describe()         &#x8BA1;&#x7B97;&#x6709;&#x5173;DataFrame&#x5217;&#x7684;&#x7EDF;&#x8BA1;&#x4FE1;&#x606F;&#x7684;&#x6458;&#x8981;

describe()&#x5185;&#x542B;include&#x53C2;&#x6570;
&#x662F;&#x7528;&#x4E8E;&#x4F20;&#x9012;&#x5173;&#x4E8E;&#x4EC0;&#x4E48;&#x5217;&#x9700;&#x8981;&#x8003;&#x8651;&#x7528;&#x4E8E;&#x603B;&#x7ED3;&#x7684;&#x5FC5;&#x8981;&#x4FE1;&#x606F;&#x7684;&#x53C2;&#x6570;&#x3002;&#x83B7;&#x53D6;&#x503C;&#x5217;&#x8868;; &#x9ED8;&#x8BA4;&#x60C5;&#x51B5;                    &#x4E0B;&#x662F;&#x201D;&#x6570;&#x5B57;&#x503C;&#x201D;&#x3002;
object &#x2013; &#x6C47;&#x603B;&#x5B57;&#x7B26;&#x4E32;&#x5217;
number &#x2013; &#x6C47;&#x603B;&#x6570;&#x5B57;&#x5217;
all &#x2013; &#x5C06;&#x6240;&#x6709;&#x5217;&#x6C47;&#x603B;&#x5728;&#x4E00;&#x8D77;(&#x4E0D;&#x5E94;&#x5C06;&#x5176;&#x4F5C;&#x4E3A;&#x5217;&#x8868;&#x503C;&#x4F20;&#x9012;)

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np

#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack',
   'Lee','David','Gasper','Betina','Andres']),
   'Age':pd.Series([25,26,25,23,30,29,23,34,40,30,51,46]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}

#Create a DataFrame
df = pd.DataFrame(d)
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print(df)
print("&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;")
print("sum&#x6C42;&#x548C;&#xFF1A;")
print (df.sum())
print("&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;")
print("&#x5BF9;&#x67D0;&#x5217;&#x6C42;&#x548C;&#xFF1A;")
print(df.sum(1))
print("&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;")
print("cumsum&#x7D2F;&#x8BA1;&#x6C42;&#x548C;&#xFF1A;")
print(df.cumsum())
print("&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;")
print("describe&#x4FE1;&#x606F;&#x6458;&#x8981;&#xFF1A;")
print(df.describe())
print("&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;")
print("include&#x4E2D;&#x7684;object&#x6C47;&#x603B;&#x5B57;&#x7B26;&#x4E32;&#x5217;&#xFF1A;")
print(df.describe(include=['object']))
print("&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;")
print("include&#x4E2D;&#x7684;number&#x6C47;&#x603B;&#x6570;&#x5B57;&#x5217;&#xFF1A;")
print(df.describe(include=['number']))
print("&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;")
print("include&#x4E2D;&#x7684;all&#x5C06;&#x6240;&#x6709;&#x5217;&#x6C47;&#x603B;&#x5728;&#x4E00;&#x8D77;&#xFF1A;")
print(df.describe(include='all'))

'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
    Age    Name  Rating
0    25     Tom    4.23
1    26   James    3.24
2    25   Ricky    3.98
3    23     Vin    2.56
4    30   Steve    3.20
5    29   Minsu    4.60
6    23    Jack    3.80
7    34     Lee    3.78
8    40   David    2.98
9    30  Gasper    4.80
10   51  Betina    4.10
11   46  Andres    3.65
&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;
sum&#x6C42;&#x548C;&#xFF1A;
Age                                                     382
Name      TomJamesRickyVinSteveMinsuJackLeeDavidGasperBe...

Rating                                                44.92
dtype: object
&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;
&#x5BF9;&#x67D0;&#x5217;&#x6C42;&#x548C;&#xFF1A;
0     29.23
1     29.24
2     28.98
3     25.56
4     33.20
5     33.60
6     26.80
7     37.78
8     42.98
9     34.80
10    55.10
11    49.65
dtype: float64
&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;
cumsum&#x7D2F;&#x8BA1;&#x6C42;&#x548C;&#xFF1A;
    Age                                               Name Rating
0    25                                                Tom   4.23
1    51                                           TomJames   7.47
2    76                                      TomJamesRicky  11.45
3    99                                   TomJamesRickyVin  14.01
4   129                              TomJamesRickyVinSteve  17.21
5   158                         TomJamesRickyVinSteveMinsu  21.81
6   181                     TomJamesRickyVinSteveMinsuJack  25.61
7   215                  TomJamesRickyVinSteveMinsuJackLee  29.39
8   255             TomJamesRickyVinSteveMinsuJackLeeDavid  32.37
9   285       TomJamesRickyVinSteveMinsuJackLeeDavidGasper  37.17
10  336  TomJamesRickyVinSteveMinsuJackLeeDavidGasperBe...  41.27
11  382  TomJamesRickyVinSteveMinsuJackLeeDavidGasperBe...  44.92
&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;
describe&#x4FE1;&#x606F;&#x6458;&#x8981;&#xFF1A;
             Age     Rating
count  12.000000  12.000000
mean   31.833333   3.743333
std     9.232682   0.661628
min    23.000000   2.560000
25%    25.000000   3.230000
50%    29.500000   3.790000
75%    35.500000   4.132500
max    51.000000   4.800000
&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;
include&#x4E2D;&#x7684;object&#x6C47;&#x603B;&#x5B57;&#x7B26;&#x4E32;&#x5217;&#xFF1A;
         Name
count      12
unique     12
top     Ricky
freq        1
&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;
include&#x4E2D;&#x7684;number&#x6C47;&#x603B;&#x6570;&#x5B57;&#x5217;&#xFF1A;
             Age     Rating
count  12.000000  12.000000
mean   31.833333   3.743333
std     9.232682   0.661628
min    23.000000   2.560000
25%    25.000000   3.230000
50%    29.500000   3.790000
75%    35.500000   4.132500
max    51.000000   4.800000
&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;
include&#x4E2D;&#x7684;all&#x5C06;&#x6240;&#x6709;&#x5217;&#x6C47;&#x603B;&#x5728;&#x4E00;&#x8D77;&#xFF1A;
              Age   Name     Rating
count   12.000000     12  12.000000
unique        NaN     12        NaN
top           NaN  Ricky        NaN
freq          NaN      1        NaN
mean    31.833333    NaN   3.743333
std      9.232682    NaN   0.661628
min     23.000000    NaN   2.560000
25%     25.000000    NaN   3.230000
50%     29.500000    NaN   3.790000
75%     35.500000    NaN   4.132500
max     51.000000    NaN   4.800000
'''

Pandas函数应用

即将自定义或者其他库的函数应用于Pandas对象，包含三个方法，使用什么方法取决于函数是否期望在整个DataFrame行或列或元素上进行操作。

Pandas迭代

Pandas对象之间的基本迭代的行为取决于类型。当迭代一个系列时，它被视为数组式，基本迭代产生这些值。其他数据结构，如： DataFrame和 Panel，遵循类似惯例迭代对象的键。简而言之，基本迭代(对于 i在对象中)产生。【极客教程】

Series – 值

DataFrame – 列标签

Pannel – 项目标签

不要尝试在迭代时修改任何对象。迭代是用于读取，迭代器返回原始对象(视图)的副本，因此更改将不会反映在原始对象上。

-*- coding: UTF-8 -*-

import pandas as pd
s3=pd.Series(['&#x72D7;&#x86CB;','&#x5927;&#x9EC4;','&#x8001;&#x516C;&#x9E21;','&#x5927;&#x718A;'],index=['row1','row2','row3','row4'])
s4=pd.Series([10,20,30,40],index=['row1','row2','row3','row4'])
x2={'name':s3,'age':s4}
dx2=pd.DataFrame(x2)
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print(dx2)
print("&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;")
print("&#x5217;&#x540D;&#xFF1A;")
for col in dx2:
    print(col)
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
      age name
row1   10   &#x72D7;&#x86CB;
row2   20   &#x5927;&#x9EC4;
row3   30  &#x8001;&#x516C;&#x9E21;
row4   40   &#x5927;&#x718A;
&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;
&#x5217;&#x540D;&#xFF1A;
age
name
'''

iteritems() – 迭代 (key，value)对
iterrows() – 将行迭代为(索引，系列)对
itertuples() – 以 namedtuples的形式迭代行

将每个列作为键，将值与值作为键和列值迭代为Series对象。

-*- coding: UTF-8 -*-
import pandas as pd
s3=pd.Series(['&#x72D7;&#x86CB;','&#x5927;&#x9EC4;','&#x8001;&#x516C;&#x9E21;','&#x5927;&#x718A;'],index=['row1','row2','row3','row4'])
s4=pd.Series([10,20,30,40],index=['row1','row2','row3','row4'])
x2={'name':s3,'age':s4}
dx2=pd.DataFrame(x2)
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print(dx2)
print("&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;")
print("iteritems&#x8FED;&#x4EE3;&#xFF1A;")
for key,value in dx2.iteritems():
    print(key,value)
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
      age name
row1   10   &#x72D7;&#x86CB;
row2   20   &#x5927;&#x9EC4;
row3   30  &#x8001;&#x516C;&#x9E21;
row4   40   &#x5927;&#x718A;
&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;
iteritems&#x8FED;&#x4EE3;&#xFF1A;
('age', row1    10
row2    20
row3    30
row4    40
Name: age, dtype: int64)
('name', row1     &#x72D7;&#x86CB;
row2     &#x5927;&#x9EC4;
row3    &#x8001;&#x516C;&#x9E21;
row4     &#x5927;&#x718A;
Name: name, dtype: object)
'''

iterrows()`返回迭代器，产生每个索引值以及包含每行数据的序列。

-*- coding: UTF-8 -*-
import pandas as pd
s3=pd.Series(['&#x72D7;&#x86CB;','&#x5927;&#x9EC4;','&#x8001;&#x516C;&#x9E21;','&#x5927;&#x718A;'],index=['row1','row2','row3','row4'])
s4=pd.Series([10,20,30,40],index=['row1','row2','row3','row4'])
x2={'name':s3,'age':s4}
dx2=pd.DataFrame(x2)
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print(dx2)
print("&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;")
print("iterrows&#x8FED;&#x4EE3;&#xFF1A;")
for row_index,row in dx2.iterrows():
    print(row_index,row)
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
      age name
row1   10   &#x72D7;&#x86CB;
row2   20   &#x5927;&#x9EC4;
row3   30  &#x8001;&#x516C;&#x9E21;
row4   40   &#x5927;&#x718A;
&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;
iterrows&#x8FED;&#x4EE3;&#xFF1A;
('row1', age     10
name    &#x72D7;&#x86CB;
Name: row1, dtype: object)
('row2', age     20
name    &#x5927;&#x9EC4;
Name: row2, dtype: object)
('row3', age      30
name    &#x8001;&#x516C;&#x9E21;
Name: row3, dtype: object)
('row4', age     40
name    &#x5927;&#x718A;
Name: row4, dtype: object)
'''

itertuples()方法将为 DataFrame中的每一行返回一个产生一个命名元组的迭代器。元组的第一个元素将是行的相应索引值，而剩余的值是行值。

-*- coding: UTF-8 -*-
import pandas as pd
s3=pd.Series(['&#x72D7;&#x86CB;','&#x5927;&#x9EC4;','&#x8001;&#x516C;&#x9E21;','&#x5927;&#x718A;'],index=['row1','row2','row3','row4'])
s4=pd.Series([10,20,30,40],index=['row1','row2','row3','row4'])
x2={'name':s3,'age':s4}
dx2=pd.DataFrame(x2)
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print(dx2)
print("&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;")
print("itertuples&#x8FED;&#x4EE3;&#xFF1A;")
for row in dx2.itertuples():
    print(row)
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
      age name
row1   10   &#x72D7;&#x86CB;
row2   20   &#x5927;&#x9EC4;
row3   30  &#x8001;&#x516C;&#x9E21;
row4   40   &#x5927;&#x718A;
&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;
itertuples&#x8FED;&#x4EE3;&#xFF1A;
Pandas(Index='row1', age=10, name='\xe7\x8b\x97\xe8\x9b\x8b')
Pandas(Index='row2', age=20, name='\xe5\xa4\xa7\xe9\xbb\x84')
Pandas(Index='row3', age=30, name='\xe8\x80\x81\xe5\x85\xac\xe9\xb8\xa1')
Pandas(Index='row4', age=40, name='\xe5\xa4\xa7\xe7\x86\x8a')
'''

Pandas排序

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np
data=pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns=['two','one'])
print(data)
'''
        two       one
1  1.132523 -1.097201
4  1.020550 -0.641788
6 -0.769821 -1.463691
2  2.224695 -0.570571
3 -0.485055  1.116554
5 -0.152900 -0.311590
9  1.214404 -0.554556
8  0.519785  0.980446
0 -1.503853 -0.092038
7 -1.755938  0.085069
'''

使用 sort_index()方法，通过传递 axis参数和排序顺序，可以对 DataFrame进行排序。默认情况下，按照升序对行标签进行排序。

sort_index(axis=0, level=None, ascending=True, inplace=False, kind='quicksort', na_position='last',ignore_index: bool = False)

axis&#xFF1A;0&#x6309;&#x7167;&#x884C;&#x540D;&#x6392;&#x5E8F;&#xFF1B;1&#x6309;&#x7167;&#x5217;&#x540D;&#x6392;&#x5E8F;,&#x9ED8;&#x8BA4;&#x662F;0
level&#xFF1A;&#x9ED8;&#x8BA4;None&#xFF0C;&#x82E5;&#x4E0D;&#x4E3A;None&#xFF0C;&#x5219;&#x5BF9;&#x6307;&#x5B9A;&#x7D22;&#x5F15;&#x7EA7;&#x522B;&#x7684;&#x503C;&#x8FDB;&#x884C;&#x6392;&#x5E8F;
ascending&#xFF1A;&#x9ED8;&#x8BA4;True&#x5347;&#x5E8F;&#x6392;&#x5217;&#xFF1B;False&#x964D;&#x5E8F;&#x6392;&#x5217;
inplace&#xFF1A;&#x9ED8;&#x8BA4;False&#xFF0C;&#x5426;&#x5219;&#x6392;&#x5E8F;&#x4E4B;&#x540E;&#x7684;&#x6570;&#x636E;&#x76F4;&#x63A5;&#x66FF;&#x6362;&#x539F;&#x6765;&#x7684;&#x6570;&#x636E;
kind&#xFF1A;&#x6392;&#x5E8F;&#x65B9;&#x6CD5;&#xFF0C;{&#x2018;quicksort&#x2019;, &#x2018;mergesort&#x2019;, &#x2018;heapsort&#x2019;}, default &#x2018;quicksort&#x2019;&#x3002;&#x4F3C;&#x4E4E;&#x4E0D;&#x7528;&#x592A;&#x5173;&#x5FC3;&#x3002;
na_position&#xFF1A;&#x7F3A;&#x5931;&#x503C;&#x9ED8;&#x8BA4;&#x6392;&#x5728;&#x6700;&#x540E;{"first","last"}
ignore_index= False:&#x5FFD;&#x7565;&#x7D22;&#x5F15;&#xFF0C;&#x9ED8;&#x8BA4;&#x662F;&#x4E0D;&#x5FFD;&#x7565;&#xFF08;False&#xFF09;&#xFF0C;True&#xFF1A;&#x5FFD;&#x7565;

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np
data=pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns=['two','one'])
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print(data)
print("&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;")
data2=data.sort_index()
print("&#x6309;&#x6807;&#x7B7E;&#x6392;&#x5E8F;&#x540E;&#xFF1A;")
print(data2)

'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
        two       one
1  0.327346 -1.371823
4  0.766698  0.774780
6  0.554645  0.724602
2  1.695929 -0.188749
3 -1.301285 -0.361423
5 -1.109693 -0.021815
9  0.509077  0.184829
8  0.571038  0.149157
0 -0.320515  0.620416
7  0.517924  0.202861
&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;
&#x6309;&#x6807;&#x7B7E;&#x6392;&#x5E8F;&#x540E;&#xFF1A;
        two       one
0 -0.320515  0.620416
1  0.327346 -1.371823
2  1.695929 -0.188749
3 -1.301285 -0.361423
4  0.766698  0.774780
5 -1.109693 -0.021815
6  0.554645  0.724602
7  0.517924  0.202861
8  0.571038  0.149157
9  0.509077  0.184829
'''

通过将布尔值传递给升序参数，控制排序顺序。

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np
data=pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns=['two','one'])
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print(data)
print("&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;")
data2=data.sort_index(ascending=False)
print("&#x6309;&#x6807;&#x7B7E;&#x6392;&#x5E8F;&#x540E;&#xFF1A;")
print(data2)
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
        two       one
1  1.240027  1.000773
4  0.011837  1.452669
6 -1.513732  0.197287
2  0.127446  1.168875
3  0.642374 -0.491269
5  0.244226 -1.115241
9  1.611361  0.282201
8 -0.271991 -1.638814
0  0.070785 -1.034654
7  0.712523  0.067568
&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;
&#x6309;&#x6807;&#x7B7E;&#x6392;&#x5E8F;&#x540E;&#xFF1A;
        two       one
9  1.611361  0.282201
8 -0.271991 -1.638814
7  0.712523  0.067568
6 -1.513732  0.197287
5  0.244226 -1.115241
4  0.011837  1.452669
3  0.642374 -0.491269
2  0.127446  1.168875
1  1.240027  1.000773
0  0.070785 -1.034654
'''

通过传递 axis参数值为 0或 1，可以对列标签进行排序。默认情况下， axis = 0，逐行排列。

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np
data=pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns=['two','one'])
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print(data)
print("&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;")
data2=data.sort_index(axis=1)
print("&#x6309;&#x6807;&#x7B7E;&#x6392;&#x5E8F;&#x540E;&#xFF1A;")
print(data2)
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
        two       one
1 -0.098167 -1.337630
4 -1.256009  0.980084
6  1.523998 -0.256460
2  1.431966  0.413947
3  1.358575 -0.161808
5 -0.520922 -0.289887
9 -2.076201  0.497662
8  0.825859 -1.329819
0  0.786688 -1.401064
7 -0.123275 -1.397867
&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;&#x2026;
&#x6309;&#x6807;&#x7B7E;&#x6392;&#x5E8F;&#x540E;&#xFF1A;
        one       two
1 -1.337630 -0.098167
4  0.980084 -1.256009
6 -0.256460  1.523998
2  0.413947  1.431966
3 -0.161808  1.358575
5 -0.289887 -0.520922
9  0.497662 -2.076201
8 -1.329819  0.825859
0 -1.401064  0.786688
7 -1.397867 -0.123275
'''

像索引排序一样， sort_values()是按值排序的方法。它接受一个 by参数，它将使用要与其排序值的 DataFrame的列名称。

sort_values(by.axis=0,ascending=True,inplace=False,kind='quicksort',na_posttion='last',ignore_index=False)

by:&#x6309;&#x7167;&#x54EA;&#x4E00;&#x5217;&#x6392;&#x5E8F;
axis:axis=0&#x6216;'index'&#xFF0C;&#x5219;&#x6309;&#x7167;&#x6307;&#x5B9A;&#x5217;&#x4E2D;&#x6570;&#x636E;&#x5927;&#x5C0F;&#x6392;&#x5E8F;
     axis=1&#x6216;'columns'&#xFF0C;&#x5219;&#x6309;&#x7167;&#x6307;&#x5B9A;&#x884C;&#x4E2D;&#x6570;&#x636E;&#x5927;&#x5C0F;&#x6392;&#x5E8F;&#xFF0C;&#x9ED8;&#x8BA4;&#x4E3A;axis=0
ascending:True&#x662F;&#x5347;&#x5E8F;&#xFF0C;False&#x662F;&#x9006;&#x5E8F;
inplace:&#x662F;&#x5426;&#x7528;&#x6392;&#x5E8F;&#x540E;&#x7684;&#x6570;&#x636E;&#x96C6;&#x66FF;&#x6362;&#x539F;&#x6765;&#x7684;&#x6570;&#x636E;&#xFF0C;&#x9ED8;&#x8BA4;&#x4E3A;false&#xFF0C;&#x5373;&#x4E0D;&#x66FF;&#x6362;
kind='quicksort':&#x6392;&#x5E8F;&#x7B97;&#x6CD5;&#xFF0C;&#x4E0D;&#x7528;&#x4FEE;&#x6539;
    quicksort :&#x5FEB;&#x901F;&#x6392;&#x5E8F;
    mergesort:&#x7A33;&#x5B9A;&#x6392;&#x5E8F;
    heapsort:&#x5806;&#x6392;&#x5E8F;&#x7B97;&#x6CD5;
na_position:&#x7A7A;&#x503C;&#x653E;&#x5728;&#x90A3;&#x91CC;&#xFF0C;&#x9ED8;&#x8BA4;&#x653E;&#x5728;last(&#x540E;&#x9762;)&#xFF0C;first&#x653E;&#x5728;&#x524D;&#x9762;
ignore_index:False:&#x5FFD;&#x7565;&#x7D22;&#x5F15;&#xFF0C;&#x9ED8;&#x8BA4;&#x662F;&#x4E0D;&#x5FFD;&#x7565;(False),True:&#x5FFD;&#x7565;

-*- coding: UTF-8 -*-
import pandas as pd
data =pd.DataFrame([[2,3,12],[6,2,8],[9,5,7]],
                 index=["0", "2", "1"],
                 columns=["col_a", "col_c", "col_b"])
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print(data)
print("&#x6309;&#x6307;&#x5B9A;&#x5217;&#x7684;&#x503C;&#x5927;&#x5C0F;&#x987A;&#x5E8F;&#x8FDB;&#x884C;&#x6392;&#x5E8F;&#xFF1A;")
data.sort_values(by='col_c')
print(data)
print("&#x6309;&#x591A;&#x5217;&#x8FDB;&#x884C;&#x6392;&#x5E8F;&#xFF1A;")
data.sort_values(by=['col_b','col_a'])
print(data)
print("&#x5148;&#x6309;col_b&#x964D;&#x5E8F;&#xFF0C;&#x518D;&#x6309;col_a&#x5347;&#x5E8F;&#x6392;&#x5E8F;&#xFF1A;")
data.sort_values(by=['col_b','col_a'],axis=0,ascending=[False,True])
print(data)
print("&#x6309;&#x884C;&#x5347;&#x5E8F;&#x6392;&#x5217;")
data.sort_values(by='2',axis=1)
print(data)
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
   col_a  col_c  col_b
0      2      3     12
2      6      2      8
1      9      5      7
&#x6309;&#x6307;&#x5B9A;&#x5217;&#x7684;&#x503C;&#x5927;&#x5C0F;&#x987A;&#x5E8F;&#x8FDB;&#x884C;&#x6392;&#x5E8F;&#xFF1A;
   col_a  col_c  col_b
0      2      3     12
2      6      2      8
1      9      5      7
&#x6309;&#x591A;&#x5217;&#x8FDB;&#x884C;&#x6392;&#x5E8F;&#xFF1A;
   col_a  col_c  col_b
0      2      3     12
2      6      2      8
1      9      5      7
&#x5148;&#x6309;col_b&#x964D;&#x5E8F;&#xFF0C;&#x518D;&#x6309;col_a&#x5347;&#x5E8F;&#x6392;&#x5E8F;&#xFF1A;
   col_a  col_c  col_b
0      2      3     12
2      6      2      8
1      9      5      7
&#x6309;&#x884C;&#x5347;&#x5E8F;&#x6392;&#x5217;
   col_a  col_c  col_b
0      2      3     12
2      6      2      8
1      9      5      7
'''

kind=’quicksort’:排序算法，不用修改

quicksort :&#x5FEB;&#x901F;&#x6392;&#x5E8F;
mergesort:&#x7A33;&#x5B9A;&#x6392;&#x5E8F;
heapsort:&#x5806;&#x6392;&#x5E8F;&#x7B97;&#x6CD5;

-*- coding: UTF-8 -*-
import pandas as pd
data =pd.DataFrame([[2,3,12],[6,2,8],[9,5,7]],
                 index=["0", "2", "1"],
                 columns=["col_a", "col_c", "col_b"])
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print(data)
print("Mergesort&#x7B97;&#x6CD5;&#xFF1A;")
data2=data.sort_values(by='col_c',kind='Mergesort')
print(data)
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
   col_a  col_c  col_b
0      2      3     12
2      6      2      8
1      9      5      7
Mergesort&#x7B97;&#x6CD5;&#xFF1A;
   col_a  col_c  col_b
2      6      2      8
0      2      3     12
1      9      5      7
'''

用 numpy.ramdom.permutation()函数，调用Series对象或DataFrame对象各行的顺序(随机排序)很简单，如下所示，创建一个元素为整数且按照升序排列的DataFrame对象。

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np
data=pd.DataFrame(np.arange(25).reshape(5,5))
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print(data)
print("&#x7528;permutation()&#x51FD;&#x6570;&#x521B;&#x5EFA;&#x4E00;&#x4E2A;&#x5305;&#x542B;0-4(&#x987A;&#x5E8F;&#x968F;&#x673A;)&#x8FD9;&#x4E94;&#x5404;&#x6574;&#x6570;&#x7684;&#x6570;&#x7EC4;&#xFF0C;&#x6211;&#x4EEC;&#x6309;&#x7167;&#x8FD9;&#x4E2A;&#x6570;&#x7EC4;&#x5143;&#x7D20;&#x7684;&#x987A;&#x5E8F;&#x4E3A;DataFrame&#x5BF9;&#x8C61;&#x8FDB;&#x884C;&#x884C;&#x6392;&#x5E8F;&#xFF0C;&#x5BF9;DataFrame&#x5BF9;&#x8C61;&#x7684;&#x6240;&#x6709;&#x884C;&#x5E94;&#x7528;take()&#x51FD;&#x6570;&#xFF0C;&#x628A;&#x65B0;&#x7684;&#x6B21;&#x5E8F;&#x4F20;&#x7ED9;&#x5B83;&#xFF1A;")
data2=np.random.permutation(5)
print(data2)
print(data.take(data2))
print("&#x53EA;&#x5BF9;DataFrame&#x5BF9;&#x8C61;&#x7684;&#x4E00;&#x90E8;&#x5206;&#x8FDB;&#x884C;&#x6392;&#x5E8F;&#x64CD;&#x4F5C;&#x3002;&#x5B83;&#x5C06;&#x751F;&#x6210;&#x4E00;&#x4E2A;&#x6570;&#x7EC4;&#xFF0C;&#x53EA;&#x5305;&#x542B;&#x7279;&#x5B9A;&#x7D22;&#x5F15;&#x8303;&#x56F4;&#x7684;&#x6570;&#x636E;:")
data3=[3,4,2]
print(data.take(data3))
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
    0   1   2   3   4
0   0   1   2   3   4
1   5   6   7   8   9
2  10  11  12  13  14
3  15  16  17  18  19
4  20  21  22  23  24
&#x7528;permutation()&#x51FD;&#x6570;&#x521B;&#x5EFA;&#x4E00;&#x4E2A;&#x5305;&#x542B;0-4(&#x987A;&#x5E8F;&#x968F;&#x673A;)&#x8FD9;&#x4E94;&#x5404;&#x6574;&#x6570;&#x7684;&#x6570;&#x7EC4;&#xFF0C;&#x6211;&#x4EEC;&#x6309;&#x7167;&#x8FD9;&#x4E2A;&#x6570;&#x7EC4;&#x5143;&#x7D20;&#x7684;&#x987A;&#x5E8F;&#x4E3A;DataFrame&#x5BF9;&#x8C61;&#x8FDB;&#x884C;&#x884C;&#x6392;&#x5E8F;&#xFF0C;&#x5BF9;DataFrame&#x5BF9;&#x8C61;&#x7684;&#x6240;&#x6709;&#x884C;&#x5E94;&#x7528;take()&#x51FD;&#x6570;&#xFF0C;&#x628A;&#x65B0;&#x7684;&#x6B21;&#x5E8F;&#x4F20;&#x7ED9;&#x5B83;&#xFF1A;
[2 1 0 3 4]
    0   1   2   3   4
2  10  11  12  13  14
1   5   6   7   8   9
0   0   1   2   3   4
3  15  16  17  18  19
4  20  21  22  23  24
&#x53EA;&#x5BF9;DataFrame&#x5BF9;&#x8C61;&#x7684;&#x4E00;&#x90E8;&#x5206;&#x8FDB;&#x884C;&#x6392;&#x5E8F;&#x64CD;&#x4F5C;&#x3002;&#x5B83;&#x5C06;&#x751F;&#x6210;&#x4E00;&#x4E2A;&#x6570;&#x7EC4;&#xFF0C;&#x53EA;&#x5305;&#x542B;&#x7279;&#x5B9A;&#x7D22;&#x5F15;&#x8303;&#x56F4;&#x7684;&#x6570;&#x636E;:
    0   1   2   3   4
3  15  16  17  18  19
4  20  21  22  23  24
2  10  11  12  13  14
'''

Pandas字符串和文本数据（函数方法）

Pandas提供了一组字符串函数，可以方便地对字符串数据进行操作。最重要的是，这些函数忽略了 NaN值。几乎这些方法都使用Python 字符串函数。因此，将 Series对象转换为String对象，然后执行该操作。

lower()                 &#x5C06;Seris/Index&#x4E2D;&#x7684;&#x5B57;&#x7B26;&#x4E32;&#x8F6C;&#x6362;&#x6210;&#x5C0F;&#x5199;
upper()                 &#x5C06;Seris/Index&#x4E2D;&#x7684;&#x5B57;&#x7B26;&#x4E32;&#x8F6C;&#x6362;&#x6210;&#x5927;&#x5199;
len()                   &#x8BA1;&#x7B97;&#x5B57;&#x7B26;&#x4E32;&#x957F;&#x5EA6;
strip()                 &#x4ECE;&#x4E24;&#x4FA7;&#x7684;&#x7CFB;&#x5217;/&#x7D22;&#x5F15;&#x5B57;&#x7B26;&#x4E32;&#x4E2D;&#x5220;&#x9664;&#x7A7A;&#x683C;&#xFF08;&#x5305;&#x62EC;&#x6362;&#x884C;&#x7B26;&#xFF09;
split('')               &#x7528;&#x7ED9;&#x5B9A;&#x7684;&#x6A21;&#x5F0F;&#x62C6;&#x5206;&#x5B57;&#x7B26;&#x4E32;
cat(sep='')             &#x4F7F;&#x7528;&#x7ED9;&#x5B9A;&#x7684;&#x5206;&#x9694;&#x7B26;&#x8FDE;&#x63A5;&#x5143;&#x7D20;
get_dummies()           &#x8FD4;&#x56DE;&#x5177;&#x6709;&#x5355;&#x70ED;&#x7F16;&#x7801;&#x503C;&#x5F97;&#x6570;&#x636E;&#x5E27;
contains(pattern)       &#x5982;&#x679C;&#x5143;&#x7D20;&#x4E2D;&#x5305;&#x542B;&#x5B50;&#x5B57;&#x7B26;&#x4E32;&#xFF0C;&#x5219;&#x8FD4;&#x56DE;&#x6BCF;&#x4E2A;&#x5143;&#x7D20;&#x7684;&#x5E03;&#x5C14;&#x503C;True
replace(a,b)            &#x5C06;a&#x66FF;&#x6362;&#x6210;b
repeat(value)           &#x91CD;&#x590D;&#x6BCF;&#x4E2A;&#x5143;&#x7D20;&#x6307;&#x5B9A;&#x7684;&#x6B21;&#x6570;
count(pattern)          &#x8FD4;&#x56DE;&#x6A21;&#x5F0F;&#x4E2D;&#x6BCF;&#x4E2A;&#x5143;&#x7D20;&#x7684;&#x51FA;&#x73B0;&#x603B;&#x6570;
startswith(pattern)     &#x5982;&#x679C;&#x5143;&#x7D20;&#x4EE5;pattern(&#x6A21;&#x5F0F;)&#x5F00;&#x59CB;&#xFF0C;&#x5219;&#x8FD4;&#x56DE;True
endswith(pattern)       &#x5982;&#x679C;&#x5143;&#x7D20;&#x4EE5;pattern(&#x6A21;&#x5F0F;)&#x7ED3;&#x675F;&#xFF0C;&#x5219;&#x8FD4;&#x56DE;True
find(pattern)           &#x8FD4;&#x56DE;pattern(&#x6A21;&#x5F0F;)&#x7B2C;&#x4E00;&#x6B21;&#x51FA;&#x73B0;&#x7684;&#x4F4D;&#x7F6E;
findall(pattern)        &#x8FD4;&#x56DE;pattern(&#x6A21;&#x5F0F;)&#x7684;&#x6240;&#x6709;&#x51FA;&#x73B0;&#x7684;&#x5217;&#x8868;
swapcase                &#x53D8;&#x6362;&#x5B57;&#x6BCD;&#x5927;&#x5C0F;&#x5199;
islower()               &#x68C0;&#x67E5;&#x6BCF;&#x4E2A;&#x5B57;&#x7B26;&#x4E32;&#x4E2D;&#x7684;&#x6240;&#x6709;&#x5B57;&#x7B26;&#x662F;&#x5426;&#x5C0F;&#x5199;&#xFF0C;&#x8FD4;&#x56DE;&#x5E03;&#x5C14;&#x503C;
isupper()               &#x68C0;&#x67E5;&#x6BCF;&#x4E2A;&#x5B57;&#x7B26;&#x4E32;&#x4E2D;&#x7684;&#x6240;&#x6709;&#x5B57;&#x7B26;&#x662F;&#x5426;&#x5927;&#x5199;&#xFF0C;&#x8FD4;&#x56DE;&#x5E03;&#x5C14;&#x503C;
isnumeric()             &#x68C0;&#x67E5;&#x6BCF;&#x4E2A;&#x5B57;&#x7B26;&#x4E32;&#x4E2D;&#x7684;&#x6240;&#x6709;&#x5B57;&#x7B26;&#x662F;&#x5426;&#x4E3A;&#x6570;&#x5B57;&#xFF0C;&#x8FD4;&#x56DE;&#x5E03;&#x5C14;&#x503C;

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np

s = pd.Series(['Tom', 'William Rick', 'John', 'Alber@t', np.nan, '1234','SteveMinsu'])
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print (s)
print("lower():")
print(s.str.lower())
print("upper():")
print(s.str.upper())
print("len():")
print(s.str.len())
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
0             Tom
1    William Rick
2            John
3         Alber@t
4             NaN
5            1234
6      SteveMinsu
dtype: object
lower():
0             tom
1    william rick
2            john
3         alber@t
4             NaN
5            1234
6      steveminsu
dtype: object
upper():
0             TOM
1    WILLIAM RICK
2            JOHN
3         ALBER@T
4             NaN
5            1234
6      STEVEMINSU
dtype: object
len():
0     3.0
1    12.0
2     4.0
3     7.0
4     NaN
5     4.0
6    10.0
dtype: float64
'''

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np

s = pd.Series(['      Tom', 'William Rick      ', np.nan, '1234','SteveMinsu'])
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print (s)
print("strip():")
print(s.str.strip())
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
0                   Tom
1    William Rick
2                   NaN
3                  1234
4            SteveMinsu
dtype: object
strip():
0             Tom
1    William Rick
2             NaN
3            1234
4      SteveMinsu
dtype: object
'''

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np

s = pd.Series(['yebiyebi', 'William Rick', np.nan, '131234','CaiCap'])
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print (s)
print("split():")
print(s.str.split())
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
0        yebiyebi
1    William Rick
2             NaN
3          131234
4          CaiCap
dtype: object
split():
0         [yebiyebi]
1    [William, Rick]
2                NaN
3           [131234]
4           [CaiCap]
dtype: object
'''

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np

s = pd.Series(['yebiyebi', 'William Rick', np.nan, '131234','CaiCap'])
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print (s)
print("cat(pattern():")
print (s.str.cat(sep=' <<\--$$$-->> '))
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
0        yebiyebi
1    William Rick
2             NaN
3          131234
4          CaiCap
dtype: object
cat(pattern():
yebiyebi <<\--$$$-->> William Rick <<\--$$$-->> 131234 <<\--$$$-->> CaiCap
'''
</\--$$$--></\--$$$--></\--$$$--></\--$$$-->

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np

s = pd.Series(['yebiyebi', 'William Rick', np.nan, '131234','CaiCap'])
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print (s)
print("repeat:")
print (s.str.repeat(2))
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
0        yebiyebi
1    William Rick
2             NaN
3          131234
4          CaiCap
dtype: object
repeat:
0            yebiyebiyebiyebi
1    William RickWilliam Rick
2                         NaN
3                131234131234
4                CaiCapCaiCap
dtype: object
'''

findall(pattern)

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np

s = pd.Series(['yebiyebi', 'William Rick', np.nan, '131234','CaiCap'])
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print (s)
print("findall:")
print (s.str.findall('i'))
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
0        yebiyebi
1    William Rick
2             NaN
3          131234
4          CaiCap
dtype: object
findall:
0       [i, i]
1    [i, i, i]
2          NaN
3           []
4          [i]
dtype: object
'''

统计函数（函数）

count           &#x975E;&#x7A7A;&#x6570;&#x636E;&#x7684;&#x4E2A;&#x6570;
sum             &#x6570;&#x636E;&#x4E4B;&#x548C;
mean            &#x7B97;&#x672F;&#x5E73;&#x5747;&#x503C;
mad             &#x5E73;&#x5747;&#x7EDD;&#x5BF9;&#x65B9;&#x5DEE;
madian          &#x4E2D;&#x4F4D;&#x6570;
min             &#x6700;&#x5C0F;&#x503C;
max             &#x6700;&#x5927;&#x503C;
mode            &#x4F17;&#x6570;
abs             &#x7EDD;&#x5BF9;&#x503C;
prod            &#x6570;&#x7EC4;&#x5143;&#x7D20;&#x7684;&#x4E58;&#x79EF;
std             &#x6807;&#x51C6;&#x5DEE;
var             &#x65B9;&#x5DEE;
sem             &#x6807;&#x51C6;&#x8BEF;&#x5DEE;
skew            &#x504F;&#x5DEE;
kurt            &#x6837;&#x672C;&#x503C;&#x5CF0;&#x5EA6;
quantile        &#x5206;&#x4F4D;&#x6570;
cumsum          &#x7D2F;&#x52A0;
cumprod         &#x7D2F;&#x4E58;
cummax          &#x7D2F;&#x8BA1;&#x6700;&#x5927;&#x503C;
cummin          &#x7D2F;&#x8BA1;&#x6700;&#x5C0F;&#x503C;
cov()           &#x534F;&#x65B9;&#x5DEE;
corr()          &#x76F8;&#x5173;&#x7CFB;&#x6570;
rank()          &#x6570;&#x636E;&#x6392;&#x540D;
pct_change()    &#x8BA1;&#x7B97;&#x767E;&#x5206;&#x6570;&#x53D8;&#x5316;

此函数将每个元素与其前一个元素进行比较，并计算变化百分比。

默认为对列进行操作，可添加axis=1对行进行操作

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np
s=pd.Series([1,2,3,4,5,4])
print(s)
print(s.pct_change())
'''
0    1
1    2
2    3
3    4
4    5
5    4
dtype: int64
0         NaN
1    1.000000
2    0.500000
3    0.333333
4    0.250000
5   -0.200000
dtype: float64
'''

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np
s=pd.DataFrame(np.random.randn(3,4))
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print(s)
print("&#x5E94;&#x7528;&#x540E;&#x7684;&#xFF1A;")
print(s.pct_change())
print("&#x5BF9;&#x884C;&#x5E94;&#x7528;&#xFF1A;")
print(s.pct_change(axis=1))
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
          0         1         2         3
0 -0.223930 -0.205909 -1.235244  1.051225
1 -0.408899 -1.794809  1.202108 -0.375630
2  0.575691  1.214627  0.362256  0.349045
&#x5E94;&#x7528;&#x540E;&#x7684;&#xFF1A;
          0         1         2         3
0       NaN       NaN       NaN       NaN
1  0.826012  7.716504 -1.973175 -1.357326
2 -2.407906 -1.676744 -0.698649 -1.929227
&#x5BF9;&#x884C;&#x5E94;&#x7528;&#xFF1A;
    0         1         2         3
0 NaN -0.080475  4.998971 -1.851027
1 NaN  3.389370 -1.669769 -1.312476
2 NaN  1.109859 -0.701755 -0.036469
'''

协方差适用于 Series数据。Series对象有一个方法 cov用来计算序列对象之间的协方差。 NA将被自动排除。

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np
s1=pd.Series([1,2,3,4,5])
s2=pd.Series([6,7,8,9,10])
print(s1.cov(s2))
'''
2.5
'''

当应用于DataFrame时，协方差方法计算所有列之间的协方差值

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np
data=pd.DataFrame(np.random.randn(10,5))
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print(data)
print("&#x534F;&#x65B9;&#x5DEE;&#xFF1A;")
print(data.cov())
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
          0         1         2         3         4
0  0.248519 -0.318176 -0.438136  0.824835 -2.118278
1 -0.830909 -0.214343 -0.668916  0.077291 -1.142607
2  0.361157  0.100038  0.774078 -2.000748 -0.784875
3  0.237667 -0.659196  1.028732 -0.481548  0.107821
4 -1.156160  0.415080  0.092217 -0.164445 -0.888647
5 -1.163534 -0.671134 -0.533112  0.462044 -0.247828
6  0.611452 -0.155465 -0.028276  1.549388  0.450246
7  0.069735 -1.270305 -0.434300 -1.034437 -0.787866
8  0.232204 -1.331670  0.338220  0.096134 -0.866169
9  1.973164  0.966405  1.205722 -1.157814  0.473820
&#x534F;&#x65B9;&#x5DEE;&#xFF1A;
          0         1         2         3         4
0  0.880180  0.208508  0.424085 -0.258226  0.308181
1  0.208508  0.508265  0.196497 -0.143112  0.143010
2  0.424085  0.196497  0.463182 -0.381367  0.292146
3 -0.258226 -0.143112 -0.381367  1.071948 -0.051840
4  0.308181  0.143010  0.292146 -0.051840  0.633394
'''

相关系数显示了任何两个数值(Series)之间的线性关系。有多种方法来计算 pearson(默认)， spearman和 kendall之间的相关性。

如果存在非数字列，会自动排除

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np
frame = pd.DataFrame(np.random.randn(10, 5), columns=['a', 'b', 'c', 'd', 'e'])

print (frame['a'].corr(frame['b']))
print (frame.corr()) # &#x9ED8;&#x8BA4;method='pearson'
print (frame.corr(method='spearman'))
'''
0.00603330511123
          a         b         c         d         e
a  1.000000  0.006033  0.610343  0.230200  0.097172
b  0.006033  1.000000  0.103427  0.207015  0.489303
c  0.610343  0.103427  1.000000 -0.331057  0.440306
d  0.230200  0.207015 -0.331057  1.000000 -0.212727
e  0.097172  0.489303  0.440306 -0.212727  1.000000
          a         b         c         d         e
a  1.000000  0.018182  0.466667  0.333333  0.090909
b  0.018182  1.000000  0.200000  0.236364  0.551515
c  0.466667  0.200000  1.000000 -0.260606  0.442424
d  0.333333  0.236364 -0.260606  1.000000 -0.224242
e  0.090909  0.551515  0.442424 -0.224242  1.000000
'''

数据排名为元素数组中的每个元素生成排名。在相同的情况下，分配平均等级

默认为true(ascending=True) 升序，可设置为false(ascending=False) 降序

支持不同的tie=breaking方法

average 默认值，相同数据分配平均数

min 相同数据分配最小等级

max 相同数据分配最大等级

first 相同数据根据出现在数组的顺序分配等级

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np
s=pd.Series(np.random.randn(5),index=list('abcde'))
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print(s)
print(s.rank())
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
a   -0.441999
b   -0.894847
c    0.244536
d    1.348017
e   -0.716308
dtype: float64
a    3.0
b    1.0
c    4.0
d    5.0
e    2.0
dtype: float64
'''

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np
s=pd.Series(np.random.randn(5),index=list('abcde'))
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
s['d']=s['a']
print(s)
print(s.rank(method='first'))
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
a   -0.912937
b    0.470113
c   -0.293490
d   -0.912937
e   -1.225552
dtype: float64
a    2.0
b    5.0
c    4.0
d    3.0
e    1.0
dtype: float64
'''

窗口函数

为了更好地处理数值型数据，提供了移动函数(rolling)、扩展函数(expanding)、指数加权函数(ewm)等几种窗口函数。

举个简单的应用例子。现有有10天的销售额，想每三天求一次总和，就可用窗口函数。

rolling(window, min_periods=None, center=False, win_type=None, on=None, axis=0, closed=None)

window          &#x53EF;&#x9009;&#x53C2;&#x6570;&#xFF0C;&#x9ED8;&#x8BA4;&#x503C;&#x4E3A;1&#xFF0C;&#x8868;&#x793A;&#x7A97;&#x53E3;&#x7684;&#x5927;&#x5C0F;&#xFF0C;&#x4E5F;&#x5C31;&#x662F;&#x89C2;&#x6D4B;&#x503C;&#x7684;&#x6570;&#x91CF;
min_periods     &#x8868;&#x793A;&#x7A97;&#x53E3;&#x7684;&#x6700;&#x5C0F;&#x89C2;&#x5BDF;&#x503C;&#xFF0C;&#x9ED8;&#x8BA4;&#x4E0E;window&#x7684;&#x53C2;&#x6570;&#x503C;&#x76F8;&#x7B49;&#xFF0C;&#x5C0F;&#x4E8E;&#x8FD9;&#x4E2A;&#x503C;&#x5F97;&#x7A97;&#x53E3;&#x4E3A;NAN
center          &#x628A;&#x7A97;&#x53E3;&#x7684;&#x6807;&#x7B7E;&#x8BBE;&#x7F6E;&#x4E3A;&#x5C45;&#x4E2D;&#xFF0C;&#x5E03;&#x5C14;&#x578B;&#xFF0C;&#x9ED8;&#x8BA4;&#x4E3A;False
win_type        &#x7A97;&#x53E3;&#x7684;&#x7C7B;&#x578B;&#xFF0C;&#x622A;&#x53D6;&#x7A97;&#x7684;&#x5404;&#x79CD;&#x51FD;&#x6570;&#xFF0C;&#x5B57;&#x7B26;&#x4E32;&#x7C7B;&#x578B;&#xFF0C;&#x9ED8;&#x8BA4;&#x4E3A;None
on              &#x53EF;&#x9009;&#x53C2;&#x6570;&#xFF0C;&#x5BF9;&#x4E8E;dataframe&#x800C;&#x8A00;&#xFF0C;&#x503C;&#x4E3A;&#x5217;&#x540D;&#xFF0C;&#x7528;&#x4E8E;&#x6307;&#x5B9A;&#x8981;&#x8BA1;&#x7B97;&#x7684;&#x5217;
axis            &#x9ED8;&#x8BA4;&#x4E3A;0&#xFF0C;&#x5373;&#x5BF9;&#x5217;&#x8FDB;&#x884C;&#x8BA1;&#x7B97;
closed          &#x5B9A;&#x4E49;&#x533A;&#x95F4;&#x7684;&#x5F00;&#x95ED;&#xFF0C;&#x9ED8;&#x8BA4;&#x4E3A;right&#xFF0C;&#x53EF;&#x8BBE;&#x7F6E;&#x4E3A;left&#x3001;both&#x7B49;

可以与mean、count、sum等聚合函数一起使用，同样也有专门的聚合方法。

rolling_count()             &#x8BA1;&#x7B97;&#x5404;&#x4E2A;&#x7A97;&#x53E3;&#x4E2D;&#x975E;NA&#x89C2;&#x6D4B;&#x503C;&#x7684;&#x6570;&#x91CF;
rolling_sum()               &#x8BA1;&#x7B97;&#x5404;&#x4E2A;&#x79FB;&#x52A8;&#x7A97;&#x53E3;&#x4E2D;&#x7684;&#x5143;&#x7D20;&#x4E4B;&#x548C;
rolling_mean()              &#x8BA1;&#x7B97;&#x5404;&#x4E2A;&#x79FB;&#x52A8;&#x7A97;&#x53E3;&#x4E2D;&#x5143;&#x7D20;&#x7684;&#x5747;&#x503C;
rolling_median()            &#x8BA1;&#x7B97;&#x5404;&#x4E2A;&#x79FB;&#x52A8;&#x7A97;&#x53E3;&#x4E2D;&#x5143;&#x7D20;&#x7684;&#x4E2D;&#x4F4D;&#x6570;
rolling_var()               &#x8BA1;&#x7B97;&#x5404;&#x4E2A;&#x79FB;&#x52A8;&#x7A97;&#x53E3;&#x4E2D;&#x5143;&#x7D20;&#x7684;&#x65B9;&#x5DEE;
rolling_std()               &#x8BA1;&#x7B97;&#x5404;&#x4E2A;&#x79FB;&#x52A8;&#x7A97;&#x53E3;&#x4E2D;&#x5143;&#x7D20;&#x7684;&#x6807;&#x51C6;&#x5DEE;
rolling_min()               &#x8BA1;&#x7B97;&#x5404;&#x4E2A;&#x79FB;&#x52A8;&#x7A97;&#x53E3;&#x4E2D;&#x5143;&#x7D20;&#x7684;&#x6700;&#x5C0F;&#x503C;
rolling_max()               &#x8BA1;&#x7B97;&#x5404;&#x4E2A;&#x79FB;&#x52A8;&#x7A97;&#x53E3;&#x4E2D;&#x5143;&#x7D20;&#x7684;&#x6700;&#x5927;&#x503C;
rolling_corr()              &#x8BA1;&#x7B97;&#x5404;&#x4E2A;&#x79FB;&#x52A8;&#x7A97;&#x53E3;&#x4E2D;&#x5143;&#x7D20;&#x7684;&#x76F8;&#x5173;&#x7CFB;&#x6570;
rolling_corr_pairwise()      &#x8BA1;&#x7B97;&#x5404;&#x4E2A;&#x79FB;&#x52A8;&#x7A97;&#x53E3;&#x4E2D;&#x914D;&#x5BF9;&#x6570;&#x636E;&#x7684;&#x76F8;&#x5173;&#x7CFB;&#x6570;
rolling_cov()               &#x8BA1;&#x7B97;&#x5404;&#x4E2A;&#x79FB;&#x52A8;&#x7A97;&#x53E3;&#x4E2D;&#x5143;&#x7D20;&#x7684;&#x7684;&#x534F;&#x65B9;&#x5DEE;
rolling_quantile()          &#x8BA1;&#x7B97;&#x5404;&#x4E2A;&#x79FB;&#x52A8;&#x7A97;&#x53E3;&#x4E2D;&#x5143;&#x7D20;&#x7684;&#x5206;&#x4F4D;&#x6570;

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np

#&#x751F;&#x6210;&#x65F6;&#x95F4;&#x5E8F;&#x5217;
data=pd.DataFrame(np.random.randn(10,5),
                index=pd.date_range('1/7/2022',periods=10),
                columns=['A','B','C','D','E'])
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print(data)
print("\n&#x6309;&#x5217;&#xFF0C;&#x6BCF;&#x4E09;&#x4E2A;&#x6570;&#x6C42;&#x4E00;&#x6B21;&#x5747;&#x503C;&#xFF1A;")
#&#x6309;&#x5217;&#xFF0C;&#x6BCF;&#x4E09;&#x4E2A;&#x6570;&#x6C42;&#x4E00;&#x6B21;&#x5747;&#x503C;
print(data.rolling(window=3).mean())
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
                   A         B         C         D         E
2022-01-07  0.542684 -1.635823 -1.802155 -1.980247 -1.767874
2022-01-08  0.473660  0.238196  0.635087  0.095407  2.917256
2022-01-09 -0.686964  1.065335  0.111492  0.188647 -1.547853
2022-01-10  0.624000 -0.989019  0.952622  0.535373  1.777557
2022-01-11 -0.081070 -2.004308  0.130385  0.629720  1.847073
2022-01-12  0.576814 -1.625438 -0.241784  0.554110  1.218151
2022-01-13  0.821037  0.547141  0.687803  1.036830 -0.384649
2022-01-14  0.227098 -0.139544  1.420318 -0.662357 -0.568126
2022-01-15 -0.550632 -0.314651 -0.085709  1.391168 -1.380198
2022-01-16  0.831026 -0.015572  1.173119 -1.844141  0.293887

&#x6309;&#x5217;&#xFF0C;&#x6BCF;&#x4E09;&#x4E2A;&#x6570;&#x6C42;&#x4E00;&#x6B21;&#x5747;&#x503C;&#xFF1A;
                   A         B         C         D         E
2022-01-07       NaN       NaN       NaN       NaN       NaN
2022-01-08       NaN       NaN       NaN       NaN       NaN
2022-01-09  0.109794 -0.110764 -0.351858 -0.565398 -0.132824
2022-01-10  0.136899  0.104837  0.566401  0.273142  1.048987
2022-01-11 -0.048011 -0.642664  0.398166  0.451247  0.692259
2022-01-12  0.373248 -1.539588  0.280408  0.573068  1.614260
2022-01-13  0.438927 -1.027535  0.192135  0.740220  0.893525
2022-01-14  0.541650 -0.405947  0.622112  0.309528  0.088459
2022-01-15  0.165834  0.030982  0.674137  0.588547 -0.777658
2022-01-16  0.169164 -0.156589  0.835910 -0.371776 -0.551479
'''

window=3表示每一列中依次紧邻的每三个数求一次均值。当不满足三个数时，返回为NaN,因此前两行的值为NaN，第三行开始才满足window=3。

expanding()又叫扩展窗口函数，此函数可以应用于一系列数据。指定min_periods = n参数并在其上调用适当的统计函数。例：min_periods=3表示向后移动3个值求一次

和rolling()函数参数用法相同，不同的是，其不是固定窗口长度，其长度是不断的扩大的。expanding()函数，类似cumsum()函数的累计求和，其优势在于还可以进行更多的聚类计算；

expanding(min_periods=1, center=False, axis=0)

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np

#&#x751F;&#x6210;&#x65F6;&#x95F4;&#x5E8F;&#x5217;
data=pd.DataFrame(np.random.randn(10,5),
                index=pd.date_range('1/7/2022',periods=10),
                columns=['A','B','C','D','E'])
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print(data)
print("\n&#x6309;&#x5217;&#xFF0C;&#x5411;&#x540E;&#x79FB;&#x52A8;3&#x4E2A;&#x503C;&#x6C42;&#x4E00;&#x6B21;&#x5747;&#x503C;&#xFF1A;")
print(data.expanding(min_periods=3).mean())
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
                   A         B         C         D         E
2022-01-07 -0.771347 -0.780668  0.451256 -0.149097  0.283219
2022-01-08 -1.464821 -0.911337  0.613680  0.390272  1.106521
2022-01-09 -1.130770  0.301968 -1.765989  0.201855  0.111467
2022-01-10  0.233874 -0.703496 -0.061122  1.040556 -0.635603
2022-01-11 -0.865815 -1.080583 -0.481439  0.951778  1.321507
2022-01-12 -1.218809 -0.203118  0.489582  0.982277 -0.639730
2022-01-13  0.931522  1.195148  0.249427  0.436640 -1.634224
2022-01-14  0.830553  0.596932  0.073513  0.655686 -0.482013
2022-01-15 -0.358706 -0.640338  2.273640 -0.112657 -0.925666
2022-01-16 -0.515777  2.087584 -0.267237  1.549786 -0.835644

&#x6309;&#x5217;&#xFF0C;&#x5411;&#x540E;&#x79FB;&#x52A8;3&#x4E2A;&#x503C;&#x6C42;&#x4E00;&#x6B21;&#x5747;&#x503C;&#xFF1A;
                   A         B         C         D         E
2022-01-07       NaN       NaN       NaN       NaN       NaN
2022-01-08       NaN       NaN       NaN       NaN       NaN
2022-01-09 -1.122313 -0.463346 -0.233684  0.147677  0.500403
2022-01-10 -0.783266 -0.523383 -0.190543  0.370897  0.216401
2022-01-11 -0.799776 -0.634823 -0.248723  0.487073  0.437422
2022-01-12 -0.869615 -0.562872 -0.125672  0.569607  0.257897
2022-01-13 -0.612310 -0.311727 -0.072086  0.550612 -0.012406
2022-01-14 -0.431952 -0.198144 -0.053886  0.563746 -0.071107
2022-01-15 -0.423813 -0.247277  0.204728  0.488590 -0.166058
2022-01-16 -0.433010 -0.013791  0.157531  0.594710 -0.233017
'''

表示指数加权移动，ewm()函数先会对序列元素做指数加权运算，其次计算加权后的均值。该函数通过指定com、span、halflife参数来实现指数加权移动。

ewm(com=None, span=None, halflife=None, alpha=None, min_periods=0, adjust=True, ignore_na=False, axis=0)

com             &#x53EF;&#x9009;&#xFF0C;&#x6839;&#x636E;&#x8D28;&#x5FC3;&#x6307;&#x5B9A;&#x8870;&#x51CF;
span            &#x53EF;&#x9009;&#xFF0C;&#x6839;&#x636E;&#x8303;&#x56F4;&#x6307;&#x5B9A;&#x8870;&#x51CF;
halflife        &#x53EF;&#x9009;&#xFF0C;&#x6839;&#x636E;&#x534A;&#x8870;&#x671F;&#x6307;&#x5B9A;&#x8870;&#x51CF;
alpha           &#x53EF;&#x9009;&#xFF0C;&#x76F4;&#x63A5;&#x6307;&#x5B9A;&#x5E73;&#x6ED1;&#x7CFB;&#x6570;
min_periods     &#x9ED8;&#x8BA4;0.&#x7A97;&#x53E3;&#x4E2D;&#x5177;&#x6709;&#x503C;&#x5F97;&#x6700;&#x5C0F;&#x89C2;&#x5BDF;&#x6570;
ignore_na       &#x9ED8;&#x8BA4;&#x4E3A;False&#xFF0C;&#x8BA1;&#x7B97;&#x6743;&#x91CD;&#x65F6;&#x5FFD;&#x7565;&#x7F3A;&#x5931;&#x503C;
axis            &#x6307;&#x5B9A;&#x884C;&#x5217;

-*- coding: UTF-8 -*-
import pandas as pd
import numpy as np

#&#x751F;&#x6210;&#x65F6;&#x95F4;&#x5E8F;&#x5217;
data=pd.DataFrame(np.random.randn(10,5),
                index=pd.date_range('1/7/2022',periods=10),
                columns=['A','B','C','D','E'])
print("&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;")
print(data)
print("\newm&#x6307;&#x6570;&#x52A0;&#x6743;&#xFF1A;")
print(data.ewm(com=0.5).mean())
'''
&#x539F;&#x59CB;&#x6570;&#x636E;&#xFF1A;
                   A         B         C         D         E
2022-01-07  0.753775 -2.286938  0.084993 -0.221862 -0.119122
2022-01-08  0.623465 -1.524564 -1.886333 -0.829565 -0.385675
2022-01-09  0.706225  0.549525  0.700519 -0.369354 -0.610060
2022-01-10 -1.080328  0.148164 -0.997218  0.163784  1.693016
2022-01-11  0.278026 -0.182397 -0.380273  0.758482 -0.696516
2022-01-12 -1.075102  0.249555 -0.026082 -0.610358 -1.881195
2022-01-13  0.408630  0.857240  1.423119  0.393536  1.242594
2022-01-14  0.250480 -2.281525 -0.236896 -0.274785 -0.625786
2022-01-15 -0.452394 -0.161964 -0.990537  0.240394 -2.166892
2022-01-16 -1.020385  0.016318 -0.909341  2.362652  0.401030

ewm&#x6307;&#x6570;&#x52A0;&#x6743;&#xFF1A;
                   A         B         C         D         E
2022-01-07  0.753775 -2.286938  0.084993 -0.221862 -0.119122
2022-01-08  0.656043 -1.715157 -1.393502 -0.677639 -0.319037
2022-01-09  0.690784 -0.147301  0.056205 -0.464211 -0.520515
2022-01-10 -0.504716  0.052138 -0.654856 -0.040315  0.973619
2022-01-11  0.019268 -0.104865 -0.471044  0.494417 -0.144405
2022-01-12 -0.711314  0.131739 -0.173995 -0.243111 -1.303856
2022-01-13  0.035657  0.615628  0.891235  0.181514  0.394554
2022-01-14  0.178894 -1.316102  0.139033 -0.122732 -0.285776
2022-01-15 -0.241986 -0.546638 -0.614052  0.119365 -1.539917
2022-01-16 -0.760927 -0.171328 -0.810915  1.614915 -0.245930
'''

Original: https://blog.csdn.net/weixin_52850085/article/details/126213240
Author: 沐锹
Title: Pandas函数方法分类参数说明+实例分析！！

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/755622/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【RocketMQ】主从模式下的消费进度管理

在【RocketMQ】消息的拉取一文中可知，消费者在启动的时候，会创建消息拉取API对象 PullAPIWrapper，调用pullKernelImpl方法向Broker发送拉取消…

Python 2023年10月12日
0046
Python操作Numpy模块库

14天学习训练营导师课程：杨鑫《Python 自学编程基础》杨鑫《 Python 网络爬虫基础》杨鑫《 Scrapy 爬虫框架实战和项目管理》 Python操作Numpy模块库文…

Python 2023年8月27日
0048
pip install 与 conda install的区别

以前一直不知道pip install 与 conda install有什么区别，每次都是先用pip装，要是不行就换conda install。但是前一段时间在配置环境的时候发现了一…

Python 2023年9月8日
0037
Python的seaborn和matplotlib作图之barplot条形图高级实战DIY技巧详解

前言昨天在浏览www.hltv.org网站的csgo选手数据时看到了这样一幅图，图上包含有选手的六项数据，分别为KPR（平均每回合击杀），DPR（平均每回合死亡），KAST（助攻…

Python 2023年9月3日
0060
Python学习：绑定方法与非绑定方法

类中定义的函数分为两大类：绑定方法和非绑定方法其中绑定方法又分为绑定到对象的对象方法和绑定到类的类方法。在类中正常定义的函数默认是绑定到对象的，而为某个函数加上装饰器@clas…

Python 2023年10月31日
0038
在矩池云使用Disco Diffusion生成AI艺术图

在 Disco Diffusion 官方说明的第一段，其对自身是这样定义： AI Image generating technique called CLIP-Guided Dif…

Python 2023年10月25日
0047
Python3 – Flask之logging日志的使用

前言:日志是一种可以追踪某些软件运行时所发生事件的方法；软件开发人员可以向他们的代码中调用日志记录相关的方法表明发生了某些事情；一个事件可以用一个可包含可选变量数据的消息来描述；事…

Python 2023年8月9日
0039
Pandas基础题一百道（前15）

目录 1、使用List创建Series 2、使用Dict创建Series 3、将Series转换成List 4、将Series转换成DataFrame 5、借助Numpy创建Ser…

Python 2023年8月18日
0048
Unity架构之详解域重新加载和场景重新加载

一、unity进入运行模式包括以下主要阶段备份当前场景：这仅在场景被修改后发生。这样当退出运行模式时，Unity 将场景恢复为运行模式开始前的状态。 Domain Reload：…

Python 2023年9月29日
0029
MATLAB中text函数使用

目录语法说明示例向数据点添加文本说明向多个数据点添加文本显示多行文本指定文本大小和颜色修改现有文本 text函数的功能是向数据点添加文本说明。语法 text(x,…

Python 2023年8月1日
0050
机器学习中的数据预处理方法与步骤

数据预处理是准备原始数据并使其适用于机器学习模型的过程。这是创建机器学习模型的第一步，也是至关重要的一步。在创建机器学习项目时，我们并不总是遇到干净且格式化的数据。并且在对数据进…

Python 2023年10月26日
0047
基于python的Flask web开发三：jinja2控制语句和模板的使用与继承

jinja2是基于python的一种模板引擎，具有很高的安全性。（很抽象，但是不影响学习和使用）。一、jinja2的控制和循环语句和C，C++，java相比jinja2的控制和…

Python 2023年8月10日
0036
NLP标注工具Brat的简单使用

目录写在前面 1. 背景 2. Brat的安装与启动 3. Brat的运行 4. 标注配置与标注 (1) 原始数据文件准备 (2) 配置文件配置 (3) 标注 (4) 中文标签配…

Python 2023年9月15日
00149
Python 函数进阶-递归函数

递归函数什么是递归函数如果函数可以调用自身，则该函数是递归函数。 [En] If a function can call itself, then the function i…

Python 2023年5月24日
0078
【技术流吃瓜】python可视化大屏舆情分析“张天爱“事件网友评论

一、事件背景二、微热点分析二、自开发Python舆情分析 2.1 Python爬虫 2.2 可视化大屏 2.2.1 大标题 2.2.2 词云图 2.2.3 条形图 2.2.4 …

Python 2023年5月23日
00105
GPT2模型详解

一背景介绍 GPT2模型是OpenAI组织在2018年于GPT模型的基础上发布的新预训练模型，其论文原文为 language_models_are_unsupervised_mu…

Python 2023年10月10日
0037

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Pandas函数方法分类 参数说明+实例分析！！