Pandas是一个强大的分析结构化数据的工具集,基于NumPy构建,提供了
,它是使Python成为强大而高效的数据分析环境的重要因素之一
(1) 一个强大的分析和操作大型结构化数据集所需的工具集
(2) 基础是NumPy,提供了高性能矩阵的运算
(3) 提供了大量能够快速便捷地处理数据的函数和方法
(4)应用于数据挖掘,数据分析
(5)提供数据清洗功能
3.1 算术运算和数据对其
import numpy as np
import pandas as pd
s1 = pd.Series(np.arange(4),index=['a','b','c','d'])
s2 = pd.Series(np.arange(5),index=['a','c','e','f','g'])
print(s1)
print(s2)
s1+s2
df1 = pd.DataFrame(np.arange(12).reshape(4,3),index=['a','b','c','d'],columns=list('ABC'))
df2 = pd.DataFrame(np.arange(9).reshape(3,3),index=['a','d','f'],columns=list('ABD'))
print(df1)
print(df2)
df1+df2
3.2 使用填充值的算术方法
方法描述add,radd加法(+)sub,rsub减法(-)div,rdiv除法(/)floordiv,rfloordiv整除(//)mul,rmul乘法()pow,rpow幂次方(*)
print(s1)
print(s2)
print(s1+s2)
print(s1.add(s2))
s1.add(s2,fill_value=0)
print(df1)
print(df2)
print(df1+df2)
df1.add(df2,fill_value=0)
print(1/df1)
print(df1.rdiv(1))
df1.reindex(columns=df2.columns,fill_value=9)
3.3 DataFrame和Series混合运算
arr = np.arange(12).reshape(3,4)
print(arr[0])
print(arr-arr[0])
print(df1)
s3 = df1.iloc[0]
print(s3)
print(df1-s3)
s4 = df1['A']
print(s4)
df1.sub(s4,axis='index')
Original: https://blog.csdn.net/zkx990121/article/details/121584862
Author: 刚入门的小仙女
Title: 3-3 Pandas的对齐运算
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/677501/
转载文章受原作者版权保护。转载请注明原作者出处!