1.pandas是python处理表格数据的一个库!!!
导入如下(as pd 是我们用pd来代替pandas,因为简单):
import pandas as pd
2.用pandas的read_csv方法导入我们自己拥有的csv数据文件(important)
df=pd.read_csv(‘D:/Users/Desktop/data analysis/dataana/pandas/nyc_weather.csv’)
3.我们输出df数据的前四行,用head方法
print(df.head(4))
4.我们输出df数据的Temperature属性数据的最大值
df[‘Temperature’].max()
5.下边是df里有两个方括号,就是条件,从后往前看,我们找事件是下雨的EST下的所有数据
df[‘EST’][df[‘Events’]==’Rain’]
6.fillna是将df数据是空值的变成我们括号里的值,比如下边是0,当然我们要用inplace=True来执行
df.fillna(0,inplace=True)
看图1的空值在图2变成了0!!!
7.mean方法是求平均值,当然你可以尝试求方差(np.var()),最小值(np.min()),标准差(np.std())等,
df[‘WindSpeedMPH’].mean()
Original: https://blog.csdn.net/weixin_46061666/article/details/127406358
Author: Yue Zhao
Title: Data Analysis–>>pandas(1)introduction
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/743645/
转载文章受原作者版权保护。转载请注明原作者出处!