1、频数:一组定量数据中,每一个数值发生的次数即为频数。
2、频率:将每一个数值发生的次数除以样本总数量,即频率
data 在下面代表样本数据集—————————————————–
2.1、求平均数:(Sample Mena)
data.mean()
2.2、求中位数(Median):即使样本中至少50%的数据大于等于md,同时至少50%的数据小于等于md,它是一个很好的度量数据中心位置的方法。
data.median()
2.3、众数(Mode): 众数是一组数据中出现次数最多的数值,也是常见的度量数据中心位置的指标。同中位数一样,众数不易受极端值的影响。
data.mode()
2.4、百分位数: 第n百分分位数即为使得至少(100-n)%的观测值大于等于该数、至少n%的观测值小于等于该数的一个数值。通常将第25百分位数与中位数、第75百分位数取出来组成四分位数,分别叫做第一四分位数(或下四分位数),第二四分位数、第三四分位数(或上四分位数)。
求上四分位数和下四分位数:quantile( )
data.quantile(i) for i in [0.25, 0.75]
3.1、极差(Range)
一个数据集中最大值与最小值之差,即为极差。公示为:
极差 = 最大值 -最小值 : data.max() – data.min()
3.2 、平均绝对偏差(Mean Absolute Deviation)
数据的离散度还可以通过一组数据中数据与均值的偏差来度量。一个数据与均值的差值越大,说明该数据偏离均值越远。但是所有数据的差值加总起来和为零,所以离散度无法用其和来度量。但数据与均值的差值之绝对值也可以衡量整体的离散程度
求平均绝对偏差: data.mad()
3.3方差(Variance)和标准方差(Standard Deviation)
除了对数据与均值的差取绝对值以外,方差即是根据数据与均值偏差的平方算出的用于衡量数据离散度的指标,而标准差是偏差的平方根。 这2种指标是我们在实务中最常用的衡量数据离散度的指标。
求方差:data.var()
求标准差:data.std()
python 统计学基础2:随机变量简介———————————————
1、概率是用来刻画事物不确定性的一种测度,根据概率的大小,我们可以判断不确定性的高低。概率取值介于 0 和 1 之间。
Original: https://blog.csdn.net/weixin_53823523/article/details/125252666
Author: 随风的博客
Title: 统计学基础1:描述性统计(数据的离散度、极差、方差、标准差)
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/697015/
转载文章受原作者版权保护。转载请注明原作者出处!