数据统计与可视化课程总结(一):大数定理与数理统计

大数定理与蒙特卡洛

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

大数定律的客观背景

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
大量随机试验中
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 事件发生的频率稳定于某一常数
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 测量值的算术平均值具有稳定性
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
比如:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 大量抛掷硬币正面出现频率
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 字母使用频率
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

本福特定律

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
也叫纽科姆-本福德定律,反常数定律,或第一位数定律,是关于许多现实生活中的数字数据中前几位数字的频率分布的观察。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
十进制中,首位数字出现的概率为:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
d,1,2,3,4,5,6,7,8,9
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
p,30.1%,17.6%,12.5%,9.7%,7.9%,6.7%,5.8%,5.1%,4.6%
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

中心极限定理(CLT)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
中心极限定理是概率论中最著名的结果之一,它不仅提供了计算独立随机变量之和的近似概率的简单方法,而且有助于解释为什么很多自然群体的经验频率呈现出钟形曲线这一值得注意的事实。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
中心极限定理使得很多参数检验成为可能,只要 样本数量足够多(通常要求>30)即可,底层分 布如何没有关系。因此,t检验对正态偏离的鲁棒性高。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

贝叶斯定理

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
贝叶斯公式:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[\begin{eqnarray} P(B \mid A) & = & \frac{P(A \mid B) P(B)}{P(A)} \ {\text {Posterior}} & = & \frac{\text { likelihood } \times \text { prior }}{\text { evidence }} \end{eqnarray} ]
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
似然(likelihood):
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[L(\theta \mid x)=P(X=x \mid \theta) ]
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
极大似然估计(MLE):
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
Maximum Likelihood Estimate(MLE):找出参数θ,使得从中抽样所得的观测数据的概率最大
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[L(\theta)=L\left(x_{1}, x_{2}, \ldots, x_{n} ; \theta\right)=\prod_{i=1}^{n} p\left(x_{i} ; \theta\right) ]
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

判别模型 vs 生成模型

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
生成模型对数据的生成方式进行建模。它提出一个问题 :根据我的生成方式假设,哪个类别(y)最有可能产生当前的特征(X)?需要对(P(X|Y))进行建模。 判别模型不关心数据是如何生成的,它只是对给定的特征进行判别/分类。直接对(P(Y|X))进行建模。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
贝叶斯定理应用:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[p \text { (类别|特征) }=\frac{p(\text { 特征|类别 }) p \text { (类别})}{p(\text {特征) }}\ p \text { (病因|症状) }=\frac{p(\text { 症状|病因 }) p \text { (病因})}{p(\text {症状) }} ]
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

概率统计基础知识

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

随机变量

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 在实际问题中,随机试验的结果可以用数量来 表示,由此就产生了随机变量的概念。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 随机变量通常用大写字母 X,Y,Z,W,N 等表示。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 而表示随机变量所取的值时, 一般采用小写字母 x, y, z, w, n等。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 有了随机变量, 随机试验中的各种事件,就可 以通过随机变量的关系式表达出来。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
随机变量概念的产生是概率论发展史上的 重大事件. 引入随机变量后,对随机现象统计 规律的研究,就由对 事件及事件概率的研究扩 大为对 随机变量及其取值规律的研究
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
我们将研究两类随机变量:离散型随机变量、连续型随机变量。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
离散型随机变量表示方法 (1)公式法 (2)列表法。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

离散型随机变量三种常见分布:

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

(0,1)分布

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
(也称两点分布或 伯努利分布) 随机变量X只可能取0与1两个值,其分布律为:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[P{X=k}=p^{k}(1-p)^{1-k}, \quad k=0,1 \quad(0
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
或:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[X \sim\left|\begin{array}{cc} 0 & 1 \ 1-p & p \end{array}\right| ]
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

二项分布

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
将伯努利试验E独立地重复地进行n次 , 则称这一串重复的独立试验为n重伯努利试验。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计=p保持不变
数据统计与可视化课程总结(一):大数定理与数理统计

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

泊松分布

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
设随机变量X所有可能取的值为0 , 1 , 2 , … , 且概率分布为:(P(X=k)=\frac{\lambda^{k}}{k !} e^{-\lambda}, \quad k=0,1,2, \cdots \cdots,)其中 >0 是常数,则称 X 服从参数为的(\lambda)泊松分布,记作X ~ π((\lambda) )
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
泊松分布是二项分布n很大而p很小时的一种极限形式
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
二项分布是说,已知某件事情发生的概率是p,那么做n次试验,事情发 生的次数就服从于二项分布。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计

数据统计与可视化课程总结(一):大数定理与数理统计

数据统计与可视化课程总结(一):大数定理与数理统计

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

连续型随机变量三种常见分布:

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

均匀分布

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
若r .v X的概率密度为:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[f(x)=\left{\begin{aligned} \frac{1}{b-a}, & a
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
则称X在区间( a, b)上服从均匀分布(uniform),记作(X)~(U(a, b))
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
若(X)~(U(a, b)):
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
(1) 对于长度(l)为的区间((c, c+l), a \leq c
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[P{c
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
(2) (X)的分布函数为:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[F(x)=P{X \leq x}=\left{\begin{array}{ll} 0, & x
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

指数分布

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
若r .v X具有概率密度:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[f(x)=\left{\begin{array}{ll} \frac{1}{\theta} e^{-\frac{x}{\theta}}, x>0 \ 0, \qquad \text {其它} \end{array}\right. ]
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
其中(\theta)> 0为常数, 则称 X服从参数为(\theta)的指数分布(X)~(Expo(\theta)).
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
指数分布常用于可靠性统计研究中,如元件的寿命.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
若X服从参数为(\theta)的指数分布, 则其分布函数为
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[F(x)=P{X \leq x}=\left{\begin{array}{ll} 1-e^{-x / \theta}, & x>0 \ 0, & \text { 其它 } \end{array}\right. ]
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
指数分布常用于可靠性统计研究中,如元件的寿命.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
指数分布具有无记忆性。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[\begin{array}{c} P{X>s+t \mid X>s}=P{X>t} . \end{array} ]
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

正态分布

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
若连续型r .v X 的概率密度为
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[f(x)=\frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{(x-\mu)^{2}}{2 \sigma^{2}}}, \quad-\infty
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
其中μ和σ( σ>0 )都是常数, 则称(X)服从参数为μ和σ的 正态分布高斯分布。记作(X)~(N(\mu, \sigma^2))
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
标准正态分布
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
μ = 0, σ = 1 的正态分布称为 标准正态分布.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
其密度函数和分布函数常用φ((x)) 和Φ((x)) 表示:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[\begin{array}{l} \varphi(x)=\frac{1}{\sqrt{2 \pi}} e^{-\frac{x^{2}}{2}},-\infty
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
定理1 若 (X)~(N(\mu, \sigma^2)) 则 (Z=\frac{X-\mu}{\sigma} \sim N(0,1))
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
3 (\sigma) 准则
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
由标准正态分布的查表计算可以求得,当(X)~(N(0, 1)) 时
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[\begin{array}{l} P(|X| \leq 1)=2\Phi(1)-1=0.6826 \ P(|X| \leq 2)=2\Phi(2)-1=0.9544 \ P(|X| \leq 3)=2\Phi(3)-1=0.9974 \end{array} ]
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
这说明,X的取值几乎全部集中在[-3,3]区间内,超出这个范围的可能性仅占不到0.3%.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
矩(moment)
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
一阶中心距是平均值,二阶中心距是方差,三阶中心矩是偏度,四阶中心距(经过归一化和转移)是峰度。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
协方差矩阵
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
类似定义n 维随机变量$(X_1, X_2, …, X_n) $的协方差矩阵.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
若:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[\begin{aligned} c_{i j}=& \operatorname{Cov}\left(X_{i}, X_{j}\right) \ =& E\left{\left[X_{i}-E\left(X_{i}\right)\right]\left[X_{j}-E\left(X_{j}\right)\right]\right} \ &(\boldsymbol{i}, j=\mathbf{1}, 2, \ldots, n) \end{aligned} ]
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
都存在,称
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
矩阵 C为((X_1, X_2, …, X_n)) 的协方差矩阵
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[C=\left ( \begin{array}{cccc} c_{11} & c_{12} & \cdots & c_{1 n} \ c_{21} & c_{22} & \cdots & c_{2 n} \ \vdots & \vdots & \cdots & \vdots \ c_{n 1} & c_{n 2} & \cdots & c_{n n} \end{array}\right ) ]
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数理统计

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
统计:给出你手中的信息( 样本) , 桶(总体)里有什么?
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
概率:给出桶中的信息,你手里有什么?
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
数理统计可以分为描述性统计和统计推断,前者侧重于总结和说明被观测数据集合(样本)的特征。样本
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
是从总体中抽取的,表示与我们实验相关的相似个体或事件的总集合。与描述性统计相反,统计推断从给定的样本中进一步推导出总体的特征。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 描述性统计:呈现、组织和汇总数据
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 统计推断:根据样本中观测到的数据得出关于总体的结论
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
描述性统计是用于数据分析的术语,它有助于以有意义的方式描述、显示或总结数据,比如数据可能出现的模式。但是,描述性统计并不允许我们在所分析的数据之外得出结论,或者就我们可能做出的任何假设得出结论。它只是描述数据的一种方式。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

总体和样本

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
总体
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
一个统计问题总有它明确的研究对象.研究对象的全体称为 总体,总体中每个成员称为 个体,总体中所包含的个体的个数称为总体的 容量.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
总体分为有限总体和无限总体.研究某批灯泡的质量
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
定义:设(X)是具有分布函数(F)的随机变量,若(X_1,X_2,…,X_n)是具有同一分布函数(F)的、相互独立的随机变量,则称(X_1,X_2,…,X_n)为从分布函数(F)(或总体、或总体)得到的容量(n)为的简单随机样本,简称样本,它们的观察值(X_1,X_2,…,X_n)称为样本值,又称为(X)的(n)个独立的观察值.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

统计量

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
几个常见统计量:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
样本平均值、样本方差、样本标准差、
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
样本k阶原点矩:(A_{k}=\frac{1}{n} \sum_{i=1}^{n} X_{i}^{k},k=1,2,…)
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
样本k阶中心矩:(B_{k}=\frac{1}{n} \sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{k})
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
请注意:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
若总体(X) 的(k)阶矩$E\left(X{k}\right)=\mu $ 存在, 则当(n\rightarrow\infty) 时, $A_{k}=\frac{1}{n} \sum_{i=1}^{n} X_{i}^{k} \stackrel{p}{\longrightarrow} \mu^{k} \quad k=1,2, \cdots $
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
事实上由(X_1,X_2,…,X_n)独立且与(X)同分布,有(X_1^k,X_2^k,…,X_n^k)独立且与(X^k)同分布,(E(X_i^k)=\mu^k),(k=1,2,…,n)再由辛钦大数定律可得上述结论.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
再由依概率收敛性质知,可将上述性质推广为
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[g\left(A_{1}, A_{2}, \cdots, A_{k}\right) \stackrel{p}{\longrightarrow} g\left(\mu_{1}, \mu_{2}, \cdots, \mu_{k}\right) ]
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
其中g为连续函数.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
这就是矩估计法的理论根据.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
统计量(样本) vs 参数(总体)
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
样本的属性如平均值或者标准差,不称为参数而是被称作统计量。推断统计是使我们能够利用样本对样
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
本所来自的总体进行概括/推断的技术。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
使用统计量评估参数.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

统计三大抽样分布

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
抽样分布
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
如果总体(Population)满足特定的分布,那么其样本(Sample)(统计量)满足怎样的分布规律?
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
关于样本均值的抽样分布,如(t)
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
关于样本方差的抽样分布,如(\chi^2) 、(F)
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

(\chi^2) 分布

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
(\chi^2)分布是由正态分布派生出来的一种分布.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
定义: 设(X_1,X_2,…,X_n)相互独立, 都服从标准正态分布(N(0,1)), 则称随机变量:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[\chi^{2}=X_{1}{ }^{2}+X_{2}{ }^{2}+\cdots+X_{n}{ }^{2} ]
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
所服从的分布为自由度为n 的(\chi^2)分布.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
自由度(degree of freedom)记为(\chi^{2} \sim \chi^{2}(n))
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
卡方分布-不同自由度下的PDF曲线(概率密度函数):
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

(t) 分布(学生分布)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
定义: 设(X~N(0,1)) , (Y~\chi^2), 且(X)与(Y)相互独立,则称变量(t=\frac{X}{\sqrt{Y / n}})所服从的分布为自由度为n 的t 分布.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
记为(t\sim t(n)).
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
分布的性质:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 具有自由度为(n)的(t)分布(t\sim t(n)), 其数学期望与方差为:E(t)=0, D(t)=n /(n-2)(n>2)
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 即当(n)足够大时,(t \stackrel{\text { 近似 }}{\sim} N(0,1)).

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

F分布

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
定义: 设(U \sim \chi^{2}\left(n_{1}\right), V \sim \chi^{2}\left(n_{2}\right))
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
(U)与(V)相互独立,则称随机变量(F=\frac{U / n_{1}}{V / n_{2}})
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
服从自由度为(n_1)及(n_2) 的F分布,(n_1)称为第一自由度,(n_2)称为第二自由度,记作(F\sim F(n1,n2))
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
由定义可见:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[\frac{1}{F}=\frac{V / n_{2}}{U / n_{1}} \sim \boldsymbol{F}\left(\boldsymbol{n}{\mathbf{2}}, \boldsymbol{n}{\mathbf{1}}\right) ]
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
F分布的数学期望为:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[E(F)=\frac{n_{2}}{n_{2}-2} \quad \text { 若 } \boldsymbol{n}_{\mathbf{2}}>\mathbf{2} ]
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
即它的数学期望并不依赖于第一自由度(n_1).
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

参数估计概念

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
研究统计量的性质和评价一个统计推断的优良性,取决于其抽样分布的性质.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
设有一个统计总体, 总体的分布函数为(F( x, \theta )) ,其中(\theta)为未知参数((\theta)可以是向量) .
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
现从该总体抽样,得样本(X_1,X_2,…,X_n),要依据该样本对产生该样本的参数((\theta)作出估计, 或估计(\theta)的某个已知函数 (g(\theta)) .
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
这类问题称为参数估计.参数估计分为点估计和区间估计.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
举例:为估计总体均值μ
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
我们需要构造出适当的样本的函数/统计量$T(X_1,X_2,…X_n) $,每当有了样本,就代入该函数中算出一个值,用来作为μ的估计值.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
(T(X_1,X_2,…X_n)) 称为参数μ的点估计量,把样本值代入(T(X_1,X_2,…X_n))中,得到μ的一个点估计值.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

参数估计计算方法

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

矩估计法

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

最大似然法(MLE)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
似然(likelihood):
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
[L(\theta \mid x)=P(X=x \mid \theta) ]
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

估计量的评选标准

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
常用的几条标准是:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 无偏性
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 有效性
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 相合性
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

区间估计

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
我们希望确定一个区间,使我们能以比较高的 可靠程度相信它包含真参数值.通常采用95%的CI(置信区间).
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
习惯上把置信水平记作 (1 − \alpha),这里(\alpha)是一个很小的正数.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
置信区间(CI)的第一种求解方法:利用抽样分布(需要事先知道抽样分布)
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
JB Statistics – 适合所有人的统计教程!
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

单侧置信区间

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
上述置信区间中置信限都是双侧的,但对于有些实际问题,人们关心的只是参数在一个方向的界限.例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
这时, 可将置信上限取为+∞ ,而只着眼于置信下限,这样求得的置信区间叫单侧置信区间.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

正态总体均值与方差的区间估计

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

单个总体 (N(\mu ,\sigma^2)) 的情况

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

两个总体 (N(\mu_1 ,\sigma_1^2)) , (N(\mu_2 ,\sigma_2^2)) 的情况

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
②置信区间(CI)的第二种求解方法:利用Bootstrapping(不需要事先知道抽样分布)
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
Bootstrapping是一种有放回的抽样
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

假设检验

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
计算一个合适的检验统计量(基于样本数据),并确定有多少证据反对原假设。如果证据足够强(如果它满足一定的显著性水平),我们可以拒绝原假设,从而支持备择假设。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
拒绝/否定(H_0)并不是说(H_0)一定错,而只是说差异到了一定的显著程度,拒绝(H_0)比较合理.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
反之,接受(H_0)并不是肯定(H_0)一定对,而只是说差异还不够显著,还没有达到足以否定(H_0)的程度.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

假设检验的一般步骤(t检验)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
在上面的例子的叙述中,我们已经初步介绍了假设检验的基本思想和方法.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
下面,我们再结合另一个例子,进一步说明假设检验的一般步骤.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
上述利用t 统计量得出得检验法称为 t检验法。在实际中,正态总体的方差常为未知,所以我们常用t 检验法来检验关于正态总体均值的检验问题。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

假设检验的p值法(The p-value method)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
p-value:p值,也称概率值,是一个数字,描述数据随机发生的可能性(即原假设为真),统计显著性水平通常用0到1之间的p值表示。p值越小,拒绝原假设的证据就越充分,当原假设成立时,检验统计量至少比观察到的检验统计量更极端(离谱)的概
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
率:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
(p < 0.05) 显著
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
(p < 0.01) 极其显著
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
或原假设可被拒绝的最小显著性水平。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
p-hacking:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
A/B 测试是一种产品优化的方法,为同一个优化目标制定两个方案(比如两个页面),让一部分用户使用A 方案(称为控制组或对照组),同时另一部分用户使用B 方案(称为变化组或试验组),统计并对比不同方案的转化率、点击量、留存率等指标,以判断不同方案的优劣并进行决策。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
A/B测试的本质:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
A/B测试中是用对照版本和试验版本这两个样本的数据来对两个总体是否存在差异进行检验,所以其本质是使用假设检验中的独立样本t检验。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
除了以上对 正态总体均值的假设检验,还可以对 方差进行假设检验
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
方差齐次检验
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
在方差分析的F检验中,是以各个实验组内总体方差齐性为前提的,因此,按理应该在方差分析之前,要对各个实验组内的总体方差先进行齐性检验。如果各个实验组内总体方差为齐性,而且经过F检验所得多个样本所属总体平均数差异显著,这时才可以将多个样本所属总体平均数的差异归因于各种实验处理的不同所致;如果各个总体方差不齐,那么经过F检验所得多个样本所属总体平均数差异显著的结果,可能有一部分归因于各个实验组内总体方差不同所致。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
简单地说就是在进行两组或多组数据进行比较时,先要使各组数据符合正态分布,另外就是要使各组数据的方差相等(齐性)。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

假设检验的两类错误

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
假设检验会不会犯错误呢?由于作出结论的依据是小概率原理.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
小概率事件在一次试验中基本上不会发生.不是一定不发生
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
两类错误的概率的关系
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
两类错误是互相关联的, 当样本容量固定时,一类错误概率的减少导致另一类错误
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
概率的增加.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
要同时降低两类错误的概率(\alpha,\beta)或者要在(\alpha)不变的条件下降低,需要增加样本容量.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
通常情况:控制1类错误,不关心2类错误
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
许多教科书和教师会说,类型1(弃真)比类型2(取伪)错误更糟糕。其基本原理可以归结为这样一种(保守的)观点:如果你坚持现状或默认假设,至少你不会让事情变得更糟。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
实际情况下,应评估两类错误的现实代价,以权衡1类和2类。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
对于2类错误(β),该如何度量和控制? Power Analysis !
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

效应量(effect size)(选学)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
效能/ 势
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 效能:当一个原假设为假时拒绝它的概率——因此应该被拒绝
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* Jacob Cohen是效能分析之父
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 把效能描述为1-β
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 可接受的效能为大于等于.80-有人认为大于.70是可接受的,并且大于.90是很优秀。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 效能分析通常是事先进行的,但也可以事后进行
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
效能与以下因素有关:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* α水平
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 样本容量(主要决定因素)
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 效应量
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 正在进行统计的统计检验的类型
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 试验的设计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
– 放宽α的约束(取α为.1或.15)
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
– 使用参数统计量
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
– 增加测量的可靠性
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
– 使用单边检验(one-sided/one-tailed)
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
– 增加样本容量(N)
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
– 提高设计或分析的灵敏度
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

方差分析(ANOVA)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
​ 在方差分析的F检验中,是以各个实验组内总体方差齐性为前提的,因此,按理应该在方差分析之前,要对各个实验组内的总体方差先进行齐性检验。如果各个实验组内总体方差为齐性,而且经过F检验所得多个样本所属总体平均数差异显著,这时才可以将多个样本所属总体平均数的差异归因于各种实验处理的不同所致;如果各个总体方差不齐,那么经过F检验所得多个样本所属总体平均数差异显著的结果,可能有一部分归因于各个实验组内总体方差不同所致。简单地说就是在进行两组或多组数据进行比较时,先要使各组数据符合正态分布,另外就是要使各组数据的方差相等(齐性)。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
Levene检验是统计分析的一个组成部分。在进行其他统计分析(例如t检验和方差分析)之前,它可用于检验方差的齐次性/同质性.
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
Eta squared 是一种效应量指标(effect size),常用于方差分析中。代表的是通过方差分析能够得到解释的因变量变异程度(sum of squares effect)在所有变异程度(sum of
数据统计与可视化课程总结(一):大数定理与数理统计中所占的比例。一般希望eta square值越大越好,>0.01 为较小效应量,>0.02为中等效应量,>0.083可视为大效应量
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

相关分析

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
因果vs 相关
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
因果:当一件事(原因)导致另一件事发生(结果)。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
相关:当两个或两个以上的事物看起来是相关的。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

皮尔逊相关系数

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
皮尔逊相关系数用来测度两个变量之间的线性相关性
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计

数据统计与可视化课程总结(一):大数定理与数理统计

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
我们在线性回归中使用(R^2)作为拟合优度的度量
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

斯皮尔曼相关系数

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
斯皮尔曼相关系数是对两个数据集之间相关性的非参数度量。与皮尔逊相关不同,斯皮尔曼相关并不假设两个数据集都是正态分布的。这个系数在-1和+1之间变化,0表示没有相关性。-1或+1的相关性暗示了一种精确的单调关系。正相关意味着当x增加时,y也增加。负相关意味着当x增加时,y减少。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

肯德尔相关系数

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

回归分析&GLzM

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
ANOVA & 线性回归
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

广义线性模型Generalized linear model

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
在统计学中,广义线性模型(GLM or GzLM)是普通线性回归的灵活推广。GLM通过允许线性模型通过链接函数与因变量相关。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
广义线性模型的3个模块:
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 线性预测模型
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 链接函数
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
* 概率分布
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
GLM (一般线性模型)是GLzM(广义线性模型)的一个特例。当广义线性模型GLzM使用恒等链接函数和一个正态分布时,就是一般线性模型GLM。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

Logit函数

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

数据统计与可视化课程总结(一):大数定理与数理统计
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
如果使用logit函数作为链接函数,并使用二项式分布/伯努利分布作为概率分布,那么该模型为逻辑回归。
![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)

![数据统计与可视化课程总结(一):大数定理与数理统计](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230130/n)
内容整理不尽详细之处请查询课件:My_Courses/数据统计与可视化 at main · ranxi2001/My_Courses (github.com)

Original: https://www.cnblogs.com/ranxi169/p/16793211.html
Author: 孤飞
Title: 数据统计与可视化课程总结(一):大数定理与数理统计



相关阅读

Title: 【Pymongo】Cursor类 可调用函数详解

clone()

Get a clone of this cursor.

获取此光标的克隆。

collation(collation: Optional[Union[Mapping[str, Any], Collation]])

Adds a Collation to this query.

向此查询添加集合 。
(翻译给的是排序规则,应该理解为集合)

collation: An instance of Collation.

集合的实例

distinct(key: str)

Get a list of distinct values for key among all documents in the result set of this query.

获取此查询结果集中所有文档中key的不同值列表。

key: name of key for which we want to get the distinct values
键的名称,我们希望得到不同的值

explain()

Returns an explain plan record for this cursor.

返回此游标的解释计划记录。

limit(limit: int)

limit: the number of results to return
返回结果的数量

max(spec: Sequence[Tuple[str, Union[int, str, Mapping[str, Any]]]])

Adds max operator that specifies upper bound for specific index.

When using max, hint() should also be configured to ensure the query uses the expected index and starting in MongoDB 4.2 hint() will be required.

添加指定特定索引上限的max运算符。

在使用max时,还应该配置hint()以确保查询使用预期的索引,并在MongoDB中启动4.2 hint()。

min(spec: Sequence[Tuple[str, Union[int, str, Mapping[str, Any]]]])

Adds min operator that specifies lower bound for specific index.

When using min, hint() should also be configured to ensure the query uses the expected index and starting in MongoDB 4.2 hint() will be required.

添加指定特定索引下界的最小操作符。

在使用min时,还应该配置hint()以确保查询使用预期的索引,并在MongoDB 4.2中启动hint()。

skip(skip: int)

Skips the first skip results of this cursor.

跳过此游标的第一个跳过结果。

sort(key_or_list: Union[str, Sequence[Tuple[str, Union[int, str, Mapping[str, Any]]]]], direction: Optional[Union[int, str]] = None)

Sorts this cursor’s results.

对游标的结果进行排序。

key_or_list: a single key or a list of (key, direction) pairs specifying the keys to sort on

direction (optional): only used if key_or_list is a single key, if not given ASCENDING is assumed
Key_or_list:单个键或(键,方向)对列表,指定要排序的键

direction(可选):仅当key_or_list是单个键时使用,如果没有给定ASCENDING则使用

where(code: Union[str, bson.code.Code])

Adds a $where clause to this query.

The code argument must be an instance of basestring (str in python 3) or Code containing a JavaScript expression. This expression will be evaluated for each document scanned. Only those documents for which the expression evaluates to true will be returned as results. The keyword this refers to the object currently being scanned.

向该查询添加$where子句。

code参数必须是一个basestring (python 3中的str)或包含JavaScript表达式的code的实例。 将对扫描到的每个文档计算该表达式。 只有表达式求值为true的文档才会返回结果。 关键字this指的是当前正在扫描的对象。
Parameters
code: JavaScript expression to use as a filter
用作过滤器的JavaScript表达式

Original: https://www.cnblogs.com/libai1024/p/16418052.html
Author: libai1024
Title: 【Pymongo】Cursor类 可调用函数详解

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/363493/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

最近整理资源【免费获取】:   👉 程序员最新必读书单  | 👏 互联网各方向面试题下载 | ✌️计算机核心资源汇总