粒子滤波（PF）原理详解

2023年6月15日下午5:16 • 人工智能 • 阅读 141

文章目录

背景介绍
*
动态模型
卡尔曼滤波
重要性采样
*
蒙特卡洛采样法
重要性采样基本原理
将重要性采样引入filtering问题
序列重要性采样
基本粒子滤波算法
SIR Filter

背景介绍

在引入粒子滤波之前，有必要对其相关知识进行介绍。

动态模型

动态模型的一个主要特点是在概率模型中引入时间序列的概念，使得每个样本之间不再独立同分布，而变得有依赖关系了。

我们所看到的序列被称为观测序列，每个观测值背后都有一个隐变量，这个隐变量即系统状态，因此，动态模型又称为状态空间模型。

动态模型又分为三大类：

隐马尔科夫模型（隐变量必须离散，观测变量可以离散也可以连续）；
线性动态系统；
非线性非高斯的动态系统。

这三类模型都可以用一张图表示：

动态模型满足两个假设：

齐次马尔可夫假设：表示隐状态之间的关系，当给定z t − 1 z_{t-1}z t −1 时，z t z_t z t 只和z t − 1 z_{t-1}z t −1 有关；
观测独立性假设：表示隐状态和观测值之间的关系，当给定z t z_{t}z t 时，x t x_t x t 只和z t z_{t}z t 有关。

动态模型可以用两个方程定义：
z t = g ( z t − 1 , u , ε ) x t = h ( z t , u , δ ) z_t=g(z_{t-1}, u, \varepsilon) \ x_t=h(z_t, u, \delta)z t =g (z t −1 ,u ,ε)x t =h (z t ,u ,δ)
第一个式子表示前一个状态和后一个状态之间的关系；第二个式子表示该时刻的状态和该时刻的观测值之间的关系。u u u是系统的一个输入信号，可有可无。

; 卡尔曼滤波

卡尔曼滤波是一个典型的线性动态系统，它可以被定义为：
z t = A ⋅ z t − 1 + B + ε x t = C ⋅ z t + D + δ z_t=A\cdot z_{t-1}+B+\varepsilon \ x_t=C\cdot z_{t}+D+\delta z t =A ⋅z t −1 +B +εx t =C ⋅z t +D +δ
其中，ε ∼ N ( 0 , Q ) \varepsilon \sim N(0, Q)ε∼N (0 ,Q )，δ ∼ N ( 0 , R ) \delta \sim N(0, R)δ∼N (0 ,R )，即ε \varepsilon ε和δ \delta δ都是服从高斯分布的噪声，它们的方差矩阵分别为Q Q Q和R R R。

不管是线性动态系统还是非线性动态系统，它们所关注的问题通常都是filtering问题，即给定了第1时刻到第t时刻的观测值，求t时刻隐状态的概率，也就是P ( z t ∣ x 1 , ⋯ , x t ) P(z_t|x_1, \cdots, x_t)P (z t ∣x 1 ,⋯,x t )。

在求解filtering问题时，通常有两个步骤：

1、预测
P ( z t ∣ x 1 , ⋯ , x t − 1 ) = ∫ z t − 1 P ( z t ∣ z t − 1 ) ⋅ P ( z t − 1 ∣ x 1 , ⋯ , x t − 1 ) d z t − 1 P(z_t|x_1, \cdots, x_{t-1})=\int_{z_{t-1}}P(z_t|z_{t-1})\cdot P(z_{t-1}|x_1, \cdots, x_{t-1})dz_{t-1}P (z t ∣x 1 ,⋯,x t −1 )=∫z t −1 P (z t ∣z t −1 )⋅P (z t −1 ∣x 1 ,⋯,x t −1 )d z t −1
2、更新
P ( z t ∣ x 1 , ⋯ , x t ) ∝ P ( x t ∣ z t ) ⋅ P ( z t ∣ x 1 , ⋯ , x t − 1 ) P(z_t|x_1, \cdots, x_t)\varpropto P(x_t|z_t)\cdot P(z_t|x_1, \cdots, x_{t-1})P (z t ∣x 1 ,⋯,x t )∝P (x t ∣z t )⋅P (z t ∣x 1 ,⋯,x t −1 )

在这两个步骤中，P ( z t ∣ x 1 , ⋯ , x t − 1 ) P(z_t|x_1, \cdots, x_{t-1})P (z t ∣x 1 ,⋯,x t −1 )相当于对z t z_t z t 的先验，因为此时t t t时刻的观测值是未知的；在知道t t t时刻的观测值x t x_t x t 之后，对该先验概率进行更新，得到z t z_t z t 的后验概率P ( z t ∣ x 1 , ⋯ , x t ) P(z_t|x_1, \cdots, x_t)P (z t ∣x 1 ,⋯,x t )。

对预测公式的详细推导如下：
P ( z t ∣ x 1 , ⋯ , x t − 1 ) = ∫ z t − 1 P ( z t − 1 , z t ∣ x 1 , ⋯ , x t − 1 ) d z t − 1 = ∫ z t − 1 P ( z t ∣ z t − 1 , x 1 , ⋯ , x t − 1 ) ⋅ P ( z t − 1 ∣ x 1 , ⋯ , x t − 1 ) d z t − 1 = ∫ z t − 1 P ( z t ∣ z t − 1 ) ⋅ P ( z t − 1 ∣ x 1 , ⋯ , x t − 1 ) d z t − 1 \begin{aligned} P(z_t|x_1, \cdots, x_{t-1}) & = \int_{z_{t-1}}P(z_{t-1}, z_t|x_1, \cdots, x_{t-1})dz_{t-1} \ & = \int_{z_{t-1}}P(z_t|z_{t-1}, x_1, \cdots, x_{t-1})\cdot P(z_{t-1}|x_1, \cdots, x_{t-1})dz_{t-1} \ & = \int_{z_{t-1}}P(z_t|z_{t-1})\cdot P(z_{t-1}|x_1, \cdots, x_{t-1})dz_{t-1} \end{aligned}P (z t ∣x 1 ,⋯,x t −1 )=∫z t −1 P (z t −1 ,z t ∣x 1 ,⋯,x t −1 )d z t −1 =∫z t −1 P (z t ∣z t −1 ,x 1 ,⋯,x t −1 )⋅P (z t −1 ∣x 1 ,⋯,x t −1 )d z t −1 =∫z t −1 P (z t ∣z t −1 )⋅P (z t −1 ∣x 1 ,⋯,x t −1 )d z t −1
对更新公式的详细推导如下：
P ( z t ∣ x 1 , ⋯ , x t ) = P ( x 1 , ⋯ , x t , z t ) P ( x 1 , ⋯ , x t ) = 1 P ( x 1 , ⋯ , x t ) P ( x t ∣ x 1 , ⋯ , x t − 1 , z t ) ⋅ P ( x 1 , ⋯ , x t − 1 , z t ) = 1 P ( x 1 , ⋯ , x t ) P ( x t ∣ z t ) ⋅ P ( z t ∣ x 1 , ⋯ , x t − 1 ) P ( x 1 , ⋯ , x t − 1 ) = P ( x 1 , ⋯ , x t − 1 ) P ( x 1 , ⋯ , x t ) P ( x t ∣ z t ) ⋅ P ( z t ∣ x 1 , ⋯ , x t − 1 ) \begin{aligned} P(z_t|x_1, \cdots, x_{t}) & = \frac{P(x_1, \cdots, x_{t}, z_t)}{P(x_1, \cdots, x_{t})} \ & = \frac{1}{P(x_1, \cdots, x_{t})}P(x_t|x_1, \cdots, x_{t-1}, z_t)\cdot P(x_1, \cdots, x_{t-1}, z_t) \ & = \frac{1}{P(x_1, \cdots, x_{t})}P(x_t|z_t)\cdot P(z_t|x_1, \cdots, x_{t-1})P(x_1, \cdots, x_{t-1}) \ & = \frac{P(x_1, \cdots, x_{t-1})}{P(x_1, \cdots, x_{t})}P(x_t|z_t)\cdot P(z_t|x_1, \cdots, x_{t-1}) \end{aligned}P (z t ∣x 1 ,⋯,x t )=P (x 1 ,⋯,x t )P (x 1 ,⋯,x t ,z t )=P (x 1 ,⋯,x t )1 P (x t ∣x 1 ,⋯,x t −1 ,z t )⋅P (x 1 ,⋯,x t −1 ,z t )=P (x 1 ,⋯,x t )1 P (x t ∣z t )⋅P (z t ∣x 1 ,⋯,x t −1 )P (x 1 ,⋯,x t −1 )=P (x 1 ,⋯,x t )P (x 1 ,⋯,x t −1 )P (x t ∣z t )⋅P (z t ∣x 1 ,⋯,x t −1 )
此处的第一项由于概率中和隐变量没有关系，属于已知量，所以可作为常数看待。

卡尔曼滤波中的所有概率（条件概率、联合概率等）都是服从高斯分布的，因此我们可以得到filtering问题的解析解。但是对于非线性非高斯的动态系统，所有概率都有可能不是高斯分布的，因此是得不到解析解的，我们只能通过采样的方式（蒙特卡洛法）来近似求得所有概率的值。

重要性采样

蒙特卡洛采样法

本节主要介绍蒙特卡洛采样法，即以抽样的方法去近似求得后验概率P ( z ∣ x ) P(z|x)P (z ∣x )。大多数情况下，当得到后验概率时，我们更关心的是与该后验概率相关得期望，如E z ∣ x [ f ( x ) ] E_{z|x}[f(x)]E z ∣x [f (x )]。
E z ∣ x [ f ( z ) ] = ∫ f ( z ) P ( z ∣ x ) d z ≈ 1 N ∑ i = 1 N f ( z i ) E_{z|x}[f(z)] = \int f(z)P(z|x)dz≈ \frac{1}{N}\sum_{i=1}^Nf(z^i)E z ∣x [f (z )]=∫f (z )P (z ∣x )d z ≈N 1 i =1 ∑N f (z i )
这里从P ( z ∣ x ) P(z|x)P (z ∣x )中随机采样了N个样本，记作z ( 1 ) , z ( 2 ) , ⋯ , z ( N ) z^{(1)}, z^{(2)}, \cdots, z^{(N)}z (1 ),z (2 ),⋯,z (N )。

重要性采样基本原理

当P ( z ∣ x ) P(z|x)P (z ∣x )很复杂，或维度特别高时，我们难以在P ( z ∣ x ) P(z|x)P (z ∣x )中采样，此时需要应用重要性采样（importance sampling）来解决这一问题。

在重要性采样中，我们引入了一个简单的，易于采样的分布q ( z ∣ x ) q(z|x)q (z ∣x )，则：
E z ∣ x [ f ( z ) ] = ∫ f ( z ) P ( z ∣ x ) d z = ∫ f ( z ) p ( z ∣ x ) q ( z ∣ x ) q ( z ∣ x ) d z = 1 N ∑ i = 1 N f ( z ( i ) ) ⋅ p ( z ( i ) ∣ x ) q ( z ( i ) ∣ x ) \begin{aligned} E_{z|x}[f(z)] & =\int f(z)P(z|x)dz \ & = \int f(z) \frac{p(z|x)}{q(z|x)}q(z|x)dz \ & = \frac{1}{N} \sum_{i=1}^Nf(z^{(i)})\cdot \frac{p(z^{(i)}|x)}{q(z^{(i)}|x)} \end{aligned}E z ∣x [f (z )]=∫f (z )P (z ∣x )d z =∫f (z )q (z ∣x )p (z ∣x )q (z ∣x )d z =N 1 i =1 ∑N f (z (i ))⋅q (z (i )∣x )p (z (i )∣x )
这里从q ( z ∣ x ) q(z|x)q (z ∣x )中随机采样了N个样本，记作z ( 1 ) , z ( 2 ) , ⋯ , z ( N ) z^{(1)}, z^{(2)}, \cdots, z^{(N)}z (1 ),z (2 ),⋯,z (N )。上式中的q ( z ∣ x ) q(z|x)q (z ∣x )称为提议分布（proposal distribution），p ( z ( i ) ∣ x ) q ( z ( i ) ∣ x ) \frac{p(z^{(i)}|x)}{q(z^{(i)}|x)}q (z (i )∣x )p (z (i )∣x )表示权重（weight），可以写作w i w^{i}w i。

将重要性采样引入filtering问题

这里的filtering问题也就是之前在背景里讲过的P ( z t ∣ x 1 , ⋯ , x t ) = P ( z t ∣ x 1 : t ) P(z_t|x_1, \cdots , x_t)=P(z_t|x_{1:t})P (z t ∣x 1 ,⋯,x t )=P (z t ∣x 1 :t )，此时t时刻第i个样本的权重可写成w t ( i ) = P ( z t ( i ) ∣ x 1 : t ) q ( z t ( i ) ∣ x 1 : t ) w_t^{(i)}=\frac{P(z_t^{(i)}|x_{1:t})}{q(z_t^{(i)}|x_{1:t})}w t (i )=q (z t (i )∣x 1 :t )P (z t (i )∣x 1 :t )。

在迭代计算filtering问题过程中，我们需要在每个时刻都求N个权重（w 1 ( 1 ) , w 1 ( 2 ) , ⋯ , w 1 ( N ) w_1^{(1)}, w_1^{(2)}, \cdots, w_1^{(N)}w 1 (1 ),w 1 (2 ),⋯,w 1 (N )），这是十分困难的（主要是因为P ( z t ( i ) ∣ x 1 : t ) P(z_t^{(i)}|x_{1:t})P (z t (i )∣x 1 :t )不好求）。因此我们希望找到一个递推公式使得通过前一个时刻求出来的权重得到后一个时刻的权重。

由此想法，引出另一个算法，即序列重要性采样（sequential importance sampling, SIS）。

序列重要性采样

序列重要性采样的思路是找到w t ( i ) w_t^{(i)}w t (i )和w t − 1 ( i ) w_{t-1}^{(i)}w t −1 (i )这两个权重之间的递推关系。为简便（避免积分运算），SIS将关注点设在求概率P ( z 1 : t ∣ x 1 : t ) P(z_{1:t}|x_{1:t})P (z 1 :t ∣x 1 :t )上，而不是P ( z t ∣ x 1 : t ) P(z_t|x_{1:t})P (z t ∣x 1 :t )上，因此
w t ( i ) ∝ P ( z 1 : t ∣ x 1 : t ) q ( z 1 : t ∣ x 1 : t ) w_t^{(i)} \varpropto \frac{P(z_{1:t}|x_{1:t})}{q(z_{1:t}|x_{1:t})}w t (i )∝q (z 1 :t ∣x 1 :t )P (z 1 :t ∣x 1 :t )
首先看分子：
P ( z 1 : t ∣ x 1 : t ) = P ( z 1 : t , x 1 : t ) P ( x 1 : t ) = 1 P ( x 1 : t ) P ( z 1 : t , x 1 : t ) = 1 P ( x 1 : t ) P ( x t ∣ z 1 : t , x 1 : t − 1 ) P ( z 1 : t , x 1 : t − 1 ) = 1 P ( x 1 : t ) P ( x t ∣ z t ) P ( z 1 : t , x 1 : t − 1 ) = 1 P ( x 1 : t ) P ( x t ∣ z t ) P ( z t ∣ z 1 : t − 1 , x 1 : t − 1 ) P ( z 1 : t − 1 , x 1 : t − 1 ) = 1 P ( x 1 : t ) P ( x t ∣ z t ) P ( z t ∣ z t − 1 ) P ( z 1 : t − 1 , x 1 : t − 1 ) = 1 P ( x 1 : t ) P ( x t ∣ z t ) P ( z t ∣ z t − 1 ) P ( z 1 : t − 1 ∣ x 1 : t − 1 ) P ( x 1 : t − 1 ) = P ( x 1 : t − 1 ) P ( x 1 : t ) P ( x t ∣ z t ) P ( z t ∣ z t − 1 ) P ( z 1 : t − 1 ∣ x 1 : t − 1 ) \begin{aligned} P(z_{1:t}|x_{1:t}) & = \frac{P(z_{1:t}, x_{1:t})}{P(x_{1:t})} \ & = \frac{1}{P(x_{1:t})} P(z_{1:t}, x_{1:t}) \ & = \frac{1}{P(x_{1:t})}P(x_t|z_{1:t}, x_{1:t-1})P(z_{1:t}, x_{1:t-1}) \ & = \frac{1}{P(x_{1:t})}P(x_t|z_t)P(z_{1:t, x_{1:t-1}}) \ & = \frac{1}{P(x_{1:t})}P(x_t|z_t)P(z_t|z_{1:t-1}, x_{1:t-1})P(z_{1:t-1}, x_{1:t-1}) \ & = \frac{1}{P(x_{1:t})}P(x_t|z_t)P(z_t|z_{t-1})P(z_{1:t-1}, x_{1:t-1}) \ & = \frac{1}{P(x_{1:t})}P(x_t|z_t)P(z_t|z_{t-1})P(z_{1:t-1}|x_{1:t-1})P(x_{1:t-1}) \ & = \frac{P(x_{1:t-1})}{P(x_{1:t})}P(x_t|z_t)P(z_t|z_{t-1})P(z_{1:t-1}|x_{1:t-1}) \end{aligned}P (z 1 :t ∣x 1 :t )=P (x 1 :t )P (z 1 :t ,x 1 :t )=P (x 1 :t )1 P (z 1 :t ,x 1 :t )=P (x 1 :t )1 P (x t ∣z 1 :t ,x 1 :t −1 )P (z 1 :t ,x 1 :t −1 )=P (x 1 :t )1 P (x t ∣z t )P (z 1 :t ,x 1 :t −1 )=P (x 1 :t )1 P (x t ∣z t )P (z t ∣z 1 :t −1 ,x 1 :t −1 )P (z 1 :t −1 ,x 1 :t −1 )=P (x 1 :t )1 P (x t ∣z t )P (z t ∣z t −1 )P (z 1 :t −1 ,x 1 :t −1 )=P (x 1 :t )1 P (x t ∣z t )P (z t ∣z t −1 )P (z 1 :t −1 ∣x 1 :t −1 )P (x 1 :t −1 )=P (x 1 :t )P (x 1 :t −1 )P (x t ∣z t )P (z t ∣z t −1 )P (z 1 :t −1 ∣x 1 :t −1 )
注意，这里的P ( x 1 : t − 1 ) P(x_{1:t-1})P (x 1 :t −1 )和P ( x 1 : t ) P(x_{1:t})P (x 1 :t )都是已知的，视为常数。

然后看分母：
由于q q q是我们任意指定的，所以我们假定q q q为以下这种形式：
q ( z 1 : t ∣ x 1 : t ) = q ( z t ∣ z 1 : t − 1 , x 1 : t ) q ( z 1 : t − 1 ∣ x 1 : t − 1 ) q(z_{1:t}|x_{1:t})=q(z_{t}|z_{1:t-1}, x_{1:t})q(z_{1:t-1}|x_{1:t-1})q (z 1 :t ∣x 1 :t )=q (z t ∣z 1 :t −1 ,x 1 :t )q (z 1 :t −1 ∣x 1 :t −1 )

综合以上，我们得到：
w t ( i ) ∝ P ( z 1 : t ∣ x 1 : t ) q ( z 1 : t ∣ x 1 : t ) ∝ P ( x t ∣ z t ) P ( z t ∣ z t − 1 ) P ( z 1 : t − 1 ∣ x 1 : t − 1 ) q ( z t ∣ z 1 : t − 1 , x 1 : t ) q ( z 1 : t − 1 ∣ x 1 : t − 1 ) = P ( x t ∣ z t ) P ( z t ∣ z t − 1 ) q ( z t ∣ z 1 : t − 1 , x 1 : t ) w t − 1 ( i ) w_t^{(i)} \varpropto \frac{P(z_{1:t}|x_{1:t})}{q(z_{1:t}|x_{1:t})} \varpropto \frac{P(x_t|z_t)P(z_t|z_{t-1})P(z_{1:t-1}|x_{1:t-1})}{q(z_{t}|z_{1:t-1}, x_{1:t})q(z_{1:t-1}|x_{1:t-1})}=\frac{P(x_t|z_t)P(z_t|z_{t-1})}{q(z_{t}|z_{1:t-1}, x_{1:t})}w_{t-1}^{(i)}w t (i )∝q (z 1 :t ∣x 1 :t )P (z 1 :t ∣x 1 :t )∝q (z t ∣z 1 :t −1 ,x 1 :t )q (z 1 :t −1 ∣x 1 :t −1 )P (x t ∣z t )P (z t ∣z t −1 )P (z 1 :t −1 ∣x 1 :t −1 )=q (z t ∣z 1 :t −1 ,x 1 :t )P (x t ∣z t )P (z t ∣z t −1 )w t −1 (i )
这样一来，就解决了从前一时刻的权重递推后一时刻权重的问题了。

基本粒子滤波算法

从上一节我们已知w t ( i ) ∝ P ( x t ∣ z t ) P ( z t ∣ z t − 1 ) q ( z t ∣ z 1 : t − 1 , x 1 : t ) w t − 1 ( i ) w_t^{(i)} \varpropto \frac{P(x_t|z_t)P(z_t|z_{t-1})}{q(z_{t}|z_{1:t-1}, x_{1:t})}w_{t-1}^{(i)}w t (i )∝q (z t ∣z 1 :t −1 ,x 1 :t )P (x t ∣z t )P (z t ∣z t −1 )w t −1 (i )，此时假设z t z_{t}z t 只和z t − 1 z_{t-1}z t −1 相关，则q ( z t ∣ z 1 : t − 1 , x 1 : t ) = q ( z t ∣ z t − 1 , x 1 : t ) q(z_{t}|z_{1:t-1}, x_{1:t})=q(z_{t}|z_{t-1}, x_{1:t})q (z t ∣z 1 :t −1 ,x 1 :t )=q (z t ∣z t −1 ,x 1 :t )。

总结来说该算法可以写成：

前提：t-1时刻的采样已经完成，则w t − 1 ( i ) w_{t-1}^{(i)}w t −1 (i )已知；
在t时刻：
for i=1: N
z t ( i ) ∼ q ( z t ∣ z t − 1 ( i ) , x 1 : t ) z_t^{(i)} \sim q(z_t|z_{t-1}^{(i)}, x_{1:t})z t (i )∼q (z t ∣z t −1 (i ),x 1 :t )
w t ( i ) ∝ P ( x t ∣ z t ( i ) ) P ( z t ( i ) ∣ z t − 1 ( i ) ) q ( z t ( i ) ∣ z t − 1 ( i ) , x 1 : t ) w t − 1 ( i ) w_t^{(i)} \varpropto \frac{P(x_t|z_t^{(i)})P(z_t^{(i)}|z_{t-1}^{(i)})}{q(z_{t}^{(i)}|z_{t-1}^{(i)}, x_{1:t})}w_{t-1}^{(i)}w t (i )∝q (z t (i )∣z t −1 (i ),x 1 :t )P (x t ∣z t (i ))P (z t (i )∣z t −1 (i ))w t −1 (i )
end
w t ( i ) w_t^{(i)}w t (i )归一化：∑ i = 1 N w t ( i ) = 1 \sum_{i=1}^Nw_t^{(i)}=1 ∑i =1 N w t (i )=1

在实际运行过程中，SIS会出现权值退化（权值衰减）问题，即在迭代过程中，w t ( i ) w_t^{(i)}w t (i )会变得越来越小，或越来越不平均。比如有100个样本，99个样本的权重都接近0，只有一个样本的权重接近1。这样的样本方差过大，不适合去逼近一个分布。这种问题是由高维空间所引起的，维数越高，需要的样本容量是呈指数级往上增的（维度灾难）。应对这个问题，通常有两个解决方法：

1、重采样
2、选择一个更好的提议分布q ( z ∣ x ) q(z|x)q (z ∣x )

这里着重讲一下第一种方法，重采样，先用一张图来解释一下：

假设共采样了三个样本，它们的权重分别为0.1，0.1，0.8，显然第三个样本的权重远远大于另外两个样本。重采样的思想实际上就是将样本的权重视为概率，即有0.1的概率会抽取到样本1和样本2，有0.8的概率会抽取到样本3。因此，在重采样后，假设重新抽取到了10个样本，那么它们的分布很大可能会如上图所示，有80%的样本属于原来的样本3，有10%的样本属于原来的样本1和样本2。新采样得到的样本的权重都是相同的（0.1）。

实际上将序列重要性采样与重采样结合起来就是基本的粒子滤波算法。

; SIR Filter

提议分布的选择与最终效果的好坏是息息相关的，一般来说，我们选择
q ( z t ∣ z 1 : t − 1 , x 1 : t ) = q ( z t ∣ z t − 1 , x 1 : t ) = P ( z t ∣ z t − 1 ) q(z_t|z_{1:t-1}, x_{1:t})=q(z_t|z_{t-1}, x_{1:t})=P(z_t|z_{t-1})q (z t ∣z 1 :t −1 ,x 1 :t )=q (z t ∣z t −1 ,x 1 :t )=P (z t ∣z t −1 )
在上一节中我们已经推导出了基本粒子滤波算法的步骤，那么可将其改进为：

z t ( i ) ∼ q ( z t ∣ z t − 1 ( i ) , x 1 : t ) = P ( z t ∣ z t − 1 ( i ) ) z_t^{(i)} \sim q(z_t|z_{t-1}^{(i)}, x_{1:t})=P(z_t|z_{t-1}^{(i)})z t (i )∼q (z t ∣z t −1 (i ),x 1 :t )=P (z t ∣z t −1 (i ))
w t ( i ) ∝ P ( x t ∣ z t ( i ) ) P ( z t ( i ) ∣ z t − 1 ( i ) ) q ( z t ( i ) ∣ z t − 1 ( i ) , x 1 : t ) w t − 1 ( i ) = P ( x t ∣ z t ( i ) ) w t − 1 ( i ) w_t^{(i)} \varpropto \frac{P(x_t|z_t^{(i)})P(z_t^{(i)}|z_{t-1}^{(i)})}{q(z_{t}^{(i)}|z_{t-1}^{(i)}, x_{1:t})}w_{t-1}^{(i)}=P(x_t|z_t^{(i)})w_{t-1}^{(i)}w t (i )∝q (z t (i )∣z t −1 (i ),x 1 :t )P (x t ∣z t (i ))P (z t (i )∣z t −1 (i ))w t −1 (i )=P (x t ∣z t (i ))w t −1 (i )

整个改进完的算法叫做Sampling importance resampling（SIR Filter），实际上就是SIS+Resampling+提议分布。

Original: https://blog.csdn.net/qq_36758914/article/details/123910958
Author: cofisher
Title: 粒子滤波（PF）原理详解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/615221/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

2022年AI指数报告

报告概述此报告是斯坦福下的一个叫HAI（以人为中心的人工智能）的一个权威机构，它会每年发布一个AI目前发展的指数报告。重点想告诉我们的内容为以下8个方面：（1）AI领域的社…

人工智能 2023年5月30日
0066
使用 CNN 进行图像分类 – 理解计算机视觉

介绍在计算机视觉中，我们有一个卷积神经网络，它非常适用于计算机视觉任务，例如图像分类、对象检测、图像分割等等。图像分类是当今时代最需要的技术之一，它被用于医疗保健、商业等…

人工智能 2023年5月25日
0090
TensorFlow和keras安装教程

准备工作 1.安装anaconda安装教程参考此博客：点这儿2.安装成功记住自己anaconda的路径，以后pycharm配置会用3.查看并记住自己conda版本号以及python…

人工智能 2023年5月23日
00116
目标检测精度评价指标

在目标检测领域中，存在着很多精度评价指标，需要根据应用场景自主的选择更合适的评价指标。有人举过一些很典型的例子：倘若某人声称创建了一个能够识别登上飞机的恐怖分子的模型，并且准…

人工智能 2023年7月11日
0074
深度学习目标检测—使用yolov5训练自己的数据集模型（Windows系统）

目录 0 前言 1、从githab上克隆yolov5代码 1.1 yolov5网络project克隆 1.2 项目代码结构的整体介绍 1.3 深度学习环境的配置和安装yolov5所…

人工智能 2023年5月26日
00120
解决：RuntimeError: CUDA out of memory. Tried to allocate 64.00 MiB (GPU 0； 4.00 GiB total capacity； 2

引发pytorch：CUDA out of memory错误的原因有两个： 1.当前要使用的GPU正在被占用，导致显存不足以运行你要运行的模型训练命令不能正常运行解决方法：1.换…

人工智能 2023年7月26日
00112
Python编程挑战赛

题1：给小朋友分糖，每人分到糖的数量不同，输入小朋友的数量，计算至少需要多少糖？思路：第1个小朋友1颗糖，第2个小朋友2颗糖，第3个小朋友3颗糖，……第n…

人工智能 2023年6月26日
0069
物联网省/国赛AIOT智能家居全流程演示

文章目录前言一、虚拟仿真部署部分 * 打开虚拟终端，配置与Home Assistant连接 – 添加 MQTT 连接重启 HA服务 Home Assistant平…

人工智能 2023年7月30日
0053
基于Tensorflow实现一个Transformer翻译器

Transformer是谷歌在2017年的一篇论文”Attention is all you need”提出的一个seq2seq的模型架构，其创造性的提出了…

人工智能 2023年5月23日
0044
朴素贝叶斯模型及案例（Python）

1 朴素贝叶斯的算法原理 2 一维特征变量下的贝叶斯模型 3 二维特征变量下的贝叶斯模型 4 n维特征变量下的贝叶斯模型 5 朴素贝叶斯模型的sklearn实现 6 案例：肿瘤预测…

人工智能 2023年6月19日
0094
2022 CCF BDCI 返乡发展人群预测 [0.9117+]

一、赛题介绍基于中国联通的大数据能力，通过使用对联通的信令数据、通话数据、互联网行为等数据进行建模，对个人是否会返乡工作进行判断 train.csv:包含全量数据集的70%（da…

人工智能 2023年7月25日
0068
特征编码1 – 特征编码概述与分类

对特征编码有助于：处理无法量化的数据便于得到更优模型以更细粒度的处理我们的数据博主在学习中觉得，特征编码既是一种优势，又是一种束缚优势在于：同样是年龄这个维度，如果是在研…

人工智能 2023年7月1日
00105
TensorFlow 对数据集标记的xml文件解析记录

环境 Windows：10 Python 3.7.10 TensorFlow：2.3 matplotlib：3.3.4 lxml：4.7.1 最近要用TensorFlow做20种水…

人工智能 2023年5月25日
0071
3D单目(mono 3D)目标检测算法综述

layout: posttitle: 3D单目(mono 3D)目标检测算法综述date: 2021-01-22 22:08:39.000000000 +09:00categori…

人工智能 2023年7月9日
0089
R统计绘图-多变量相关性散点矩阵图(GGally::ggpairs())

Stata 是一套提供其使用者数据分析、数据管理以及绘制专业图_表的完整及整合性 _统计_软件。它提供许许多多功能，包含线性混合模型、均衡重复反复及多项式普罗比模式。新版本的S…

人工智能 2023年7月16日
0078
Mac中anaconda的下载以及环境的配置

目录前言一、anaconda是什么？二、安装anaconda以及配置tensorflow环境 1.安装anaconda 2.安装tensorflow 总结前言随着对知识的…

人工智能 2023年5月25日
0099

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31