LM算法探讨(附python代码)

2023年6月14日上午12:42 • Linux • 阅读 142

1. 案例分析

考虑如下公式：

[\gamma_i=\frac{2\pi}{\lambda}\times 2 \sqrt{(x_i-x_p)^2+(y_i-y_p)^2+(z_i-z_p)^2}\tag{1.1} ]

其中(\gamma_i)会随(x_i)、(y_i)、(z_i)而改变。即我们可以将((x_i,y_i,z_i))视为自变量，(\gamma_i)为因变量。而(\lambda)与((x_p,y_p,z_p))为常数。

现在通过测量，我们得出了 n组([x_i,y_i,z_i,\lambda_i]) 的值，并且(\lambda)已知，我们需要 求解常数组((x_p,y_p,z_p))。
我们可以将问题转化为如下的最小二乘拟合：

[min\sum_{i=1}^{n} (\frac{2\pi}{\lambda}\times 2 \sqrt{(x_i-x_p)^2+(y_i-y_p)^2+(z_i-z_p)^2}-\gamma_i)^2\tag{1.2} ]

且当上式越接近于零，拟合值越好。

2.算法引入

上述问题所描述的内容，我们称之为 最优化问题。即我们希望找到最优的一组((x_p,y_p,z_p))使得式(1.2)尽可能趋近于0。解决最优化问题的算法有很多。小到梯度下降算法，大到粒子群算法等。这里我们从梯度下降算法引入，主要讲解LM算法。

2.1 梯度下降算法

梯度下降算法的核心思路是迭代。即从某一个初始值开始，沿特定的方向，逐步寻找最优解。梯度下降算法有几个核心要点，即初始点，学习率（步长），精度判断条件（何时停止）。梯度下降算法可以参考这篇文章。

优点：简单。缺点：负梯度方向，收敛速度慢。

2.2 Newton 法

Newton法与梯度下降算法类似，但不同的是，梯度下降算法相当于保留了泰勒级数的一阶项（梯度），而Newton法保留泰勒级数一阶和二阶项，拥有二次收敛速度。Newton法涉及到Hessian矩阵,其迭代思路如下：

优点：理论上比梯度下降法快。缺点：每步都计算Hessian矩阵，复杂（矩阵求逆计算量大）。

2.3 高斯牛顿法

与牛顿法类似，但采用(H=J^TJ)对牛顿法中的海塞矩阵(H(x_k))进行近似，从而简化了计算量。

高斯牛顿法的算法流程：

高斯牛顿法的缺点(参考)：

(JJ^{T})只有半正定的性质，在计算((JJ^{T})^{-1})的过程中，如果(JJ^{T})为奇异矩阵或病态矩阵可能导致增量不稳定甚至算法不收敛。

2.4 L-M算法（Levenberg–Marquardt方法）

L-M算法引入了信赖域。将优化问题从无约束的最小二乘问题变成了有约束的最小二乘问题。
可以简单地理解为： 迭代前期使用梯度下降法，迭代后期使用高斯牛顿法。结合前面讲到的奇异或病态的问题，LM算法的核心用信赖域限制病态的发生。

其算法流程为（参考）：

有关Levenberg–Marquardt方法的详细使用可以参考这篇IEEE论文。

3. python编程实现

（还是matlab方便 /doge/ ）

#!/usr/bin/env python3
-*- coding: utf-8 -*-

import numpy as np
from numpy import matrix as mat
import math

导入数据
Label_location = [0.9, 1.2, 2.0]
theta_data = [60.31857894892403, 48.25486315913922, 80.4247719318987, 80.4247719318987]
lambda_data = [0.3125, 0.3125, 0.3125, 0.3125]
xi_data = [0.0, 0.9, 2.5, 0.9]
yi_data = [0.0, 0.0, 0.0, 0.0]
zi_data = [2.0, 2.0, 2.0, 0.4]
合并为一个矩阵，然后转置,每一行为一组λ，xi,yi,zi。
Variable_Matrix = mat([lambda_data, xi_data, yi_data, zi_data]).T

def Func(parameter, iput):  # 需要拟合的函数，abc是包含三个参数的一个矩阵[[a],[b],[c]]
    x = parameter[0, 0]
    y = parameter[1, 0]
    z = parameter[2, 0]
    residual = mat((4*np.pi / iput[0, 0])*np.sqrt(np.square(iput[0, 1]-x)+np.square(iput[0, 2]-y)+np.square(iput[0, 3]-z)))
    return residual

def Deriv(parameter, iput):  # 对函数求偏导
    x = parameter[0, 0]
    y = parameter[1, 0]
    z = parameter[2, 0]
    x_deriv = -4*np.pi*(iput[0, 1]-x) / (iput[0, 0] * np.sqrt(np.square(iput[0, 1]-x)+np.square(iput[0, 2]-y) + np.square(iput[0, 3]-z)))
    y_deriv = -4*np.pi*(iput[0, 2]-y) / (iput[0, 0] * np.sqrt(np.square(iput[0, 1]-x)+np.square(iput[0, 2]-y) + np.square(iput[0, 3]-z)))
    z_deriv = -4*np.pi*(iput[0, 3]-z) / (iput[0, 0] * np.sqrt(np.square(iput[0, 1]-x)+np.square(iput[0, 2]-y) + np.square(iput[0, 3]-z)))
    deriv_matrix = mat([x_deriv, y_deriv, z_deriv])
    return deriv_matrix

n = len(theta_data)
J = mat(np.zeros((n, 3)))  # 雅克比矩阵
fx = mat(np.zeros((n, 1)))  # f(x)  3*1  误差
fx_tmp = mat(np.zeros((n, 1)))
initialization_parameters = mat([[10], [400], [30]])  # 参数初始化
lase_mse = 0.0
step = 0.0
u, v = 1.0, 2.0
conve = 100

while conve:
    mse, mse_tmp = 0.0, 0.0
    step += 1
    for i in range(len(theta_data)):
        fx[i] = Func(initialization_parameters, Variable_Matrix[i]) - theta_data[i]  # 注意不能写成  y - Func  ,否则发散
        # print(fx[i])
        mse += fx[i, 0] ** 2
        J[i] = Deriv(initialization_parameters, Variable_Matrix[i])  # 数值求导
    mse = mse/n  # 范围约束
    H = J.T * J + u * np.eye(3)  # 3*3
    dx = -H.I * J.T * fx  # 注意这里有一个负号，和fx = Func - y的符号要对应

    initial_parameters_tmp = initialization_parameters.copy()
    initial_parameters_tmp = initial_parameters_tmp + dx
    for j in range(len(theta_data)):
        fx_tmp[j] = Func(initial_parameters_tmp, Variable_Matrix[j]) - theta_data[j]
        mse_tmp += fx_tmp[j, 0] ** 2
    mse_tmp = mse_tmp/n

    q = (mse - mse_tmp) / ((0.5 * dx.T * (u * dx - J.T * fx))[0, 0])
    print(q)
    if q > 0:
        s = 1.0 / 3.0
        v = 2
        mse = mse_tmp
        initialization_parameters = initial_parameters_tmp
        temp = 1 - pow(2 * q - 1, 3)
        if s > temp:
            u = u * s
        else:
            u = u * temp
    else:
        u = u * v
        v = 2 * v
        mse = mse_tmp
        initialization_parameters = initial_parameters_tmp
    print("step = %d,parameters(mse-lase_mse) = " % step, abs(mse - lase_mse))
    if abs(mse - lase_mse) < math.pow(0.1, 14):
        break
    lase_mse = mse  # 记录上一个 mse 的位置
    conve -= 1
print(lase_mse)
print(initialization_parameters)

代码仅供参考，建议结合上面的L-M算法流程来看。（部分命名不规范还望谅解）
说明：代码中给定的四组参数本来就是用来验算的，其结果应该为[[0.9],[1.2],[2. ]]。而最终运算的结果也为：

也检验了算法的可行性。

Original: https://www.cnblogs.com/litecdows/p/Levenberg_Marquardt.html
Author: litecdows
Title: LM算法探讨(附python代码)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/609719/

转载文章受原作者版权保护。转载请注明原作者出处！

Linux

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

并查集详解图解引入到实现｜ Disjoint Sets details, intro to implementation with figures.

Introduction of Disjoint Sets It’s easy to tell whether someone you know is your rel…

Linux 2023年6月13日
0097
DML

用来对数据库中的表的数据进行增删改添加数据给指定列添加数据 insert into <表名> (列名1, &#x…

Linux 2023年6月7日
0083
Markdown 常用语法精讲

标题 (# 跟标题名称一定要留空格) 一级标题二级标题三级标题四级标题五级标题六级标题缩进 (使用) 这是缩进四个空格文本 (源码：这是缩进四个空格文本) 强调/加粗…

Linux 2023年6月7日
00117
redis实战

转载于:https://blog.csdn.net/piaoslowly/article/details/81563579 redis简介 Redis 是一个开源的使用 ANSI…

Linux 2023年5月28日
0089
docker网络模型

[root@iZuf620p8rsr3faul3zsx6Z ~]# docker network –help Usage: docker network COMMAND Mana…

Linux 2023年6月13日
00110
Java基础之接口篇

Overload和Override的区别？重载Overload：表示同⼀个类中可以有多个名称相同的⽅法，但这些⽅法的参数列表各不相同，参数个数或类型不同重写Override：表…

Linux 2023年6月7日
0081
输入输出函数

IDLE name=input(‘输入’) print(name) print函数 print(1,2) print(1,2,sep=",") input函数 …

Linux 2023年6月8日
0073
C++的回调函数

一、简介本文主要介绍C++中如何使用回调函数。二、回调函数介绍回调函数主要在”回”字，和正常的函数调用方式不太一样。正常的函数由开发者自己定义返回类型…

Linux 2023年6月7日
0086
云主机搭建WordPress个人博客

安装宝塔控制面板宝塔面板是一个简单、好用的面板，它的功能就是将LNMP和服务器的各种管理集成到一个可视化的WEB环境来管理，通过面板，我们普通人不需要掌握具体的技术，只需要动动鼠…

Linux 2023年6月8日
0091
Linux磁盘管理

对Linux来说一切皆文件，Linux归根结底只有一个根目录，一个独立且唯一的文件结构，Linux的每个分区都是用来组成整个文件系统的一部分。所以Linux采用了磁盘挂载的方式，将…

Linux 2023年6月8日
0097
django_响应对象

Django_响应对象响应对象响应对象有三种形式：HttpResponse()render()Redirect() （1） HttpResponse（） django服务器接收…

Linux 2023年6月7日
0099
phpweb成品网站最新版(注入、上传、写shell)

注入：之所以鸡肋就是该漏洞利用安装文件重新生成配置文件写入可执行代码鸡肋1：具有破坏性动作非常大重新写了配置文件数据库连接文件鸡肋2：有一定安全常识的站长都会删掉…

Linux 2023年5月28日
0076
Shell grep 命令扩展增强

背景：线上排查问题需要找出有某个特征的日志，并获取这些日志的完整调用日志链路。比如, 通过某个tag 获取到了这些日志的请求id 【Span ID】，然后还需要再一步取得所…

Linux 2023年5月28日
0084
WPF 应用启动过程同时启动多个 UI 线程且访问 ContentPresenter 可能让多个 UI 线程互等

在应用启动过程里，除了主 UI 线程之外，如果还多启动了新的 UI 线程，且此新的 UI 线程碰到 ContentPresenter 类型，那么将可能存在让新的 UI 线程和主 U…

Linux 2023年6月6日
0082
Apache Bench压力测试使用方法

Apache Bench是Apache轻量级压力测试工具，使用方便，简单，本文章简单介绍Windows平台使用Apache bench进行接口压力测试（ab测试） ApacheBe…

Linux 2023年6月8日
0090
使用VScode创建第一个vue项目

初识vue，小小白一枚软件，插件安装，略… 插件：vetur（支持vue代码高亮）、ESLint（js语法纠错）、Auto Close Tag（自动闭合标签）、Aut…

Linux 2023年6月7日
0091

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30