数学建模-分类模型

分类模型

1. 二分类模型-SPSS实现

1.1数据预处理

定性变量生成定量的虚拟变量

  • 步骤:SPSS->转换->创建虚变量

1.2 使用逻辑回归进行处理

  • 根据原理:两点分布(伯努利分布)

在给定x x x的情况下,考虑y y y的两点分布概率:
{ P ( y = 1 ∣ x ) = F ( x , β ) P ( y = 0 ∣ x ) = 1 − F ( x , β ) \begin{cases} P(y=1|x)=F(x,β)\ P(y=0|x)=1-F(x,β)\end{cases}{P (y =1 ∣x )=F (x ,β)P (y =0 ∣x )=1 −F (x ,β)​
F ( x , β ) F(x,β)F (x ,β)称为连接函数(link function),它将解释变量x x x和被解释变量y y y连接起来

  • 步骤:SPSS->分析->回归->二元Logistic(保存:概率、组成员)
  • 预测结果较差怎么办?(准确率较低)
  • 可在logistic回归模型中加入平方项、交互项
    • 选择变量->转换->计算变量
  • 重新进行二元Logistic,协变量里要把原来的和处理后的变量都加入
  • 但容易出现过拟合现象,变量的显著性变得很高
  • 如何确定合适的模型?
  • 交叉验证方法:
    • 把已知数据分为训练组和测试组
    • 一般设置为8:2
    • 利用训练组的数据来估计出模型,再用测试组的数据来进行测试

1.3 Fisher线性判别分析

LDA(Linear Discriminant Analysis)是一种经典的线性判别方法,又称Fisher判别分析

给定训练集样例,设法将样例投影到一维的直线上,使得同类样例的投影点尽可能接近和密集,异类投影点尽可能远离。

1.3.1SPSS实现方法

  • 步骤:分析->分类->判别式->添加分组变量(y)->定义范围(种类)->添加自变量->统计(费希尔、未标准化)->分类(摘要表)->保存(预判组成员、组成员概率)
  • 关注点:未标准化系数(线性系数ω)、分类结果

2.多分类模型

  • Fisher判别同样适用,在SPSS中修改定义范围即可
  • 逻辑回归方法:多元Logistic回归

Original: https://blog.csdn.net/weixin_44296846/article/details/123042806
Author: 路飞大魔王
Title: 数学建模-分类模型

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/697584/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球