深度学习第3章线性分类实验四 pytorch实现 Softmax回归鸢尾花分类任务下篇

2023年6月16日下午8:16 • 人工智能 • 阅读 91

3.3 实践：基于Softmax回归完成鸢尾花分类任务

在本节，我们用入门深度学习的基础实验之一”鸢尾花分类任务”来进行实践，使用经典学术数据集Iris作为训练数据，实现基于Softmax回归的鸢尾花分类任务。

实践流程主要包括以下7个步骤：数据处理、模型构建、损失函数定义、优化器构建、模型训练、模型评价和模型预测等，

数据处理：根据网络接收的数据格式，完成相应的预处理操作，保证模型正常读取；
模型构建：定义Softmax回归模型类；
训练配置：训练相关的一些配置，如：优化算法、评价指标等；
组装Runner类：Runner用于管理模型训练和测试过程；
模型训练和测试：利用Runner进行模型训练、评价和测试。

本实践的主要配置如下：

数据：Iris数据集；
模型：Softmax回归模型；
损失函数：交叉熵损失；
优化器：梯度下降法；
评价指标：准确率。

3.3.1 数据处理

3.3.1.1 数据集介绍

Iris数据集，也称为鸢尾花数据集，包含了3种鸢尾花类别（Setosa、Versicolour、Virginica），每种类别有50个样本，共计150个样本。其中每个样本中包含了4个属性：花萼长度、花萼宽度、花瓣长度以及花瓣宽度，本实验通过鸢尾花这4个属性来判断该样本的类别。

鸢尾花属性

属性1属性2属性3属性4sepal_lengthsepal_widthpetal_lengthpetal_width花萼长度花萼宽度花瓣长度花瓣宽度

鸢尾花类别

英文名中文名标签SetosaIris狗尾草鸢尾VersicolourIris杂色鸢尾VirginicaIris弗吉尼亚鸢尾

鸢尾花属性类别对应预览

sepal_lengthsepal_widthpetal_lengthpetal_widthspecies5.13.51.40.2setosa4.931.40.2setosa4.73.21.30.2setosa……………

3.3.1.2 数据清洗

1. 缺失值分析

对数据集中的缺失值或异常值等情况进行分析和处理，保证数据可以被模型正常读取。

代码实现如下：

from sklearn.datasets import load_iris
import pandas
import numpy as np

iris_features = np.array(load_iris().data, dtype=np.float32)
iris_labels = np.array(load_iris().target, dtype=np.int32)
print(pandas.isna(iris_features).sum())
print(pandas.isna(iris_labels).sum())

运行结果：

0
0

从输出结果看，鸢尾花数据集中不存在缺失值的情况。

2. 异常值处理

通过箱线图直观的显示数据分布，并观测数据中的异常值。


import matplotlib.pyplot as plt

def boxplot(features):
    feature_names = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width']

    plt.figure(figsize=(5, 5), dpi=200)

    plt.subplots_adjust(wspace=0.6)

    for i in range(4):
        plt.subplot(2, 2, i+1)

        plt.boxplot(features[:, i],
                    showmeans=True,
                    whiskerprops={"color":"#E20079", "linewidth":0.4, 'linestyle':"--"},
                    flierprops={"markersize":0.4},
                    meanprops={"markersize":1})

        plt.title(feature_names[i], fontdict={"size":5}, pad=2)

        plt.yticks(fontsize=4, rotation=90)
        plt.tick_params(pad=0.5)

        plt.xticks([])
    plt.savefig('ml-vis.pdf')
    plt.show()

boxplot(iris_features)

运行结果：

深度学习第3章线性分类实验四 pytorch实现 Softmax回归鸢尾花分类任务下篇

从输出结果看，数据中基本不存在异常值，所以不需要进行异常值处理。

3.3.1.3 数据读取

本实验中将数据集划分为了三个部分：

训练集：用于确定模型参数；
验证集：与训练集独立的样本集合，用于使用提前停止策略选择最优模型；
测试集：用于估计应用效果（没有在模型中应用过的数据，更贴近模型在真实场景应用的效果）。

在本实验中，将80 % 80\%80%的数据用于模型训练，10 % 10\%10%的数据用于模型验证，10 % 10\%10%的数据用于模型测试。

代码实现如下：


def load_data(shuffle=True):
    '''
    加载鸢尾花数据
    输入：
        - shuffle：是否打乱数据，数据类型为bool
    输出：
        - X：特征数据，shape=[150,4]
        - y：标签数据, shape=[150]
    '''

    X = np.array(load_iris().data, dtype=np.float32)
    y = np.array(load_iris().target, dtype=np.float32)

    X = torch.tensor(X)
    y = torch.tensor(y)

    X_min = torch.min(X, dim=0).values
    X_max = torch.max(X, dim=0).values
    X = (X-X_min) / (X_max-X_min)

    if shuffle:
        idx = torch.randperm(X.shape[0])
        X = X[idx]
        y = y[idx]
    return X, y

torch.manual_seed(102)

num_train = 120
num_dev = 15
num_test = 15

X, y = load_data(shuffle=True)
print("X shape: ", X.shape, "y shape: ", y.shape)
X_train, y_train = X[:num_train], y[:num_train]
X_dev, y_dev = X[num_train:num_train + num_dev], y[num_train:num_train + num_dev]
X_test, y_test = X[num_train + num_dev:], y[num_train + num_dev:]

运行结果：

X shape:  torch.Size([150, 4]) y shape:  torch.Size([150])


print("X_train shape: ", X_train.shape, "y_train shape: ", y_train.shape)

运行结果：

X_train shape:  torch.Size([120, 4]) y_train shape:  torch.Size([120])


print(y_train[:5])

运行结果：

tensor([1., 2., 0., 1., 2.])

3.3.2 模型构建

使用Softmax回归模型进行鸢尾花分类实验，将模型的输入维度定义为4，输出维度定义为3。

代码实现如下：

import op

input_dim = 4

output_dim = 3

model = op.model_SR(input_dim=input_dim, output_dim=output_dim)

3.3.3 模型训练

实例化RunnerV2类，使用训练集和验证集进行模型训练，共训练80个epoch，其中每隔10个epoch打印训练集上的指标，并且保存准确率最高的模型作为最佳模型。

代码实现如下：

import op, metric, opitimizer, RunnerV2

lr = 0.2

optimizer = opitimizer.SimpleBatchGD(init_lr=lr, model=model)

loss_fn = op.MultiCrossEntropyLoss()

metric2 = metric.accuracy

runner = RunnerV2.RunnerV2(model, optimizer, metric2, loss_fn)

runner.train([X_train, y_train], [X_dev, y_dev], num_epochs=200, log_epochs=10, save_path="best_model.pdparams")

运行结果：

best accuracy performence has been updated: 0.00000 --> 0.46667
[Train] epoch: 0, loss: 1.09861159324646, score: 0.375
[Dev] epoch: 0, loss: 1.0893398523330688, score: 0.46666666865348816
[Train] epoch: 10, loss: 0.9781171679496765, score: 0.699999988079071
[Dev] epoch: 10, loss: 1.0236393213272095, score: 0.46666666865348816
[Train] epoch: 20, loss: 0.8900946974754333, score: 0.699999988079071
[Dev] epoch: 20, loss: 0.9741119742393494, score: 0.46666666865348816
[Train] epoch: 30, loss: 0.8204634189605713, score: 0.699999988079071
[Dev] epoch: 30, loss: 0.9319687485694885, score: 0.46666666865348816
[Train] epoch: 40, loss: 0.76439368724823, score: 0.699999988079071
[Dev] epoch: 40, loss: 0.896036684513092, score: 0.46666666865348816
[Train] epoch: 50, loss: 0.7185509204864502, score: 0.7250000238418579
[Dev] epoch: 50, loss: 0.8653663396835327, score: 0.46666666865348816
[Train] epoch: 60, loss: 0.6804777979850769, score: 0.7416666746139526
[Dev] epoch: 60, loss: 0.8390589952468872, score: 0.46666666865348816
[Train] epoch: 70, loss: 0.6483750939369202, score: 0.7583333253860474
[Dev] epoch: 70, loss: 0.816339910030365, score: 0.46666666865348816
[Train] epoch: 80, loss: 0.6209224462509155, score: 0.7666666507720947
[Dev] epoch: 80, loss: 0.796570360660553, score: 0.46666666865348816
[Train] epoch: 90, loss: 0.5971452593803406, score: 0.7833333611488342
[Dev] epoch: 90, loss: 0.7792339324951172, score: 0.46666666865348816
[Train] epoch: 100, loss: 0.5763141512870789, score: 0.8166666626930237
[Dev] epoch: 100, loss: 0.7639160752296448, score: 0.46666666865348816
best accuracy performence has been updated: 0.46667 --> 0.53333
[Train] epoch: 110, loss: 0.5578767657279968, score: 0.824999988079071
[Dev] epoch: 110, loss: 0.7502836585044861, score: 0.5333333611488342
best accuracy performence has been updated: 0.53333 --> 0.60000
[Train] epoch: 120, loss: 0.5414095520973206, score: 0.824999988079071
[Dev] epoch: 120, loss: 0.7380689382553101, score: 0.6000000238418579
[Train] epoch: 130, loss: 0.5265832543373108, score: 0.8500000238418579
[Dev] epoch: 130, loss: 0.7270554304122925, score: 0.6000000238418579
[Train] epoch: 140, loss: 0.5131379961967468, score: 0.8500000238418579
[Dev] epoch: 140, loss: 0.7170670628547668, score: 0.6000000238418579
[Train] epoch: 150, loss: 0.5008670687675476, score: 0.875
[Dev] epoch: 150, loss: 0.707959771156311, score: 0.6000000238418579
best accuracy performence has been updated: 0.60000 --> 0.66667
[Train] epoch: 160, loss: 0.48960402607917786, score: 0.875
[Dev] epoch: 160, loss: 0.6996145844459534, score: 0.6666666865348816
[Train] epoch: 170, loss: 0.4792129397392273, score: 0.875
[Dev] epoch: 170, loss: 0.6919329166412354, score: 0.6666666865348816
[Train] epoch: 180, loss: 0.46958208084106445, score: 0.875
[Dev] epoch: 180, loss: 0.6848322749137878, score: 0.6000000238418579
[Train] epoch: 190, loss: 0.46061864495277405, score: 0.875
[Dev] epoch: 190, loss: 0.6782433390617371, score: 0.6000000238418579

可视化观察训练集与验证集的准确率变化情况。

import plot

plot.plot(runner,fig_name='linear-acc3.pdf')

运行结果：

3.3.4 模型评价

使用测试数据对在训练过程中保存的最佳模型进行评价，观察模型在测试集上的准确率情况。

代码实现如下：


runner.load_model('best_model.pdparams')

score, loss = runner.evaluate([X_test, y_test])
print("[Test] score/loss: {:.4f}/{:.4f}".format(score, loss))

运行结果：

[Test] score/loss: 0.7333/0.5930

3.3.5 模型预测

使用保存好的模型，对测试集中的数据进行模型预测，并取出1条数据观察模型效果。

代码实现如下：


logits = runner.predict(X_test)

pred = torch.argmax(logits[0]).numpy()
print("pred:",pred)

label = y_test[0].numpy()
print("label:",label)

print("The true category is {0} and the predicted category is {1}".format(label, pred))

运行结果：

pred: 2
label: 2.0
The true category is 2.0 and the predicted category is 2

下篇需要的包

1. op.py

import torch
import os
from activation import softmax
os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"
torch.manual_seed(10)

class Op(object):
    def __init__(self):
        pass

    def __call__(self, inputs):
        return self.forward(inputs)

    def forward(self, inputs):
        raise NotImplementedError

    def backward(self, inputs):
        raise NotImplementedError

class Linear(Op):
    def __init__(self,input_size):
"""
        输入：
           - input_size:模型要处理的数据特征向量长度
"""

        self.input_size = input_size

        self.params = {}
        self.params['w'] = torch.randn(size=[self.input_size,1],dtype=torch.float32)
        self.params['b'] = torch.zeros(size=[1],dtype=torch.float32)

    def __call__(self, X):
        return self.forward(X)

    def forward(self, X):
"""
        输入：
           - X: tensor, shape=[N,D]
           注意这里的X矩阵是由N个x向量的转置拼接成的，与原教材行向量表示方式不一致
        输出：
           - y_pred： tensor, shape=[N]
"""

        N,D = X.shape

        if self.input_size==0:
            return torch.full(size=[N,1], fill_value=self.params['b'])

        assert D==self.input_size

        y_pred = torch.matmul(X,self.params['w'])+self.params['b']

        return y_pred

class model_SR(Op):
    def __init__(self, input_dim, output_dim):
        super(model_SR, self).__init__()
        self.params = {}

        self.params['W'] = torch.zeros(size=[input_dim, output_dim])

        self.params['b'] = torch.zeros(size=[output_dim])

        self.grads = {}
        self.X = None
        self.outputs = None
        self.output_dim = output_dim

    def __call__(self, inputs):
        return self.forward(inputs)

    def forward(self, inputs):
        self.X = inputs

        score = torch.matmul(self.X, self.params['W']) + self.params['b']

        self.outputs = softmax(score)
        return self.outputs

    def backward(self, labels):
"""
        输入：
            - labels：真实标签，shape=[N, 1]，其中N为样本数量
"""

        N =labels.shape[0]
        labels = torch.nn.functional.one_hot(labels.to(torch.int64), self.output_dim)
        self.grads['W'] = -1 / N * torch.matmul(self.X.t(), (labels-self.outputs))
        self.grads['b'] = -1 / N * torch.matmul(torch.ones(size=[N]), (labels-self.outputs))

class MultiCrossEntropyLoss(Op):
    def __init__(self):
        self.predicts = None
        self.labels = None
        self.num = None

    def __call__(self, predicts, labels):
        return self.forward(predicts, labels)

    def forward(self, predicts, labels):
"""
        输入：
            - predicts：预测值，shape=[N, 1]，N为样本数量
            - labels：真实标签，shape=[N, 1]
        输出：
            - 损失值：shape=[1]
"""
        self.predicts = predicts
        self.labels = labels
        self.num = self.predicts.shape[0]
        loss = 0
        for i in range(0, self.num):
            index = self.labels[i].int()
            loss -= torch.log(self.predicts[i][index])
        return loss / self.num

2. opitimizer.py

import torch
from abc import abstractmethod

def optimizer_lsm(model, X, y, reg_lambda=0):
"""
    输入：
       - model: 模型
       - X: tensor, 特征数据，shape=[N,D]
       - y: tensor,标签数据，shape=[N]
       - reg_lambda: float, 正则化系数，默认为0
    输出：
       - model: 优化好的模型
"""

  N, D = X.shape

  x_bar_tran = torch.mean(X,dim=0).t()

  y_bar = torch.mean(y)

  x_sub = torch.subtract(X,x_bar_tran)

  if torch.all(x_sub==0):
    model.params['b'] = y_bar
    model.params['w'] = torch.zeros(size=[D])
    return model

  tmp = torch.inverse(torch.matmul(x_sub.T,x_sub)+
          reg_lambda*torch.eye(n = (D)))

  w = torch.matmul(torch.matmul(tmp,x_sub.T),(y-y_bar))

  b = y_bar-torch.matmul(x_bar_tran,w)

  model.params['b'] = b
  model.params['w'] = torch.squeeze(w,dim=-1)

  return model

class Optimizer(object):
    def __init__(self, init_lr, model):
"""
        优化器类初始化
"""

        self.init_lr = init_lr

        self.model = model

    @abstractmethod
    def step(self):
"""
        定义每次迭代如何更新参数
"""
        pass

class SimpleBatchGD(Optimizer):
    def __init__(self, init_lr, model):
        super(SimpleBatchGD, self).__init__(init_lr=init_lr, model=model)

    def step(self):

        if isinstance(self.model.params, dict):
            for key in self.model.params.keys():
                self.model.params[key] = self.model.params[key] - self.init_lr * self.model.grads[key]

3. metric.py

import torch

def accuracy(preds, labels):
"""
    输入：
        - preds：预测值，二分类时，shape=[N, 1]，N为样本数量，多分类时，shape=[N, C]，C为类别数量
        - labels：真实标签，shape=[N, 1]
    输出：
        - 准确率：shape=[1]
"""

    if preds.shape[1] == 1:

        preds = torch.as_tensor((preds >= 0.5),dtype=torch.float32)
    else:

        preds = torch.argmax(preds, dim=1).int()
    return torch.mean(torch.as_tensor((preds == labels),dtype=torch.float32))

4. RunnerV2.py

import torch

class RunnerV2(object):
    def __init__(self, model, optimizer, metric, loss_fn):
        self.model = model
        self.optimizer = optimizer
        self.loss_fn = loss_fn
        self.metric = metric

        self.train_scores = []
        self.dev_scores = []

        self.train_loss = []
        self.dev_loss = []

    def train(self, train_set, dev_set, **kwargs):

        num_epochs = kwargs.get("num_epochs", 0)

        log_epochs = kwargs.get("log_epochs", 100)

        save_path = kwargs.get("save_path", "best_model.pdparams")

        print_grads = kwargs.get("print_grads", None)

        best_score = 0

        for epoch in range(num_epochs):
            X, y = train_set

            logits = self.model(X)

            trn_loss = self.loss_fn(logits, y).item()
            self.train_loss.append(trn_loss)

            trn_score = self.metric(logits, y).item()
            self.train_scores.append(trn_score)

            self.model.backward(y)
            if print_grads is not None:

                print_grads(self.model)

            self.optimizer.step()
            dev_score, dev_loss = self.evaluate(dev_set)

            if dev_score > best_score:
                self.save_model(save_path)
                print(f"best accuracy performence has been updated: {best_score:.5f} --> {dev_score:.5f}")
                best_score = dev_score
            if epoch % log_epochs == 0:
                print(f"[Train] epoch: {epoch}, loss: {trn_loss}, score: {trn_score}")
                print(f"[Dev] epoch: {epoch}, loss: {dev_loss}, score: {dev_score}")

    def evaluate(self, data_set):
        X, y = data_set

        logits = self.model(X)

        loss = self.loss_fn(logits, y).item()
        self.dev_loss.append(loss)

        score = self.metric(logits, y).item()
        self.dev_scores.append(score)
        return score, loss

    def predict(self, X):
        return self.model(X)

    def save_model(self, save_path):
        torch.save(self.model.params, save_path)

    def load_model(self, model_path):
        self.model.params = torch.load(model_path)

5. activation.py

import torch

def softmax(X):
"""
    输入：
        - X：shape=[N, C]，N为向量数量，C为向量维度
"""
    x_max = torch.max(X, axis=1, keepdim=True).values
    x_exp = torch.exp(X - x_max)
    partition = torch.sum(x_exp, axis=1, keepdim=True)
    return x_exp / partition

6. 该篇所有代码


from sklearn.datasets import load_iris
import pandas
import numpy as np
import torch
import op, metric, opitimizer, RunnerV2

iris_features = np.array(load_iris().data, dtype=np.float32)
iris_labels = np.array(load_iris().target, dtype=np.int32)
print(pandas.isna(iris_features).sum())
print(pandas.isna(iris_labels).sum())

import matplotlib.pyplot as plt

def boxplot(features):
    feature_names = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width']

    plt.figure(figsize=(5, 5), dpi=200)

    plt.subplots_adjust(wspace=0.6)

    for i in range(4):
        plt.subplot(2, 2, i+1)

        plt.boxplot(features[:, i],
                    showmeans=True,
                    whiskerprops={"color":"#E20079", "linewidth":0.4, 'linestyle':"--"},
                    flierprops={"markersize":0.4},
                    meanprops={"markersize":1})

        plt.title(feature_names[i], fontdict={"size":5}, pad=2)

        plt.yticks(fontsize=4, rotation=90)
        plt.tick_params(pad=0.5)

        plt.xticks([])
    plt.savefig('ml-vis.pdf')
    plt.show()

boxplot(iris_features)

def load_data(shuffle=True):
    '''
    加载鸢尾花数据
    输入：
        - shuffle：是否打乱数据，数据类型为bool
    输出：
        - X：特征数据，shape=[150,4]
        - y：标签数据, shape=[150]
    '''

    X = np.array(load_iris().data, dtype=np.float32)
    y = np.array(load_iris().target, dtype=np.float32)

    X = torch.tensor(X)
    y = torch.tensor(y)

    X_min = torch.min(X, dim=0).values
    X_max = torch.max(X, dim=0).values
    X = (X-X_min) / (X_max-X_min)

    if shuffle:
        idx = torch.randperm(X.shape[0])
        X = X[idx]
        y = y[idx]
    return X, y

torch.manual_seed(102)

num_train = 120
num_dev = 15
num_test = 15

X, y = load_data(shuffle=True)
print("X shape: ", X.shape, "y shape: ", y.shape)
X_train, y_train = X[:num_train], y[:num_train]
X_dev, y_dev = X[num_train:num_train + num_dev], y[num_train:num_train + num_dev]
X_test, y_test = X[num_train + num_dev:], y[num_train + num_dev:]

print("X_train shape: ", X_train.shape, "y_train shape: ", y_train.shape)

print(y_train[:5])

input_dim = 4

output_dim = 3

model = op.model_SR(input_dim=input_dim, output_dim=output_dim)

lr = 0.2

optimizer = opitimizer.SimpleBatchGD(init_lr=lr, model=model)

loss_fn = op.MultiCrossEntropyLoss()

metric2 = metric.accuracy

runner = RunnerV2.RunnerV2(model, optimizer, metric2, loss_fn)

runner.train([X_train, y_train], [X_dev, y_dev], num_epochs=200, log_epochs=10, save_path="best_model.pdparams")

import plot

plot.plot(runner,fig_name='linear-acc3.pdf')

runner.load_model('best_model.pdparams')

score, loss = runner.evaluate([X_test, y_test])
print("[Test] score/loss: {:.4f}/{:.4f}".format(score, loss))

logits = runner.predict(X_test)

pred = torch.argmax(logits[0]).numpy()
print("pred:",pred)

label = y_test[0].numpy()
print("label:",label)

print("The true category is {0} and the predicted category is {1}".format(label, pred))

习题

尝试调整学习率和训练轮数等超参数，观察是否能够得到更高的精度

学习率

首先，我们看一下学习率的影响，这里我们循环一下（为了方便观察，内部代码有些许更改）：


lr2 = 0.2
for i in range(8):
    lr = lr2 * i

    optimizer = opitimizer.SimpleBatchGD(init_lr=lr, model=model)

    loss_fn = op.MultiCrossEntropyLoss()

    metric2 = metric.accuracy

    runner = RunnerV2.RunnerV2(model, optimizer, metric2, loss_fn)

    runner.train([X_train, y_train], [X_dev, y_dev], num_epochs=200, log_epochs=10, save_path="best_model.pdparams")

    plot.plot(runner,fig_name='linear-accx.pdf',x = lr)

    runner.load_model('best_model.pdparams')

    score, loss = runner.evaluate([X_test, y_test])
    print("[Test] score/loss: {:.4f}/{:.4f}".format(score, loss))

运行结果（lr为学习率）：

[Test] score/loss: 0.2000/1.0986

[Test] score/loss: 0.7333/0.5930

[Test] score/loss: 0.8667/0.4474

[Test] score/loss: 0.8667/0.4465

[Test] score/loss: 0.8667/0.4452

[Test] score/loss: 0.9333/0.3147

[Test] score/loss: 0.9333/0.3142

[Test] score/loss: 0.9333/0.3137

通过调节学习率，我们发现，学习率过低和过高都会造成训练模型变差，当训练模型没有达到预取效果时，我们可以通过调整学习率来改变训练模型，让其向着预期效果学习

训练轮数

下面，我们来调节一下训练轮数：


lr = 0.2
num_epochs2 = 200
for i in range(1,8):
    num_epochs = num_epochs2 * i

    optimizer = opitimizer.SimpleBatchGD(init_lr=lr, model=model)

    loss_fn = op.MultiCrossEntropyLoss()

    metric2 = metric.accuracy

    runner = RunnerV2.RunnerV2(model, optimizer, metric2, loss_fn)

    runner.train([X_train, y_train], [X_dev, y_dev], num_epochs=num_epochs, log_epochs=10, save_path="best_model.pdparams")

    plot.plot(runner,fig_name='linear-accx.pdf',x = num_epochs)

    runner.load_model('best_model.pdparams')

    score, loss = runner.evaluate([X_test, y_test])
    print("[Test] score/loss: {:.4f}/{:.4f}".format(score, loss))

运行结果：

[Test] score/loss: 0.9333/0.3125

[Test] score/loss: 0.8667/0.4478

[Test] score/loss: 0.8667/0.4475

[Test] score/loss: 0.8667/0.4472

[Test] score/loss: 0.9333/0.3150

[Test] score/loss: 0.9333/0.3149

[Test] score/loss: 0.9333/0.3149

通过调整训练轮数我们发现，当训练轮数少时，误差较大；当训练轮数过多时，误差为0，过拟合了。当我们训练模型差时，可以提高训练轮数；当我们训练模型太好的时候，我们有可能过拟合了。

注：训练轮数的调节不要从0开始

总结

通过该章的学习，我学会使用Softmax回归和Logistic回归的使用，和实践的应用，了解了训练轮数和学习率对训练模型的影响。加深了实践过程步骤，也更加深刻的了解了深度学习的过程。

内容太多了，如果太多了，可能会没有耐心看完，而且查找也不是很方便。
这里我分成了上中下三篇，分别为基于Logistic回归的二分类任务（上篇），基于Softmax回归的多分类任务（中篇），实践：基于Softmax回归完成鸢尾花分类任务（下篇）。

上篇：深度学习第3章线性分类实验四 pytorch实现 Logistic回归上篇
中篇：深度学习第3章线性分类实验四 pytorch实现 Softmax回归中篇

创作不易，如果对你有帮助，求求你给我个赞！！！
点赞 + 收藏 + 关注！！！
如有错误与建议，望告知！！！（将于下篇文章更正）
请多多关注我！！！谢谢！！！

Original: https://blog.csdn.net/weixin_51395608/article/details/126963818
Author: 岳轩子
Title: 深度学习第3章线性分类实验四 pytorch实现 Softmax回归鸢尾花分类任务下篇

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/626402/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

[人工智能-深度学习-44]：开发环境 – Anaconda的目录结构与SourceInsight工程

作者主页(文火冰糖的硅基工坊)：文火冰糖（王文兵）的博客_文火冰糖的硅基工坊_CSDN博客本文网址：https://blog.csdn.net/HiWangWenBing/art…

人工智能 2023年5月25日
0075
Mplus数据分析：分段潜增长模型，看jama如何玩转纵向数据的轨迹

今天给大家介绍分段潜增长模型的原理和做法，之前我有给大家写增长混合和潜增长，它们的主要的局限在于轨迹都是连续的不能分段，在于对phasic的现象把握其实还是不够的，比如儿童认知的…

人工智能 2023年7月16日
0068
nvidia-docker安装教程

nvidia-docker安装 Nvidia-Docker安装需要安装两个部分， Docker-CE和 NVIDIA Container Toolkit。 1. 安装Dokcer-…

人工智能 2023年6月17日
0072
基于Debian搭建Hyperledger Fabric 2.4开发环境及运行简单案例

前言在基于truffle框架实现以太坊公开拍卖智能合约中我们已经实现了以太坊智能合约的编写及部署，但其工作方式注定其只能应用于有限的业务场景中。相比之下，基于超级账本的 Fabr…

人工智能 2023年6月4日
0098
SVM ValueError: y should be a 1d array, got an array of shape (1, 250) instead. Found input variable

阅读前请看一下：我是一个热衷于记录的人，每次写博客会反复研读，尽量不断提升博客质量。文章设置为仅粉丝可见，是因为写博客确实花了不少精力。希望互相进步谢谢！！文章目录阅读前请看一…

人工智能 2023年7月31日
0083
【SLAM】ORB-SLAM3解析——综述(1)

之前学习VINS和LIO-SAM的时候都是代码流，不是很重视看论文，现在有空学ORB-SLAM3了，这一次，先看一下论文。考虑到边上班边学，更新的会比较慢。看完论文之后，对这个系统…

人工智能 2023年6月1日
0088
【数据分析上手实践】读取数据

2022/3/15 1.导入两个库 Numpy计算 Pandas 开源用于数据分析的工具 Import numpy as np Import pandas as pd import…

人工智能 2023年7月6日
0058
Day32——122.买卖股票的最佳时机II 55. 跳跃游戏 45.跳跃游戏II +第二天复习

赶上进度，冲冲冲一、买卖股票的最佳时机II 二、跳跃游戏解题思路：三、跳跃游戏|| 生命能与世俗相契合，才能不朽，生命的整体是象征的，因为他是有意义的. ——《日瓦戈医生》 …

人工智能 2023年6月30日
0074
中国五大知名的食品与餐饮调查研究咨询公司

1 、慧聪研究（HCR ）慧聪研究是一家根植于中国、放眼全球，提供大数据与小数据有效结合的洞察研究公司。HCR为企业提供大小数据结合的深度洞察服务。企业的数据既有来自于互联网和移…

人工智能 2023年7月17日
0081
随机森林实战（分类任务+特征重要性+回归任务）（含Python代码详解）

1. 随机森林-分类任务我们使用随机森林完成鸢尾花分类任务：第一步，导入我们可能需要的包： from sklearn.datasets import load_iris fro…

人工智能 2023年6月30日
0074
# 一点毕设的小感悟（词频统计+可视化分析）

写在前面今天早晨编毕设的时候，想先用 ROST CM6利用语义网络分析简单对旅游形象进行一个感知。看了好几篇文献在做语义网络图前都提到了关键词词频统计分析，虽然ROST软件自带…

人工智能 2023年5月31日
0069
数据分析思维

在工作中当我们遇到难题时，首先我们需要知道，比如问题诊断、识别机会，规避风险等。这是WHY。那分析什么？比如战略分析，用户偏好分析，STP分析，品牌建设分析，营销组合分析，客户画…

人工智能 2023年6月11日
0060
基于bert的情感分类

1.首先什么是bert情感分类在这个ppt中，我们将使用预先训练好的深度学习模型来处理一些文本。然后，我们将使用该模型的输出对文本进行分类。绿色方框内是电影评论中的句子列表。我们…

人工智能 2023年5月28日
0099
CosineAnnealingLR（余弦退火调整学习率）

这是一种学习率的调整方式公式其中：nt：当前学习率。nmin：学习率最小值。nmax：学习率最大值。Tcur：当前epoch。Tmax：最大epoch。 ; 解释 cos(x)…

人工智能 2023年6月16日
0065
保姆级OpenCV 修改源码详细教程：基于hpp文件，修改SURF算子（支持打断点、调试、debug）

目录 0.前置步骤 1.修改源码的目的预设目标修改源码的解决思路摸索过程踩坑记录修改宏定义报错1：报错2：最终运行结果补充：尝试增加代码逻辑总结参考链接…

人工智能 2023年6月18日
0078
丢弃Excel，Pandas一行搞定

之前介绍了 pandas的多条件筛选，这些都是一些数据处理的必要技能，也不贪多，咱们每次学习一点。这次咱们说说 pandas的两个表的连接技能 merge，也就是根据一个表的条件…

人工智能 2023年7月8日
0045

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

深度学习 第3章线性分类 实验四 pytorch实现 Softmax回归 鸢尾花分类任务 下篇

目录：

3.3 实践：基于Softmax回归完成鸢尾花分类任务

3.3.1 数据处理

3.3.1.1 数据集介绍

3.3.1.2 数据清洗

1. 缺失值分析

2. 异常值处理

3.3.1.3 数据读取

3.3.2 模型构建

3.3.3 模型训练

3.3.4 模型评价

3.3.5 模型预测

下篇需要的包

1. op.py

2. opitimizer.py

3. metric.py

4. RunnerV2.py

5. activation.py

6. 该篇所有代码

习题

尝试调整学习率和训练轮数等超参数，观察是否能够得到更高的精度

学习率

训练轮数

总结

大家都在看

深度学习第3章线性分类实验四 pytorch实现 Softmax回归鸢尾花分类任务下篇