pytorch 神经网络套路使用Dataset,DataLoader实现多维输入特征的二分类

2023年7月2日下午5:21 • 人工智能 • 阅读 106

1.数据集：

传送门：内含刘老师讲课视频PPT及相关数据集，本文所用数据集名为diabetes.cvs.gz

链接：https://pan.baidu.com/s/1vZ27gKp8Pl-qICn_p2PaSw
提取码：cxe4

pytorch 神经网络套路使用Dataset,DataLoader实现多维输入特征的二分类

其中，x1，，，x8表示不同特征，y表示分类。

2.模型：

刘老师视频中采用以上模型，本文线性层输出特征改为4，2，1，其他保持不变。

loss:BCELoss

optimizer:SGD

3.python代码：

本文采用pytorch定义的Dataset,DataLoader,以Minibatch的风格加载数据集

import numpy as np
import torch
from torch import nn
from torch.nn import Linear, BCELoss
from torch.optim import SGD
import matplotlib.pyplot as plt

&#x51C6;&#x5907;DataSet,DataLoader
from torch.utils.data import Dataset, DataLoader

&#x6570;&#x636E;&#x96C6;&#x8DEF;&#x5F84;&#x540D;
path = "diabetes.csv.gz"

&#x6570;&#x636E;&#x96C6;&#x7C7B;
class dataset(Dataset):
    def __init__(self, path):
        # &#x56E0;&#x4E3A;&#x6570;&#x636E;&#x96C6;&#x8F83;&#x5C0F;&#xFF0C;&#x76F4;&#x63A5;&#x52A0;&#x8F7D;&#x5728;&#x5185;&#x5B58;&#x91CC;
        xy = np.loadtxt(path, delimiter=',', dtype=np.float32)
        self.length = xy.shape[0]
        self.x_data = torch.from_numpy(xy[:, :-1])
        self.y_data = torch.from_numpy(xy[:, [-1]])

    def __getitem__(self, item):
        return self.x_data[item], self.y_data[item]

    def __len__(self):
        return self.length

&#x6570;&#x636E;&#x96C6;&#x7C7B;&#x5B9E;&#x4F8B;&#x5316;
my_dataset = dataset(path)

train_loader = DataLoader(my_dataset, batch_size=10, shuffle=True)

&#x5EFA;&#x7ACB;&#x6A21;&#x578B;&#xFF0C;3&#x4E2A;&#x7EBF;&#x6027;&#x5C42;&#xFF0C;3&#x4E2A;sigmoid&#x975E;&#x7EBF;&#x6027;&#x6FC0;&#x6D3B;&#x51FD;&#x6570;
class model(nn.Module):
    def __init__(self):
        super(model, self).__init__()
        self.linear1 = Linear(8, 4, bias=True)
        self.linear2 = Linear(4, 2, bias=True)
        self.linear3 = Linear(2, 1, bias=True)

    def forward(self, x):
        x = torch.sigmoid(self.linear1(x))
        x = torch.sigmoid(self.linear2(x))
        x = torch.sigmoid(self.linear3(x))
        return x

&#x7C7B;&#x5B9E;&#x4F8B;&#x5316;
my_model = model()

&#x4E8C;&#x5206;&#x7C7B;&#x95EE;&#x9898;&#xFF0C;&#x7EE7;&#x7EED;&#x91C7;&#x7528;BCELoss
loss_cal = BCELoss(size_average=True)

&#x968F;&#x673A;&#x68AF;&#x5EA6;&#x4E0B;&#x964D;
optimizer = SGD(my_model.parameters(), lr=0.01)

&#x7A7A;&#x5217;&#x8868;
epoch_list = []
loss_list = []

for epoch in range(100000):
    for data in train_loader:
        x, y = data
        epoch_list.append(epoch)
        # &#x524D;&#x5411;&#x8BA1;&#x7B97;
        y_pred = my_model(x)
        loss = loss_cal(y_pred, y)
        loss_list.append(loss.item())
        # &#x68AF;&#x5EA6;&#x6E05;&#x96F6;
        optimizer.zero_grad()
        # &#x53CD;&#x5411;&#x4F20;&#x64AD;
        loss.backward()
        # &#x53C2;&#x6570;&#x8C03;&#x6574;
        optimizer.step()

&#x753B;&#x51FA;loss&#x968F;epoch&#x53D8;&#x5316;&#x66F2;&#x7EBF;&#x56FE;
plt.figure()
plt.plot(epoch_list, loss_list)
plt.xlabel("epoch")
plt.ylabel("loss")
plt.show()

import torch
import numpy as np
from torch import nn
from torch.nn import Module

x_arr=np.squeeze(np.array([np.random.rand(10,1) for i in range(10)]),2)
y_arr=np.array([[np.random.randint(0,2)] for i in range(10)])

x_list_tensor=torch.from_numpy(x_arr).float()
y_list_tensor=torch.from_numpy(y_arr).float()

class model(Module):
 def __init__(self):
  super(model,self).__init__()
  self.linear=nn.Linear(10,1)

 def forward(self,x):
  x=self.linear(x)
  x=torch.sigmoid(x)
  return x

my_model=model()

optimizer=torch.optim.SGD(my_model.parameters(),lr=1e-3,momentum=0.08,weight_decay=0.001)

criterition=torch.nn.BCELoss(size_average=True)

for i in range(1000):
 my_model.train()
 for x,y in zip(x_list_tensor,y_list_tensor):
  y_pred=my_model(x)
  print(x,y,y_pred)
  loss=criterition(y_pred,y)

  optimizer.zero_grad()
  loss.backward()
  optimizer.step()

  print(my_model.linear.weight.data)

4.可视化结果：

随着epoch增加，loss逐渐减小并收敛。

5.以上均为个人学习pytorch基础入门中的基础，浅做记录，如有错误，请各位大佬批评指正！

6.关于问题描述和原理的部分图片参考刘老师的视频课件，本文也是课后作业的一部分，特此附上视频链接，《PyTorch深度学习实践》完结合集_哔哩哔哩_bilibili，希望大家都有所进步！

Original: https://blog.csdn.net/kids_budong_c/article/details/123195213
Author: Newjet666
Title: pytorch 神经网络套路使用Dataset,DataLoader实现多维输入特征的二分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/665882/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

K-Means聚类算法—C++

1.Introduction K-Means算法是无监督的聚类算法，它实现起来比较简单，聚类效果也不错，因此应用很广泛。K-Means算法有大量的变体，本文就从最传统的K-Mean…

人工智能 2023年5月31日
00126
SSD（pytorch）自建数据集训练及测试

一、数据集准备 SSD代码：GitHub – amdegroot/ssd.pytorch: A PyTorch Implementation of Single Sho…

人工智能 2023年7月23日
0095
Self-Attention详解

文章目录 Sequence数据的处理 * Sequence Labeling（输入和输出的大小一样） Self-Attention内部机理 * 如何求解b？ Multi-head …

人工智能 2023年7月27日
0055
Python3 DataFrame缺失值的处理

在通过Pandas做数据分析时，数据中往往会因为一些原因而出现缺失值NaN (Nota number)o比如前文中的例子，当两个DataFrame对象进行简单运算时，无法匹配的位置…

人工智能 2023年7月15日
0087
ResNet与Densenet之间的关系以及区别

一、ResNet和DenseNet的之间的关系以及区别，如参数量和训练速度。简单介绍下ResNet以及DenseNet ResNet的最大的贡献是缓解深层的神经网络训练中的梯度消…

人工智能 2023年7月12日
0066
Spark性能调优案例-多表join优化，减少shuffle

背景 A任务在凌晨1点到3点，平均耗时1h,且是核心公共任务，急需优化。整体逻辑示意图： DROP TABLE IF EXISTS temp.tmp_xx_$date_1; CRE…

人工智能 2023年6月29日
0095
回归的误差服从正态分布吗_细说回归分析

什么是回归我们先来聊聊历史，从回归这个词被发明的源头聊起。话说有一个叫高尔顿的生物学家兼统计学家在研究人类遗传问题时发现了一个现象：非常高的父亲，其儿子的身高往往要比父亲矮一点，…

人工智能 2023年6月18日
00115
yolo系列的head模块

YOLO系列中的Head侧主要包含了 Head检测头，损失函数部分以及Head侧的优化策略。 1.yolov1的head 将1470reshape成7730，其中1130表示： L…

人工智能 2023年6月17日
0084
cnn模型训练——从环境搭建到模型部署

一、准备python环境以Windows平台为例： 1.安装python3 直接默认安装，并且添加到PATH。安装完毕后在命令行输入python回车查看是否安装成功。 2.更换…

人工智能 2023年5月25日
00112
Apollo6.0代码Lattice算法详解——Part3:笛卡尔坐标转Frenet坐标

Apollo6.0代码Lattice算法详解——Part3:笛卡尔坐标转Frenet坐标 0.前置知识 1.涉及主要函数 2.函数关系 3.部分函数代码详解 * 3.1 latti…

人工智能 2023年5月25日
0097
【Pandas】多种添加行列数据方法

发现自己学习python 的各种库老是容易忘记，所有想利用这个平台，记录和分享一下学习时候的知识点，以后也能及时的复习，最近学习pandas，那我们来看看pandas添加数据的一些…

人工智能 2023年7月6日
00275
不完整多视图聚类近期论文

1.Adaptive Weighted Graph Fusion Incomplete Multi-View Subspace Clustering Sensors, 2020 2…

人工智能 2023年7月17日
0058
OkHttp原理分析总结

Okhttp 介绍 OkHttp 是 Square 公司开源的一款网络框架，封装了一个高性能的 http 请求库。 https://github.com/square/okhttp…

人工智能 2023年6月26日
0074
语音唤醒 mycroft-precise使用记录

不熟悉语音唤醒的人可以在阅读本文前了解语音唤醒的一些基本发展状况和评价标准，以免产生偏见。 [En] People who are not familiar with voice …

人工智能 2023年5月25日
00121
什么是迁移学习（Transfe

什么是迁移学习迁移学习（Transfer Learning）是一种机器学习方法，它通过利用源领域（source domain）中学到的知识来改善目标领域（target domai…

人工智能 2024年1月1日
0038
基于Laplacian图谱的短文本聚类算法

论文笔记：[1]孟海宁,冯锴,朱磊,张贝贝,童新宇,黑新宏.基于Laplacian图谱的短文本聚类算法[J].电子学报,2021,49(09):1716-1723. [Tencen…

人工智能 2023年6月3日
0061

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pytorch 神经网络套路 使用Dataset,DataLoader实现多维输入特征的二分类

大家都在看

pytorch 神经网络套路使用Dataset,DataLoader实现多维输入特征的二分类