import collections
import os
import random
import  time
from tqdm import tqdm
import numpy as np
import torch
from torch import nn
import torchtext.vocab as Vocab
import torch.utils.data as Data
import torch.nn.functional as F
import matplotlib.pyplot as plt
import seaborn as sns
#os.environ["CUDA_VISIBLE_DEVICES"] = "6"
#&#x4F7F;&#x7528;GPU&#x8FD0;&#x7B97;
device=torch.device("cuda:6" if torch.cuda.is_available() else "cpu")

二.数据读取并查看

#&#x8BFB;&#x53D6;&#x5904;&#x7406;&#x597D;&#x7684;&#x6570;&#x636E;
import pandas as pd
data=pd.read_csv("/root/Jupyter/Data_cleaning/Cleaned_data.csv")
#&#x67E5;&#x770B;&#x6570;&#x636E;
data

三.使用word2vector生成词向量

1.先将评论转化为列表

#&#x9996;&#x5148;&#x5C06;comment_processed&#x4E2D;&#x7684;&#x6BCF;&#x4E00;&#x6761;&#x8BC4;&#x8BBA;&#x8F6C;&#x6362;&#x4E3A;&#x5217;&#x8868;
word_list=[str(s).split() for s in data["comment_processed"]]
print(word_list)

2.使用w2v进行词向量的生成

from gensim.models import word2vec
import time
start = time.time()
#&#x7A97;&#x53E3;&#x5927;&#x5C0F;&#x8BBE;&#x7F6E;&#x4E3A;3&#xFF0C;&#x8BCD;&#x7684;&#x6700;&#x5C0F;&#x51FA;&#x73B0;&#x6B21;&#x6570;&#x4E3A;1
model_w2v = word2vec.Word2Vec(word_list, window = 3, iter = 5,size=256,min_count=1)
print('&#x5B8C;&#x6210;')
end = time.time()
print('&#x82B1;&#x8D39;&#x65F6;&#x95F4;&#xFF1A;', end - start)
print(model_w2v)
#&#x5C06;&#x6A21;&#x578B;&#x4FDD;&#x5B58;
model_w2v.save('w2v')

3.查看生成的词向量

#&#x67E5;&#x770B;&#x8BCD;&#x5411;&#x91CF;&#x7684;&#x751F;&#x6210;&#x6548;&#x679C;
#&#x67E5;&#x770B;&#x8BCD;&#x5411;&#x91CF;&#x7684;&#x7EF4;&#x5EA6;
print(len(model_w2v['&#x624B;&#x673A;']))
print(model_w2v['&#x624B;&#x673A;'])

#&#x67E5;&#x770B;&#x4E0E;&#x624B;&#x673A;&#x76F8;&#x8FD1;&#x7684;&#x8BCD;
model_w2v.most_similar(["&#x5145;&#x7535;"])

四.将数据集划分为训练集和验证集

由于现在只有split只能创建train、valid这两个分类，所以我们需要创建一个新的test set。我们可以使用 .split()创建新的分类。
默认的数据分割是 70、30，如果我们声明 split_ratio，可以改变split之间的比例， test_size=0.2表示80%的数据是训练集，20%是验证集。
我们还声明 random_state这个参数，确保我们每次分割的数据集都是一样的。

from sklearn.model_selection import train_test_split
Temp_trin, valid_data = train_test_split(data,test_size=0.2, random_state=42) #&#x9ED8;&#x8BA4;split_ratio=0.7
train_data,test_data = train_test_split(Temp_trin,test_size=0.2, random_state=42)
train_data.to_csv("/root/Jupyter/Data_cleaning/train_data.csv",index=False,header=True,encoding="utf-8")
valid_data.to_csv("/root/Jupyter/Data_cleaning/valid_data.csv",index=False,header=True,encoding="utf-8")
test_data.to_csv("/root/Jupyter/Data_cleaning/test_data.csv",index=False,header=True,encoding="utf-8")

查看划分训练集、验证集、测试集后的数据量大小

print(f'Number of training examples: {len(train_data)}')
print(f'Number of validation examples: {len(valid_data)}')
print(f'Number of testing examples: {len(test_data)}')

五.借助Torchtext建立vocabulary,把每个单词映射到数字id

1.创建Filed对象

import torch
import torchtext
from torchtext.data import TabularDataset
torch.backends.cudnn.deterministic = True  #&#x5728;&#x7A0B;&#x5E8F;&#x521A;&#x5F00;&#x59CB;&#x52A0;&#x8FD9;&#x6761;&#x8BED;&#x53E5;&#x53EF;&#x4EE5;&#x63D0;&#x5347;&#x4E00;&#x70B9;&#x8BAD;&#x7EC3;&#x901F;&#x5EA6;&#xFF0C;&#x6CA1;&#x4EC0;&#x4E48;&#x989D;&#x5916;&#x5F00;&#x9500;&#x3002;
#&#x9996;&#x5148;&#xFF0C;&#x6211;&#x4EEC;&#x8981;&#x521B;&#x5EFA;&#x4E24;&#x4E2A;Field &#x5BF9;&#x8C61;&#xFF1A;&#x8FD9;&#x4E24;&#x4E2A;&#x5BF9;&#x8C61;&#x5305;&#x542B;&#x4E86;&#x6211;&#x4EEC;&#x6253;&#x7B97;&#x5982;&#x4F55;&#x9884;&#x5904;&#x7406;&#x6587;&#x672C;&#x6570;&#x636E;&#x7684;&#x4FE1;&#x606F;&#x3002;
#TEXT = data.Field(tokenize='spacy')#torchtext.data.Field : &#x7528;&#x6765;&#x5B9A;&#x4E49;&#x5B57;&#x6BB5;&#x7684;&#x5904;&#x7406;&#x65B9;&#x6CD5;&#xFF08;&#x6587;&#x672C;&#x5B57;&#x6BB5;&#xFF0C;&#x6807;&#x7B7E;&#x5B57;&#x6BB5;&#xFF09;
TEXT = torchtext.data.Field(sequential=True)
LABEL = torchtext.data.Field(sequential=False, dtype=torch.long, use_vocab=False)

2.使用TabularDataset方法生成数据集

&#x8BFB;&#x53D6;&#x6587;&#x4EF6;&#x751F;&#x6210;&#x6570;&#x636E;&#x96C6;
fields = [ ('label', LABEL),('comment_processed',TEXT)]
train, valid,test = TabularDataset.splits(
    path='/root/Jupyter/Data_cleaning/', format='csv',
    train='train_data.csv',
    validation = "valid_data.csv",
    test='test_data.csv',
    skip_header=True, fields=fields)

3.构建词表

&#x6784;&#x5EFA;&#x8BCD;&#x8868;
TEXT.build_vocab(train)
print(train[0].__dict__.keys())
print(vars(train.examples[0]))
print(vars(test.examples[0]))
#&#x8BED;&#x6599;&#x5E93;&#x5355;&#x8BCD;&#x9891;&#x7387;&#x8D8A;&#x9AD8;&#xFF0C;&#x7D22;&#x5F15;&#x8D8A;&#x9760;&#x524D;&#x3002;&#x524D;&#x4E24;&#x4E2A;&#x9ED8;&#x8BA4;&#x4E3A;unk&#x548C;pad&#x3002;
print(TEXT.vocab.stoi)
#&#x67E5;&#x770B;&#x8BAD;&#x7EC3;&#x6570;&#x636E;&#x96C6;&#x4E2D;&#x6700;&#x5E38;&#x89C1;&#x7684;&#x5355;&#x8BCD;&#x3002;
print(TEXT.vocab.freqs.most_common(20))
print(TEXT.vocab.itos[:10]) #&#x67E5;&#x770B;TEXT&#x5355;&#x8BCD;&#x8868;

4.构建词嵌入矩阵

将词向量和词id进行对应构建矩阵，比如手机的词id为2，在构建的矩阵中，第二行对应的就是手机的词向量。整个矩阵的大小为8491*256,代表通过建立此表一共存在8491个词id,每个词向量的维度为256。

#&#x751F;&#x6210;&#x8BCD;&#x5D4C;&#x5165;&#x77E9;&#x9635;
import numpy as np
embedding_dic = dict(zip(model_w2v.wv.index2word, model_w2v.wv.vectors))
embedding_matrix = np.zeros((len(TEXT.vocab), 256))
for w, i in TEXT.vocab.stoi.items():
    embedding_vec = embedding_dic.get(w)
    if embedding_vec is not None:
        embedding_matrix[i] = embedding_vec
print(embedding_matrix.shape)

六.创建Iterator,每个itartion都是返回一个batch的样本

最后一步数据的准备是创建iterators。每个itartion都会返回一个batch的examples。
我们会使用 BucketIterator。 BucketIterator会把长度差不多的句子放到同一个batch中，确保每个batch中不出现太多的padding。

from torchtext.data import Iterator, BucketIterator
train_batch_size = 64
val_batch_size = 64
test_batch_size = 64

#&#x76F8;&#x5F53;&#x4E8E;&#x628A;&#x6837;&#x672C;&#x5212;&#x5206;batch&#xFF0C;&#x53EA;&#x662F;&#x591A;&#x505A;&#x4E86;&#x4E00;&#x6B65;&#xFF0C;&#x628A;&#x76F8;&#x7B49;&#x957F;&#x5EA6;&#x7684;&#x5355;&#x8BCD;&#x5C3D;&#x53EF;&#x80FD;&#x7684;&#x5212;&#x5206;&#x5230;&#x4E00;&#x4E2A;batch&#xFF0C;&#x4E0D;&#x591F;&#x957F;&#x7684;&#x5C31;&#x7528;padding&#x3002;
&#x540C;&#x65F6;&#x5BF9;&#x8BAD;&#x7EC3;&#x96C6;&#x548C;&#x9A8C;&#x8BC1;&#x96C6;&#x8FDB;&#x884C;&#x8FED;&#x4EE3;&#x5668;&#x6784;&#x5EFA;
train_iterator, valid_iterator = BucketIterator.splits(
    (train, valid),
    batch_sizes=(train_batch_size, val_batch_size),
    device=device,
    sort_key=lambda x: len(x.comment_processed),
    sort_within_batch=False,
    repeat=False)

&#x5BF9;&#x6D4B;&#x8BD5;&#x96C6;&#x8FDB;&#x884C;&#x8FED;&#x4EE3;&#x5668;&#x6784;&#x5EFA;
test_iterator = Iterator(
    test,
    batch_size=test_batch_size,
    device=device,
    sort=False,
    sort_within_batch=False,
    repeat=False)

查看batch的信息。
查看通过Field格式化之后的文本。

for batch in train_iterator:
    print(batch)

{TEXT.vocab.itos[i] for i in batch.comment_processed[:,0]}

七.搭建神经网络，以Bi-LSTM为例

1.参数说明

embedding_dim：每个单词维度
hidden_size：隐藏层维度
num_layers：神经网络深度，纵向深度
bidirectional：是否双向循环

import torch.nn as nn
import torch.nn.functional as F

class LSTMmodel(nn.Module):
    def __init__(self,embedding_size,hidden_size,output_size):
        super(LSTMmodel,self).__init__()
        self.embedding=nn.Embedding(len(TEXT.vocab),256)
        self.lstm=nn.LSTM(embedding_size,hidden_size,num_layers=2,bidirectional=True)
        self.fc=nn.Linear(hidden_size*2,output_size)
        #&#x5411;&#x524D;&#x4F20;&#x64AD;
    def forward(self,text):
        embedded=self.embedding(text)
        output,(hidden,c)=self.lstm(embedded)
        #hidden&#x7684;&#x7EF4;&#x5EA6;&#x662F;&#xFF08;num_layers * num_directions, batch, hidden_size&#xFF09;&#x53D6;&#x6700;&#x540E;&#x4E00;&#x5C42;&#x7684;&#x524D;&#x5411;&#x548C;&#x540E;&#x5411;&#x8F93;&#x51FA;&#xFF0C;[4,64,hidden_size]
        h = torch.cat((hidden[-1, :, :], hidden[-2, :, :]), dim=1)
        #print("h",h)
        #print(h.shape)
        output=self.fc(h)
        return output

八.构建训练函数和验证函数

1.训练函数

def train(model, iterator, optimizer, criterion):
    epoch_loss = 0
    epoch_acc = 0
    total_len = 0
    count = 0
    model.train() #model.train()&#x4EE3;&#x8868;&#x4E86;&#x8BAD;&#x7EC3;&#x6A21;&#x5F0F;
    #&#x8FD9;&#x6B65;&#x4E00;&#x5B9A;&#x8981;&#x52A0;&#xFF0C;&#x662F;&#x4E3A;&#x4E86;&#x533A;&#x5206;model&#x8BAD;&#x7EC3;&#x548C;&#x6D4B;&#x8BD5;&#x7684;&#x6A21;&#x5F0F;&#x7684;&#x3002;
    #&#x6709;&#x65F6;&#x5019;&#x8BAD;&#x7EC3;&#x65F6;&#x4F1A;&#x7528;&#x5230;dropout&#x3001;&#x5F52;&#x4E00;&#x5316;&#x7B49;&#x65B9;&#x6CD5;&#xFF0C;&#x4F46;&#x662F;&#x6D4B;&#x8BD5;&#x7684;&#x65F6;&#x5019;&#x4E0D;&#x80FD;&#x7528;dropout&#x7B49;&#x65B9;&#x6CD5;&#x3002;
    for batch in iterator: #iterator&#x4E3A;train_iterator
        optimizer.zero_grad() #&#x52A0;&#x8FD9;&#x6B65;&#x9632;&#x6B62;&#x68AF;&#x5EA6;&#x53E0;&#x52A0;
        predictions = model(batch.comment_processed)
        #print("predictions",predictions)
        #batch.comment_processed comment_processed
        loss = criterion(predictions, batch.label)
        epoch_loss += loss.item()
        loss.backward() #&#x53CD;&#x5411;&#x4F20;&#x64AD;
        optimizer.step() #&#x68AF;&#x5EA6;&#x4E0B;&#x964D;
        epoch_acc += ((predictions.argmax(axis = 1)) == batch.label).sum().item()
        #&#xFF08;acc.item()&#xFF1A;&#x4E00;&#x4E2A;batch&#x7684;&#x6B63;&#x786E;&#x7387;&#xFF09; *batch&#x6570; = &#x6B63;&#x786E;&#x6570;
        #train_iterator&#x6240;&#x6709;batch&#x7684;&#x6B63;&#x786E;&#x6570;&#x7D2F;&#x52A0;&#x3002;
        total_len += len(batch.label)
        #&#x8BA1;&#x7B97;train_iterator&#x6240;&#x6709;&#x6837;&#x672C;&#x7684;&#x6570;&#x91CF;
        count += 1
    print(f'&#x8BAD;&#x7EC3;&#x4E86;{count}&#x4E2A;batch')
    return epoch_loss / total_len, epoch_acc / total_len
    #epoch_loss / total_len &#xFF1A;train_iterator&#x6240;&#x6709;batch&#x7684;&#x635F;&#x5931;
    #epoch_acc / total_len &#xFF1A;train_iterator&#x6240;&#x6709;batch&#x7684;&#x6B63;&#x786E;&#x7387;

2.验证函数

def evaluate(model, iterator, criterion):
    epoch_loss = 0
    epoch_acc = 0
    total_len = 0
    count = 0
    model.eval()
    #&#x8F6C;&#x6362;&#x6210;&#x6D4B;&#x8BD5;&#x6A21;&#x5F0F;&#xFF0C;&#x51BB;&#x7ED3;dropout&#x5C42;&#x6216;&#x5176;&#x4ED6;&#x5C42;&#x3002;
    with torch.no_grad():
        for batch in iterator:
            #iterator&#x4E3A;valid_iterator
            #&#x6CA1;&#x6709;&#x53CD;&#x5411;&#x4F20;&#x64AD;&#x548C;&#x68AF;&#x5EA6;&#x4E0B;&#x964D;
            predictions = model(batch.comment_processed)
            loss = criterion(predictions, batch.label)
            epoch_loss += loss.item()
            epoch_acc += ((predictions.argmax(axis = 1)) == batch.label).sum().item()
            total_len += len(batch.label)
            count += 1
    model.train() #&#x8C03;&#x56DE;&#x8BAD;&#x7EC3;&#x6A21;&#x5F0F;
    print(f'&#x9A8C;&#x8BC1;&#x4E86;{count}&#x4E2A;batch')
    return epoch_loss / total_len, epoch_acc / total_len

九.初始化参数

1.设置超参数

#&#x8BBE;&#x7F6E;&#x8D85;&#x53C2;&#x6570;
EMBEDDING_SIZE = 256
HIDDEN_SIZE = 128
OUTPUT_SIZE = 5

2.实例化模型

#&#x5B9E;&#x4F8B;&#x5316;&#x6A21;&#x578B;
model = LSTMmodel(embedding_size = EMBEDDING_SIZE,
                 hidden_size = HIDDEN_SIZE,
                 output_size = OUTPUT_SIZE,).to(device)

3.嵌入词向量

#&#x6A21;&#x578B;&#x8BCD;&#x5411;&#x91CF;&#x521D;&#x59CB;&#x5316;&#x6210;&#x9884;&#x8BAD;&#x7EC3;&#x7684;&#x8BCD;&#x5411;&#x91CF;
#from_munpy ndarray&#x548C;tensor&#x8F6C;&#x6362;
#&#x5C06;&#x751F;&#x6210;&#x7684;&#x8BCD;&#x5411;&#x91CF;-id&#x77E9;&#x9635;&#x5D4C;&#x5165;&#x5230;&#x6211;&#x4EEC;&#x7684;&#x7F51;&#x7EDC;&#x6A21;&#x578B;&#x4E2D;
model.embedding.weight.data.copy_(torch.from_numpy(embedding_matrix))[2:10]

4.统计模型参数

def count_parameters(model): #&#x7EDF;&#x8BA1;&#x6A21;&#x578B;&#x53C2;&#x6570;
    return sum(p.numel() for p in model.parameters() if p.requires_grad)

print(f'The model has {count_parameters(model):,} trainable parameters')

5.查看模型基础架构

#&#x67E5;&#x770B;&#x6A21;&#x578B;&#x57FA;&#x7840;&#x67B6;&#x6784;
print(model)

十.定义组件

1.定义优化器和损失函数

import torch.optim as optim
optimizer = optim.Adam(model.parameters()) #&#x5B9A;&#x4E49;&#x4F18;&#x5316;&#x5668;
criterion = nn.CrossEntropyLoss()  #&#x5B9A;&#x4E49;&#x635F;&#x5931;&#x51FD;&#x6570;,&#x4EA4;&#x53C9;&#x71B5;&#x635F;&#x5931;&#x51FD;&#x6570;
model = model.to(device) #&#x9001;&#x5230;gpu&#x4E0A;&#x53BB;
criterion = criterion.to(device) #&#x9001;&#x5230;gpu&#x4E0A;&#x53BB;

2.定义统计时间组件

import time
def epoch_time(start_time, end_time):  #&#x67E5;&#x770B;&#x6BCF;&#x4E2A;epoch&#x7684;&#x65F6;&#x95F4;
    elapsed_time = end_time - start_time
    elapsed_mins = int(elapsed_time / 60)
    elapsed_secs = int(elapsed_time - (elapsed_mins * 60))
    return elapsed_mins, elapsed_secs

十一.开始训练

定义训练10个轮次，并且保存效果最好的模型。

N_EPOCHS = 10
best_valid_loss = float('inf') #&#x65E0;&#x7A77;&#x5927;
for epoch in tqdm(range (N_EPOCHS),desc='Processing'):
    start_time = time.time()
    train_loss, train_acc = train(model, train_iterator, optimizer, criterion)
    valid_loss, valid_acc = evaluate(model, valid_iterator, criterion)
    end_time = time.time()
    epoch_mins, epoch_secs = epoch_time(start_time, end_time)

    if valid_loss < best_valid_loss: #&#x53EA;&#x8981;&#x6A21;&#x578B;&#x6548;&#x679C;&#x53D8;&#x597D;&#xFF0C;&#x5C31;&#x5B58;&#x6A21;&#x578B;
        best_valid_loss = valid_loss
        torch.save(model.state_dict(), 'Best-Checkpoint.pt')

    print(f'Epoch: {epoch+1:02} | Epoch Time: {epoch_mins}m {epoch_secs}s')
    print(f'\tTrain Loss: {train_loss:.3f} | Train Acc: {train_acc*100:.2f}%')
    print(f'\t Val. Loss: {valid_loss:.3f} |  Val. Acc: {valid_acc*100:.2f}%')

十二. 读入模型

1.载入模型

#&#x7528;&#x4FDD;&#x5B58;&#x7684;&#x6A21;&#x578B;&#x53C2;&#x6570;&#x9884;&#x6D4B;&#x6570;&#x636E;
model.load_state_dict(torch.load("Best-Checkpoint.pt"))

2.使用测试集测试结果

model.load_state_dict(torch.load('Best-Checkpoint.pt'))
test_loss, test_acc = evaluate(model, test_iterator, criterion)
print(f'Test Loss: {test_loss:.3f} | Test Acc: {test_acc*100:.2f}%')

3.测试结果

十三.创建组件

1.建立组件将未知的句子转换成id进行预测

import spacy  #&#x5206;&#x8BCD;&#x5DE5;&#x5177;&#xFF0C;&#x8DDF;NLTK&#x7C7B;&#x4F3C;
nlp = spacy.load('zh_core_web_md')

def predict_sentiment(sentence):
    tokenized = [tok.text for tok in nlp.tokenizer(sentence)]#&#x5206;&#x8BCD;
    indexed = [TEXT.vocab.stoi[t] for t in tokenized]
    #sentence&#x7684;&#x7D22;&#x5F15;

    tensor = torch.LongTensor(indexed).to(device) #seq_len
    tensor = tensor.unsqueeze(1)
    #seq_len * batch_size&#xFF08;1&#xFF09;

    prediction = torch.sigmoid(model(tensor))
    #tensor&#x4E0E;text&#x4E00;&#x6837;&#x7684;tensor
    #print(prediction)
    #&#x8F6C;&#x6362;&#x6210;numpy
    #print(prediction.detach().numpy())
    #&#x76F4;&#x63A5;&#x53D6;&#x51FA;numpy&#x4E2D;&#x6700;&#x5927;&#x7684;&#x5BF9;&#x5E94;&#x4F4D;&#x7F6E;&#x4F5C;&#x4E3A;&#x9884;&#x6D4B;&#x503C;
    final_prediction = prediction.detach().numpy().argmax(axis = 1)
    #return final_prediction
    if final_prediction+1 >= 3:
        print(f'&#x624B;&#x673A;&#x8BC4;&#x8BBA;:{sentence}&#x7684;&#x8BC4;&#x4EF7;&#x7B49;&#x7EA7;&#x4E3A;{final_prediction+1}&#x661F;&#x597D;&#x8BC4;')
    else :
        print(f'&#x624B;&#x673A;&#x8BC4;&#x8BBA;:{sentence}&#x7684;&#x8BC4;&#x4EF7;&#x7B49;&#x7EA7;&#x4E3A;{final_prediction+1}&#x661F;&#x5DEE;&#x8BC4;')

2.预测

predict_sentiment("&#x624B;&#x673A;&#x4E0D;&#x9519;&#xFF0C;&#x975E;&#x5E38;&#x597D;&#x7528;")
predict_sentiment("&#x624B;&#x673A;&#x4E0D;&#x597D;&#x7528;&#xFF0C;&#x6389;&#x7535;&#x4E25;&#x91CD;&#xFF0C;&#x5E76;&#x4E14;&#x53D1;&#x70EB;&#x4E25;&#x91CD;")

3.查看预测结果

Original: https://blog.csdn.net/weixin_44750512/article/details/121922347
Author: DonngZH
Title: 深度学习进行情感分析（2）–LSTM

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/711090/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Could not load dynamic library ‘cudart64_110.dll‘； dlerror: cudart64_110.dll not found Ignore above

问题描述 2021-12-11 22:03:37.094666: W tensorflow/stream_executor/platform/default/dso_loader….

人工智能 2023年6月16日
0078
【计算机视觉】图像分割与特征提取——基于Roberts、Prewitt、Sobel算子的图像分割实验

个人简介： 📦个人主页：赵四司机🏆学习方向：JAVA后端开发⏰往期文章：SpringBoot项目整合微信支付🔔博主推荐网站：牛客网刷题|面试|找工作神器📣种一棵树最好的时间是十年…

人工智能 2023年7月29日
0059
基于c++版opencv的图像处理

1.通道变换 void cvtColor(InputArray src, OutputArray dst, int code, int dstCn=0 ); 2.二值化 doubl…

人工智能 2023年7月20日
0052
Python视频处理（3）——提取视频字幕

目录一、安装tesseract-ocr 1、下载安装 2、设置环境变量： 3、测试安装是否成功二、视频字幕识提取 1、基本步骤： 2、完整代码： 3、部分运行结果：一…

人工智能 2023年7月19日
0032
人脸关键点检测原理及实战

人脸关键点概述：人脸关键点检测是人脸识别和分析领域中的关键任务，是诸如自动人脸识别、表情分析、三维人脸重建及三维动画等其他人脸相关问题的基础任务。人脸关键点和我们传统说的HOG以…

人工智能 2023年5月23日
0072
35岁危机，有哪10种解法？

第一，看清35岁危机的本质。为什么IT互联网行业35岁危机非常严重？公务员、医生、教师却不担心35岁危机？要从供需关系上理解行业的全局，降低自己的预期，能苟就苟。第二，降低消费欲…

人工智能 2023年6月27日
0047
Tensorflow】：could not load dynamic library ‘libcudart.so.11.0‘；dlerror:libcudart.so.11.0的解决方法

一、问题描述 import tensorflow报错如下图测试：tf.test.is_built_with_cuda()显示Truetf.test.is_gpu_available…

人工智能 2023年5月23日
0056
数模笔记：聚类模型

基本思想： [TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is st…

人工智能 2023年6月3日
0084
贝叶斯判别分析，Python代码分类讲解

贝叶斯判别规则是把某特征矢量(x) 落入某类集群的条件概率当成分类判别函数(概率判别函数)，x落入某集群的条件概率最大的类为X的类别，这种判决规则就是贝叶斯判别规则。贝叶斯判别规则…

人工智能 2023年6月16日
00123
【论文精读】NeRF详解

最近阅读了开启三维重建新纪元的经典文章《NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis…

人工智能 2023年7月6日
0086
高斯滤波及其原理

高斯滤波及其原理一、高斯函数的基础 1.1 期望、方差与标准差用来刻画随机变量某一方面特征的常数被称为随机变量的数字特征，其常用的有：数学期望：在概率论和统计学中，数…

人工智能 2023年6月17日
0060
基于Python爬虫的股票成交量数据抓取分析系统

目录数据获取 2 1.1. 实验环境搭建 2 1.2. 抓取数据 2 1.2.1. 新浪财经 3 1.2.2. 网易财经 6 1.2.3. 东方财富 12 1.2.4. TuSh…

人工智能 2023年7月16日
0064
基于MATLAB的说话人识别系统

基于MATLAB的说话人识别系统语音识别的简单介绍基于MATLAB VQ算法的说话人识别系统，矢量量化起着双重作用。在训练阶段，把每一个说话者所提取的特征参数进行分类，产生不同…

人工智能 2023年5月25日
0072
【数据分析与挖掘】天猫超市复购预测实战(含代码和数据集)

一.背景商家有时会在特定日期，例如Boxing-day，黑色星期五或是双十一（11月11日）开展大型促销活动或者发放优惠券以吸引消费者，然而很多被吸引来的买家都是一次性消费者，这…

人工智能 2023年6月16日
00110
机动目标跟踪之交互多模型（IMM）

机动目标跟踪之交互多模型 IMM * 输入交互滤波模型概率更新输出交互融合 IMM 由于单一模型很难匹配目标时刻变化的运动状态，容易导致目标跟踪丢失，1984年H.A.P.B…

人工智能 2023年6月2日
0087
图注意力机制

1.摘要：大多数推荐系统的图卷积神经网络工作都没有考虑明确按时邻域中不同邻居的表达差异的关系。每个相邻项目对用户偏好表示的影响可以通过该项目与用户相邻项目之间的相关性来表示。对…

人工智能 2023年7月28日
0069

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

深度学习进行情感分析（2）–LSTM