CTR—DIEN原理，及deepctr实现DIEN

2023年5月26日下午5:01 • 人工智能 • 阅读 73

原先在DIN中User Behaviors的部分现在分成了三层，第一层Behavior Layer，第二层Interest Extractor Layer，第三层Interest Evolving Layer。

将用户行为序列embedding之后和其他特征embedding一起作为输入
兴趣抽取层 Interest Extractor Layer：用户行为序列送入GRU结构，使用t时刻及之前的序列抽取t时刻的兴趣（即GRU对应细胞的输出h t h_t h t ）
在兴趣抽取层中引入辅助loss，最大化h t h_t h t 与t+1时刻item embedding的内积，最小化h t h_t h t 与随机采样负例的内积
辅助loss：对内积进行sigmoid转化为0~1之间的值之后，再与1/0得到binary交叉熵，与graphsage非监督学习的loss形式一致，在tf中实现为sigmoid_cross_entropy_with_logits
辅助loss能够对GRU的每一步进行学习，一方面有利于GRU的学习，使模型能够好地抓住某一时刻的兴趣点，另一方面也有利于item embedding的学习
将兴趣抽取层GRU的输出与目标向量e做attention，得到attention权重，具体做法是对h t W e h_t W_e h t W e 进行softmax，其中W是待学习的权重参数
兴趣进化层 Interest Evolving Layer：在兴趣抽取层之上再堆叠一层GRU，使用第一层GRU的输出作为输入，与第一层GRU的的区别在于更新门的输出u需要乘上attention权重，通过attention机制控制每一步GRU隐含向量的更新
将兴趣进化层GRU最后一步的输出与其他特征embedding做concat，送入多层简单DNN拟合真实click

详见：
https://blog.csdn.net/wuzhongqiang/article/details/109532438

import os, warnings, time, sys
import pickle
import matplotlib.pyplot as plt
import pandas as pd, numpy as np
from sklearn.utils import shuffle
from sklearn.metrics import f1_score, accuracy_score, roc_curve, precision_score, recall_score, roc_auc_score
from sklearn import metrics
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler, OneHotEncoder

from sklearn.preprocessing import LabelEncoder
from deepctr.models import DIEN
from deepctr.feature_column import SparseFeat, DenseFeat, get_feature_names
from deepctr.layers import custom_objects
from tensorflow.keras.models import model_from_yaml
import tensorflow as tf
from tensorflow.python.ops import array_ops
import tensorflow.keras.backend as K
from sklearn import datasets
from keras.models import Sequential
from keras.layers import Dense
from keras.utils import to_categorical
from keras.models import model_from_json
from tensorflow.keras.callbacks import *
from tensorflow.keras.models import *
from tensorflow.keras.layers import *
from tensorflow.keras.optimizers import *
from keras.preprocessing.sequence import pad_sequences
from keras.preprocessing.text import one_hot
from keras.layers.embeddings import Embedding
from deepctr.feature_column import SparseFeat, VarLenSparseFeat, DenseFeat, get_feature_names

from toolsnn import *
import settings

def get_xy_fd(use_neg=False, hash_flag=False):

    behavior_feature_list = ["item_id", "cate_id"]

    uid = np.array([0, 1, 2])

    ugender = np.array([0, 1, 0])

    iid = np.array([1, 2, 3])
    cate_id = np.array([1, 2, 2])

    score = np.array([0.1, 0.2, 0.3])

    hist_iid = np.array([[1, 2, 3, 0], [1, 2, 3, 0], [1, 2, 0, 0]])
    hist_cate_id = np.array([[1, 2, 2, 0], [1, 2, 2, 0], [1, 2, 0, 0]])

    behavior_length = np.array([3, 3, 2])

    feature_columns = [SparseFeat('user', 3, embedding_dim=10, use_hash=hash_flag),
                       SparseFeat('gender', 2, embedding_dim=4, use_hash=hash_flag),
                       SparseFeat('item_id', 3 + 1, embedding_dim=8, use_hash=hash_flag),
                       SparseFeat('cate_id', 2 + 1, embedding_dim=4, use_hash=hash_flag),
                       DenseFeat('pay_score', 1)]

    feature_columns += [VarLenSparseFeat(SparseFeat('hist_item_id', vocabulary_size=3 + 1, embedding_dim=8, embedding_name='item_id'), maxlen=4, length_name="seq_length"),
        VarLenSparseFeat(SparseFeat('hist_cate_id', 2 + 1, embedding_dim=4, embedding_name='cate_id'), maxlen=4, length_name="seq_length")]

    feature_dict = {'user': uid, 'gender': ugender, 'item_id': iid, 'cate_id': cate_id,
                    'hist_item_id': hist_iid, 'hist_cate_id': hist_cate_id,
                    'pay_score': score, "seq_length": behavior_length}

    x = {name: feature_dict[name] for name in get_feature_names(feature_columns)}
    y = np.array([1, 0, 1])

    print(x)
    print(y)
    return x, y, feature_columns, behavior_feature_list

if __name__ == "__main__":
    if tf.__version__ >= '2.0.0':
        tf.compat.v1.disable_eager_execution()

    USE_NEG = True
    x, y, feature_columns, behavior_feature_list = get_xy_fd(use_neg=USE_NEG)

    model = DIEN(feature_columns, behavior_feature_list,

                 gru_type="AUGRU",
                 use_negsampling=False,
                 dnn_hidden_units=(256, 128, 64),
                 alpha=1.0,
                 use_bn=True,
                 att_hidden_units=(64, 16), att_activation="dice",
                 l2_reg_dnn=0, l2_reg_embedding=0.00001, dnn_dropout=0.1,
                 task='binary',
                 )

    model.compile('adam', 'binary_crossentropy',
                  metrics=['binary_crossentropy'])
    history = model.fit(x, y, verbose=1, epochs=10, validation_split=0.5)

Original: https://blog.csdn.net/qq_42363032/article/details/121774193
Author: WGS.
Title: CTR—DIEN原理，及deepctr实现DIEN

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/520716/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

还在做Flink+Druid/ES/Hbase的实时数仓吗？AbutionGraph+Flink带您构建流批一体的增强流式知识图谱数据仓库

AbutionGraph是众多国产数据库中新兴的一员，且是唯一一款GraphHOLAP 的实时知识图谱数据仓库，将在本文中介绍Abution 如何结合Flink （无缝对接Flin…

人工智能 2023年6月1日
0075
bp神经网络实验分析,BP神经网络实验报告

基于优化的BP神经网络遥感影像分类。罗小波1刘明培1，2（1.重庆邮电大学计算机学院中韩GIS研究所，重庆，400065；2.西南大学资源环境学院，重庆，400065）摘要：在…

人工智能 2023年7月28日
0053
VAE的原理+直观理解+公式推导+去噪+异常检测

1、VAE原理的直观理解使用(VAE)生成建模,理解可变自动编码器背后的数学原理一般设先验分布为标准正态分布，但是也可以是其他分布。 KL项目的是使得q(z|x)与p(z|x)相似…

人工智能 2023年6月16日
0095
葡萄干数据集

原文： Raisin Dataset Data Set Images of the Kecimen and Besni raisin varieties were obtained…

人工智能 2023年7月28日
0071
（深入篇）漫游语音识别技术—带你走进语音识别技术的世界

前有古人，后有小王，大家好，我是你们爱思考的小王学长，今天咱们继续漫游语音识别技术哈，今天内容稍微专业一些，大家可以结合上一篇漫游语音识别技术一起学习。在第一部分中，我们简要了解…

人工智能 2023年5月25日
00121
Pandas总结与思维导图

Pandas是一个强大的分析结构化数据的工具集；它的使用基础是Numpy（提供高性能的矩阵运算）；用于数据挖掘和数据分析，同时也提供数据清洗功能。利器之一：Series它是一种类似…

人工智能 2023年7月7日
0091
Python-玩转数据-机器学习与建模概述

一、说明机器学习的核心是”使用算法解析数据，从中学习，然后对世界上的某件事情做出决定或预测”。这意味着，与其显式地编写程序来执行某些任务，不如教计算机如何…

人工智能 2023年6月11日
0075
matlab怎么搭建神经网络,matlab实现神经网络算法

怎样用matlab建立bp神经网络 net=train(net, p, t);把这句改成net=train(net, p’, t’);试试，matlab应该…

人工智能 2023年7月13日
0048
[论文][半监督语义分割]Semi-Supervised Semantic Segmentation with Cross Pseudo Supervision

CVPR2021 原文半监督语义分割方法的总结：主要思想： Consistency regularization ：希望不同扰动之下网络的输出结果一致，扰动的加入的位置：（1）…

人工智能 2023年6月6日
00112
强化学习-学习笔记14 | 策略梯度中的 Baseline

本篇笔记记录学习在策略学习中使用 Baseline，这样可以降低方差，让收敛更快。 14. 策略学习中的 Baseline 14.1 Baseline 推导在策略学习中，我们…

人工智能 2023年6月4日
0088
ros(21):visualization_msgs::Marker基本形状Basic Shapes 基本操作ADD DELETE（c++）教程

1 创建工作空间先看一下有哪些文件：（请忽略压缩包） meng@meng:~/ideas/ros_ws$ tree . └── src ├── beginner_tutorial…

人工智能 2023年6月2日
00104
COCO数据集的介绍和使用

这篇文章是我研究生阶段入学期间学习所记，主要供自己使用，结合了论文原作和源码，中间借鉴的一些b站的视频以及他人博客的解释，会在文章末尾贴出链接。目录 COCO数据集的介绍 COC…

人工智能 2023年7月27日
00173
数字图像处理——图像去雾技术的对比

前言现代社会的发展总是伴随着环境的污染，雾霾现象发生越来越频繁，很大程度上影响我们的生活。雾霾是由空气中的灰尘和烟雾等小的漂浮颗粒产生的常见大气现象，这些漂浮的颗粒极大地吸收和散…

人工智能 2023年6月18日
0083
数据分析工具Pandas

ser_obj = pd.Series([1, 2, 3, 4, 5], index=[‘a’, ‘b’, ‘c&#82…

人工智能 2023年6月11日
0058
数据投毒攻防对抗技术-1.数据投毒简介

文章目录前言课程简介大数据和机器学习 * 大数据机器学习大数据和机器学习结合大数据和机器学习潜在的安全威胁 * 数据分析流程机器学习流程及安全威胁数据投毒 * 什么…

人工智能 2023年6月25日
0088
[Medical Image] 医学图像处理中的数据读写

医学图像处理中的数据读写常见的医学图像的格式不管格式如何变化，对于医学图像而言，最终读取到内容中的数据就是图像的强度值信息，就类似自然图像的RGB表示法一样。这里叫做强度值，因…

人工智能 2023年6月4日
00115

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

CTR—DIEN原理，及deepctr实现DIEN

大家都在看