全网最全——-FFM论文解读以及在tensorflow2实现FFM代码

2023年5月26日下午4:53 • 人工智能 • 阅读 95

FFM论文解读以及在tensorflow2实现FFM代码

文章目录

FFM论文解读以及在tensorflow2实现FFM代码
前言
一、论文解读以及论文分析
二、tensorflow2实现FFM代码
*
1.导库
2.数据预处理
3.建立模型并测试运行
总结

前言

网上关于FFM的论文解读都是千篇一律，于是乎，精选网上各种对于FFM的分析制作一个思维导图，同时也借鉴网上其他人的tensorflow2的代码，实现了FFM的代码，相信作者，照着本篇文章推荐的内容保证你快速深入理解FFM算法思想。

一、论文解读以及论文分析

我将网上写的一些不错的回答制作成一个思维导图，里面有对FFM的分析，照着这个思路，能迅速的对论文思想有一个清晰地认识。链接如下
FFM论文学习流程
每一个模块都精选我自己认为写的最好的文章，分别点击对应的链接进行学习即可

看完论文之后，那么必须要手动实现一下代码，下面将介绍一下在tensorflow2中实现FFM的过程

; 二、tensorflow2实现FFM代码

1.导库

import tensorflow as tf
from tensorflow.keras import layers, optimizers
from tensorflow import keras

import numpy as np
import pandas as pd

2.数据预处理

2.数据预处理
def preprocess(x, y):
    x = tf.cast(x, dtype=tf.float64)
    y = tf.cast(y, dtype=tf.int64)
    return x, y

from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split

data = load_breast_cancer()
x_train, x_test, y_train, y_test = train_test_split(data.data, data.target, test_size=0.2, random_state=111,
                                                    stratify=data.target)
print(x_train.shape, x_test.shape, y_train.shape, y_test.shape)

train_db = tf.data.Dataset.from_tensor_slices((np.array(x_train), y_train))
train_db = train_db.shuffle(123).map(preprocess).batch(32)
print(train_db)
test_db = tf.data.Dataset.from_tensor_slices((np.array(x_test), y_test))
test_db = test_db.shuffle(123).map(preprocess).batch(32)

sample = next(iter(train_db))
print('sample:', sample[0].shape, sample[1].shape,
      tf.reduce_min(sample[0]), tf.reduce_max(sample[0]))

3.建立模型并测试运行

class FFM(keras.Model):
    def __init__(self, field_num, feature_field_dict, dim_num, k=8):
        super(FFM, self).__init__()
        self.field_num = field_num
        self.k = k
        self.feature_field_dict = feature_field_dict
        self.dim_num = dim_num

    def build(self, input_shape):
        self.fc = tf.keras.layers.Dense(units=1,
                                        bias_regularizer=tf.keras.regularizers.l2(0.01),
                                        kernel_regularizer=tf.keras.regularizers.l1(0.02))
        self.w = self.add_weight(shape=(input_shape[-1], self.field_num, self.k),
                                 initializer='glorot_uniform',
                                 trainable=True)
        super(FFM, self).build(input_shape)

    def call(self, x, training):
        linear = self.fc(x)
        temp = tf.cast(0, tf.float32)
        temp = tf.expand_dims(temp, axis=0)
        for j1 in range(self.dim_num):
            for j2 in range(j1 + 1, self.dim_num):
                f1 = self.feature_field_dict[j2]
                f2 = self.feature_field_dict[j1]
                # [, , k] * [, , k] = [, , k] -> [1, k]
                ww = tf.expand_dims(tf.multiply(self.w[j1, f2, :], self.w[j2, f1, :]), axis=0)
                # print(ww)
                # [x, ] * [x, ] = [x, ] -> [x, 1]
                xx = tf.expand_dims(tf.multiply(x[:, j1], x[:, j2]), axis=1)
                # print(xx)
                # [x, 1] @ [1, k] = [x, k]
                store = tf.matmul(xx, ww)
                # print(store)
                # [x, k] -> [x]
                temp += tf.reduce_mean(store, keepdims=True, axis=1)
                print(temp)
        out = layers.Add()([linear, temp])
        return tf.sigmoid(out)

store = {}
for i in range(30):
    store[i] = int(i / 15)
model = FFM(field_num=2, feature_field_dict=store, dim_num=30)
model.build((None, 30))
model.summary()

def main():
    store = {}
    for i in range(30):
        store[i] = int(i / 15)  # 实际要根据数据字段含义定义，这里只是做一个随意的分组
    model = FFM(field_num=2, feature_field_dict=store, dim_num=30)
    optimizer = optimizers.Adam(lr=1e-2)
    for epoch in range(10):
        for step, (x, y) in enumerate(train_db):
            with tf.GradientTape() as tape:
                logits = model(x, training=True)
                loss = tf.reduce_mean(tf.losses.binary_crossentropy(y, logits))
                loss_regularization = []
                for i in model.trainable_variables:
                    loss_regularization.append(tf.nn.l2_loss(i))
                loss_regularization = tf.reduce_sum(tf.stack(loss_regularization))
                loss = 0.001 * loss_regularization + loss
            grads = tape.gradient(loss, model.trainable_variables)
            optimizer.apply_gradients(zip(grads, model.trainable_variables))
            print(epoch, step, 'loss:', float(loss))

        total_num = 0
        total_correct = 0
        for x, y in test_db:
            pred = model(x, training=False)
            pred = tf.squeeze(pred)
            pred = pred > 0.5
            pred = tf.cast(pred, dtype=tf.int64)
            correct = tf.cast(tf.equal(pred, y), tf.int64)
            correct = tf.reduce_sum(correct)
            total_num += x.shape[0]
            total_correct += int(correct)
        acc = total_correct / total_num
        print(epoch, 'acc:', acc)
        print("-" * 25)

if __name__ == '__main__':
    main()

建议不懂得自己阅读调试代码，会更加深刻的理解论文思想

总结

本文就详细介绍了FFM论文的思想(其它人的解读）以及如何实现的过程，希望对读者朋友们有所帮助

Original: https://blog.csdn.net/weixin_43106956/article/details/121592873
Author: 向未来前行
Title: 全网最全——-FFM论文解读以及在tensorflow2实现FFM代码

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/520654/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【机器学习实验四】基于Logistic Regression二分类算法实现手部姿态识别

文章目录 Logistic 回归实现手势识别 * 1. 想法构思 – 一些细节 2. 实现流程 – 2.1 数据采集与预处理 + 2.1.1基于mediap…

人工智能 2023年7月2日
0070
工具｜如何在shell中漂亮地打印JSON

Linux curl命令是一个利用URL规则在命令行下工作的文件传输工具。它支持文件的上传和下载，所以是综合传输工具，但按传统，习惯称curl为下载工具。作为一款强力工具，curl…

人工智能 2023年6月27日
0076
python爬虫教程（五）：解析库bs4及爬取实例

大家好，今天分享的是解析库中的bs4，本文章的目的是让你知道如何使用bs4，并且附带爬取实例。目录一、bs4简介二、安装及初始印象 1.安装 2.解析器 3.初始印象三、选…

人工智能 2023年7月6日
00100
opencv与Image以及numpy转换和显示【附代码】

图像的显示在python中有很多方式，但针对自己的项目，需要有不同的读取或者显示方式，又或者想把图像转换成其他类型进行处理。比如你是用opencv读取的图像，然后检测完以后是用Im…

人工智能 2023年7月18日
00158
Tesla AI Day：特斯拉如何实现自动驾驶的详解

之前上课的时候偶然间看到了知乎上关于特斯拉如何实现自动驾驶的详解，因为我本身就是做算法的，对自动驾驶也很感兴趣，得知信息来源于Tesla的AI Day，于是下课后马不停蹄就去找了回…

人工智能 2023年6月2日
00108
一图看懂DeepSORT整个大流程，多目标跟踪

目录系列文章简介 DeepSORT流程图名词解释整体流程重点节点解释系列文章【目标跟踪】卡尔曼滤波器(Kalman Filter) 含源码【目标跟踪】一图看懂Dee…

人工智能 2023年6月15日
0083
数据库数据模型

目录 1 基本概念 2 数据模型的三要素 3 E-R模型 3.1 实体 3.2 联系 3.3 属性 3.4 实体-联系方法 3.5 扩展的E-R模型 4 数据模型 5 关系模型 1…

人工智能 2023年6月10日
00227
机器学习实用代码汇总（你想要的这里都有）

机器学习实用代码汇总（你想要的这里都有）文章目录机器学习实用代码汇总（你想要的这里都有）前言一、数据导入 * 1.数据文件读取 2.提取特征和标签 3.数据分布及关系图（P…

人工智能 2023年7月3日
00143
TensorFlow中的循环神经网络（RNN）是如何实现的

Tensorflow中的循环神经网络（RNN）循环神经网络（Recurrent Neural Network，简称RNN）是一种可以处理序列数据的神经网络模型。在Tensorfl…

人工智能 2023年12月30日
0036
R语言采用优化方法拟合曲线并计算AIC,BIC,LRT

文章目录前言一、R代码实现 * 1.导入库 2.随机生成原始数据 3.RMSD 4.梯度下降 5.最大似然估计 6.做出优化后图像 7.求AIC,BIC 8.求LRT 二、运行…

人工智能 2023年6月16日
0058
神经辐射场 3D 重建——NeRF

😸NeRF（ECCV 2020）主要贡献：提出一种将具有复杂几何性质和材料的连续场景表示为 5D 神经辐射场的方法，并将其参数化为基本的 MLP 网络提出一种基于经典体渲染技…

人工智能 2023年6月16日
00112
[渝粤教育] 山东科技大学遥感数字图像处理参考资料

教育-遥感数字图像处理-章节资料考试资料-山东科技大学【】第1章单元测验1、【单选题】一幅数字图像的辐射量化等级是4 bit，这幅图像所存储的灰度值范围是多少？A、0－3B、1－…

人工智能 2023年6月20日
0069
Pandas模块（学习笔记）

Pandas包含以下三种数据结构：系列(Series)，数据帧(DataFrame)，面板(Panel)。这些数据结构构建在Numpy数组之上，这意味着它们处理速度很快。 Seri…

人工智能 2023年7月8日
0081
【OpenCV 例程300篇】249. 图像的重映射（cv2.remap）

『youcans 的 OpenCV 例程300篇 – 总目录』【youcans 的 OpenCV 例程 300篇】249. 图像的重映射（cv.remap）重映射是…

人工智能 2023年6月18日
00109
如何用Python将普通视频变成动漫视频

文章目录容我废话一下一、思路流程二、图像转动漫三、视频帧读取与视频帧写入容我废话一下最近几个月，毒教材被曝光引发争议，那些编写度教材的人着实可恶。咱程序员也没有手绘插画…

人工智能 2023年5月26日
00123
继承中国元宇宙之父钱学森先生“灵境”的概念产物—XR电影《告别核桃》代表了什么？

元宇宙大家都不陌生吧，那么你听说过”灵境”吗？你知道”灵境”与元宇宙XR影片《告别核桃》有什么关系吗？在2021年12月9日举行的2…

人工智能 2023年7月29日
0055

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

全网最全——-FFM论文解读以及在tensorflow2实现FFM代码

文章目录

1.导库

2.数据预处理

3.建立模型并测试运行

大家都在看