协同过滤算法是否适用于实时推荐系统

2024年1月2日上午3:15 • 人工智能 • 阅读 41

问题：协同过滤算法是否适用于实时推荐系统

介绍

实时推荐系统是一种根据用户的实时行为快速生成个性化推荐内容的系统。协同过滤算法是一种常用的个性化推荐算法，根据用户的历史行为和其他用户的行为模式进行推荐。本文将讨论协同过滤算法在实时推荐系统中的适用性，并提供详细的算法原理、公式推导、计算步骤和Python代码示例。

算法原理

协同过滤算法基于用户之间的相似性进行推荐。它分为两种类型：基于用户的协同过滤和基于物品的协同过滤。基于用户的协同过滤通过比较用户之间的历史行为来找到相似的用户，然后将相似用户喜欢的物品推荐给目标用户。基于物品的协同过滤则是通过比较物品之间的关联性来进行推荐。

在实时推荐系统中，用户的行为会不断更新，因此需要实时计算相似性并生成推荐结果。但是传统的协同过滤算法一般是离线计算的，无法实时处理。

公式推导

基于用户的协同过滤算法公式推导

假设有n个用户和m个物品。用户-物品矩阵R中的每个元素$R_{ui}$表示用户u对物品i的评分。用户u和用户v之间的相似度可以使用余弦相似度公式计算：

$$
similarity(u, v) = \frac{\sum_{i \in I}(R_{ui} – \bar{R}u)(R{vi} – \bar{R}v)}{\sqrt{\sum{i \in I}(R_{ui} – \bar{R}u)^2} \sqrt{\sum{i \in I}(R_{vi} – \bar{R}_v)^2}}
$$

其中，$\bar{R}_u$和$\bar{R}_v$分别表示用户u和用户v的评分均值。

对于给定的目标用户u和物品i，可以使用下面的公式预测用户u对物品i的评分：

$$
\hat{R}{ui} = \bar{R}_u + \frac{\sum{v \in U}(R_{vi} – \bar{R}v) \cdot similarity(u, v)}{\sum{v \in U}similarity(u, v)}
$$

其中，U表示与用户u相似的用户集合。

基于物品的协同过滤算法公式推导

假设有n个用户和m个物品。用户-物品矩阵R中的每个元素$R_{ui}$表示用户u对物品i的评分。物品i和物品j之间的相似度可以使用余弦相似度公式计算：

$$
similarity(i, j) = \frac{\sum_{u \in U}(R_{ui} – \bar{R}u)(R{uj} – \bar{R}u)}{\sqrt{\sum{u \in U}(R_{ui} – \bar{R}u)^2} \sqrt{\sum{u \in U}(R_{uj} – \bar{R}_u)^2}}
$$

其中，$\bar{R}_u$表示用户u的评分均值。

对于给定的目标用户u和物品i，可以使用下面的公式预测用户u对物品i的评分：

$$
\hat{R}{ui} = \frac{\sum{j \in I}(R_{uj} \cdot similarity(i, j))}{\sum_{j \in I}similarity(i, j)}
$$

其中，I表示与物品i相似的物品集合。

计算步骤

基于用户的协同过滤算法计算步骤

计算用户-物品矩阵R中所有用户的评分均值$\bar{R}_u$。
对于目标用户u，计算与其相似的其他用户v的相似度$similarity(u, v)$。
根据相似度和其他用户的评分，预测目标用户u对所有未评分物品的评分$\hat{R}_{ui}$。
根据预测的评分$\hat{R}_{ui}$进行推荐。

基于物品的协同过滤算法计算步骤

计算用户-物品矩阵R中所有用户的评分均值$\bar{R}_u$。
对于目标物品i，计算与其相似的其他物品j的相似度$similarity(i, j)$。
根据相似度和其他物品的评分，预测目标用户u对所有未评分物品的评分$\hat{R}_{ui}$。
根据预测的评分$\hat{R}_{ui}$进行推荐。

Python代码示例

下面给出基于用户的协同过滤算法的Python代码示例。假设用户-物品矩阵R已经存储在一个二维数组中，用户编号从0到n-1，物品编号从0到m-1。

import numpy as np

def user_based_cf(R, u):
 n_users, n_items = R.shape

 # 计算评分均值
 R_mean = np.mean(R, axis=1)

 # 计算与目标用户u的相似度
 similarities = []
 for v in range(n_users):
 if v != u:
 similarity = np.sum((R[u] - R_mean[u]) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls (R[v] - R_mean[v])) / (
 np.sqrt(np.sum((R[u] - R_mean[u]) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls 2)) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls np.sqrt(np.sum((R[v] - R_mean[v]) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls 2)))
 similarities.append(similarity)

 similarities = np.array(similarities)

 # 找到相似度最高的k个用户
 k = 5
 most_similar_users = np.argsort(similarities)[-k:]

 # 预测目标用户u对所有未评分物品的评分
 predictions = np.zeros(n_items)
 for i in range(n_items):
 if R[u, i] == 0: # 未评分的物品
 numerator = 0
 denominator = 0
 for v in most_similar_users:
 numerator += (R[v, i] - R_mean[v]) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls similarities[v]
 denominator += similarities[v]
 predictions[i] = R_mean[u] + numerator / denominator

 return predictions

# 示例使用
R = np.array([[5, 3, 0, 0], [4, 0, 4, 1], [1, 1, 0, 5], [0, 0, 4, 4]])
user_index = 0
predictions = user_based_cf(R, user_index)
print("用户{}对未评分物品的预测评分：{}".format(user_index, predictions))

代码细节解释

首先导入了NumPy库，用于处理数组和矩阵运算。
然后定义了一个名为user_based_cf的函数，接受一个用户-物品矩阵R和目标用户u的索引作为参数，并返回预测评分的数组。
函数内部首先获取用户-物品矩阵R的维度，以及所有用户的评分均值。
然后计算目标用户u与其他用户v之间的相似度，存储在一个列表中。
使用argsort函数对相似度列表进行排序，并取出相似度最高的k个用户。
遍历未评分的物品，使用相似用户的评分和相似度进行预测，得到预测评分数组。
最后，在示例使用中，给出了一个用户-物品矩阵的示例数据，并使用用户0作为目标用户调用user_based_cf函数，输出预测评分结果。

这是一个简单的示例代码，实际应用中可能还需要考虑其他因素，例如加权相似度、用户兴趣漂移等。根据具体场景需要进行相应的改进和调整。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/823016/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

OpenGL课程设计光线追踪

链接: https://pan.baidu.com/s/1cBTTbbzRCVBCX_H4jf6qMA 提取码: kj8w 一、实验内容与要求 1.1 实验内容 (1)实验描述基…

人工智能 2023年7月28日
0061
【NovelAI】在QQ群中部署AI画图机器人

目录一、NovelAI 二、UIautomation和pywin32 三、代码 1、AI画图相关 2、QQ群消息抓取相关四、代码效果五、后记一、NovelAI NovelA…

人工智能 2023年7月26日
0053
什么是决策树回归

什么是决策树回归？决策树回归是一种机器学习算法，用于从输入变量中预测连续目标变量的值。它使用树状结构来建模数据，其中每个内部节点表示一个特征或属性，每个边表示根据该属性进行的判断…

人工智能 2023年12月31日
0031
Numpy：数组（Ndarray）操作之元素添加、删除和修改

数组也是一个可变类型，可以对数组中的元素进行添加、删除和修改，本文详细介绍了对数组元素的添加和删除的操作，以及这两种操作的方法均已列出。数组元素的修改操作简单，只要对索引和切片掌握…

人工智能 2023年7月5日
0087
自然语言处理1——NLP概述

说在前面本文及后续文章是学习自然语言过程中的学习笔记，存在部分内容可能记录错误或不全情况。希望能帮助到你:D 什么是自然语言处理？用机器处理人类语言的理论和技术，构造计算模型，…

人工智能 2023年5月31日
0070
[Python] pop()函数

pop()函数用于移除列表中的一个元素(默认最后一个元素)，并且返回该元素的值 list.pop([index=-1]) 要移除列表元素的索引值，不能超过列表总长度，默认为inde…

人工智能 2023年7月5日
0086
python编程实现决策树算法

最近布置了个课堂作业，用python实现决策树算法。整了几天勉勉强强画出了棵歪脖子树，记录一下。大体思路： 1.创建决策树My_Decision_Tree类，类函数__init…

人工智能 2023年7月5日
0064
pandas的简单使用（增加）

pandas的简单使用（增加）增加行增加列 * 添加一列添加多列条件添加 * 带逻辑判断的带运算的函数map、apply、applymap 合并 * concat &#…

人工智能 2023年7月7日
0087
最新Anaconda3的安装配置及使用教程（附图文）

文章目录 * – Anaconda简介 – Anaconda下载和安装 – Anaconda安装过程 – 验证anaconda是否安…

人工智能 2023年7月4日
00130
python 插值处理一维数据 interpolate

scipy库： 原码： https://docs.scipy.org/doc/scipy/reference/ge…

人工智能 2023年7月31日
0051
Bert文本分类实战（附代码讲解）

[ BERT_是目前自然语言处理领域最先进的模型之一，拥有强大的语言理解能力和处理文本任务的能力。其中 _BERT_多分类 _文本分类_的应用广泛，可以用于情感分析、垃圾邮件过滤、…

人工智能 2023年7月3日
0048
Backtrader量化&回测8——手续费

手续费是交易中必不可少的，尤其当调试策略参数时，结果都差不多，但不同参数导致的换手次数不同，此时手续费的影响就很大了，因此在backtrader中需要在计算时添加手续费 Backt…

人工智能 2023年7月8日
0048
python baidu语音转文字

from aip import AipSpeech #baidu-aip APP_ID = ‘ ‘ API_KEY = ‘ ‘ SECRET_KEY = ‘ ‘ 百度AI库获取的参…

人工智能 2023年5月25日
0086
编译原理：词法分析

一、词法分析任务 ; 二、正则表达式到自动机 1.正则表达式字母表中每一个字符都是一个正则表达式。 L(ε)={ε}，L(a)={a} (其中a是字母表中一个字符)。同时多个正…

人工智能 2023年6月29日
0088
【深度学习-笔记】(2)–高斯过程&高斯回归

【深度学习-笔记】(2)–高斯过程&高斯回归 个人笔记，&am…

人工智能 2023年6月17日
0091
【andriod】设备APP开发之各种细节部署和操作

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月30日
0089

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31