常用推荐算法

在对推荐系统的介绍中,给出了推荐系统的总体框架。显然,推荐方法是整个推荐系统中最核心、最关键的部分,它在很大程度上决定了推荐系统的性能。目前,推荐方法主要有基于内容的推荐、协同过滤推荐、基于关联规则的推荐、基于效用的推荐、基于知识的推荐和组合推荐。

[En]

In the introduction of the recommendation system, we give the general framework of the recommendation system. Obviously, the recommendation method is the most core and critical part of the whole recommendation system, which largely determines the performance of the recommendation system. At present, the main recommendation methods include content-based recommendation, collaborative filtering recommendation, association rule-based recommendation, utility-based recommendation, knowledge-based recommendation and combination recommendation.

一、基于内容推荐
概述:
基于内容的推荐(Content-Based Recommendation)是信息过滤技术的延续和发展。它是基于项目的内容信息,不需要基于用户对项目的评价,需要更多的机器学习方法来从关于内容的特征描述的案例中获取用户的兴趣数据。在基于内容的推荐系统中,项目或对象由相关特征的属性来定义。系统根据用户评价对象的特征,学习用户的兴趣,并检查用户数据与待预测项目的匹配度。用户的数据模型取决于所使用的学习方法,如决策树、神经网络、基于向量的表示等。基于内容的用户配置文件需要用户的历史数据,用户配置文件模型可能会随着用户偏好的变化而变化。

[En]

Content-based recommendation (Content-based Recommendation) is the continuation and development of information filtering technology. it is based on the content information of the project, and it does not need to be based on the user’s evaluation of the project, and more machine learning methods are needed to get the user’s interest data from the cases about the feature description of the content. In the content-based recommendation system, the item or object is defined by the attributes of the relevant features. based on the characteristics of the object evaluated by the user, the system learns the interest of the user and examines the matching degree between the user data and the project to be predicted. The user’s data model depends on the learning method used, such as decision tree, neural network, vector-based representation and so on. Content-based user profile requires historical data of the user, and the user profile model may change with the change of the user’s preference.

优点是:
(1)不需要其它用户的数据,没有冷开始问题和稀疏问题。
(2)能为具有特殊兴趣爱好的用户进行推荐。
(3)能推荐新的或不是很流行的项目,没有新项目问题。
(4)通过列出推荐项目的内容特征,可以解释为什么推荐那些项目。
(5)已有比较好的技术,如关于分类学习方面的技术已相当成熟。

缺点是:
它要求内容可以很容易地提取成有意义的特征,特征内容具有良好的结构,用户的品味必须以内容特征的形式表达,不能明确地得到其他用户的判断。

[En]

It requires that the content can be easily extracted into meaningful features, that the feature content has a good structure, and that the user’s taste must be expressed in the form of content features, and can not explicitly get the judgment of other users.

二、协同过滤推荐
概述:
协 同过滤推荐(Collaborative Filtering Recommendation)技术是推荐系统中应用最早和最为成功的技术之一。它一般采用最近邻技术,利用用户的历史喜好信息计算用户之间的距离,然后 利用目标用户的最近邻居用户对商品评价的加权评价值来预测目标用户对特定商品的喜好程度,系统从而根据这一喜好程度来对目标用户进行推荐。协同过滤最大优 点是对推荐对象没有特殊的要求,能处理非结构化的复杂对象,如音乐、电影。
协 同过滤是基于这样的假设:为一用户找到他真正感兴趣的内容的好方法是首先找到与此用户有相似兴趣的其他用户,然后将他们感兴趣的内容推荐给此用户。其基本 思想非常易于理解,在日常生活中,我们往往会利用好朋友的推荐来进行一些选择。协同过滤正是把这一思想运用到电子商务推荐系统中来,基于其他用户对某一内 容的评价来向目标用户进行推荐。

基于协同过滤的推荐系统可以说是站在用户的角度做出相应的推荐,而且是自动的,即用户获得的推荐是系统从购买模式或浏览行为等隐含获得的。用户不需要尝试寻找符合自己兴趣的推荐信息,例如填写一些调查表格。

[En]

The recommendation system based on collaborative filtering can be said to make the corresponding recommendation from the user’s point of view, and it is automatic, that is, the recommendation obtained by the user is implicitly obtained by the system from the purchase pattern or browsing behavior and so on. there is no need for users to try to find recommendation information that suits their interests, such as filling in some survey forms.

和基于内容的过滤方法相比,协同过滤具有如下的优点
(1) 能够过滤难以进行机器自动内容分析的信息,如艺术品,音乐等。
(2) 共享其他人的经验,避免了内容分析的不完全和不精确,并且能够基于一些复杂的,难以表述的概念(如信息质量、个人品味)进行过滤。
(3) 有推荐新信息的能力。可以发现内容上完全不相似的信息,用户对推荐信息的内容事先是预料不到的。这也是协同过滤和基于内容的过滤一个较大的差别,基于内容的过滤推荐很多都是用户本来就熟悉的内容,而协同过滤可以发现用户潜在的但自己尚未发现的兴趣偏好。
4) 能够有效的使用其他相似用户的反馈信息,较少用户的反馈量,加快个性化学习的速度。

虽然协同过滤作为一种典型的推荐技术已经有了相当大的应用,但仍然有很多问题需要解决。最典型的问题是稀疏问题(稀疏性)和可扩展性问题(可扩展性)。

[En]

Although collaborative filtering has considerable applications as a typical recommendation technology, there are still many problems to be solved. The most typical problems are sparse problem (Sparsity) and extensible problem (Scalability).

三、基于关联规则推荐
概述:
基 于关联规则的推荐(Association Rule-based Recommendation)是以关联规则为基础,把已购商品作为规则头,规则体为推荐对象。关联规则挖掘可以发现不同商品在销售过程中的相关性,在零 售业中已经得到了成功的应用。管理规则就是在一个交易数据库中统计购买了商品集X的交易中有多大比例的交易同时购买了商品集Y,其直观的意义就是用户在购 买某些商品的时候有多大倾向去购买另外一些商品。比如购买牛奶的同时很多人会同时购买面包。
在算法的第一步,关联规则的发现是最关键和最耗时的,这是算法的瓶颈,但可以离线进行。其次,商品名称的同义词也是关联规则中的一个难点。

[En]

In the first step of the algorithm, the discovery of association rules is the most critical and time-consuming, which is the bottleneck of the algorithm, but it can be carried out offline. Secondly, the synonym of commodity names is also a difficulty in association rules.

四、基于效用推荐
基 于效用的推荐(Utility-based Recommendation)是建立在对用户使用项目的效用情况上计算的,其核心问题是怎么样为每一个用户去创建一个效用函数,因此,用户资料模型很大 程度上是由系统所采用的效用函数决定的。基于效用推荐的好处是它能把非产品的属性,如提供商的可靠性(Vendor Reliability)和产品的可得性(Product Availability)等考虑到效用计算中。考虑使用用户对商品的评论等

五、基于知识推荐
基 于知识的推荐(Knowledge-based Recommendation)在某种程度是可以看成是一种推理(Inference)技术,它不是建立在用户需要和偏好基础上推荐的。基于知识的方法因 它们所用的功能知识不同而有明显区别。效用知识(Functional Knowledge)是一种关于一个项目如何满足某一特定用户的知识,因此能解释需要和推荐的关系,所以用户资料可以是任何能支持推理的知识结构,它可以 是用户已经规范化的查询,也可以是一个更详细的用户需要的表示。考虑利用用户浏览,购买,搜索建立用户的兴趣集。

六、组合推荐
由 于各种推荐方法都有优缺点,所以在实际中,组合推荐(Hybrid Recommendation)经常被采用。研究和应用最多的是内容推荐和协同过滤推荐的组合。最简单的做法就是分别用基于内容的方法和协同过滤推荐方法 去产生一个推荐预测结果,然后用某方法组合其结果。尽管从理论上有很多种推荐组合方法,但在某一具体问题中并不见得都有效,组合推荐一个最重要原则就是通 过组合后要能避免或弥补各自推荐技术的弱点。

在组合方式上,有研究人员提出了七种组合思路

[En]

In the way of combination, some researchers have put forward * seven combination ideas * :

(1)加权(Weight):加权多种推荐技术结果。
(2)变换(Switch):根据问题背景和实际情况或要求决定变换采用不同的推荐技术。
(3)混合(Mixed):同时采用多种推荐技术给出多种推荐结果为用户提供参考。
(4)特征组合(Feature combination):组合来自不同推荐数据源的特征被另一种推荐算法所采用。
(5)层叠(Cascade):先用一种推荐技术产生一种粗糙的推荐结果,第二种推荐技术在此推荐结果的基础上进一步作出更精确的推荐。
(6)特征扩充(Feature augmentation):一种技术产生附加的特征信息嵌入到另一种推荐技术的特征输入中。
(7)元级别(Meta-level):用一种推荐方法产生的模型作为另一种推荐方法的输入。

七、主要推荐方法的对比

每种推荐方法都有自己的优缺点,如表1所示。

[En]

Each recommendation method has its own advantages and disadvantages, as shown in Table 1.

基于内容的推荐算法的优点和缺点是直观和易于解释的;不需要领域知识稀疏问题;新的用户问题;复杂的属性很难处理;要有足够的数据来构造分类器协同过滤推荐新的兴趣发现,不需要领域知识;随着时间的推移提高性能;推荐个性化,自动化程度高;可以处理复杂的非结构化对象稀疏问题;新用户问题;质量依赖于历史数据集;推荐质量在系统开始时质量较差;基于规则的推荐可以发现新的兴趣点;没有领域知识规则提取困难和耗时;产品名称同义词问题;个性化程度低;基于效用的推荐没有冷启动和稀疏问题;对用户偏好的变化敏感;可以考虑非产品特征,用户必须输入效用函数推荐是静态的,灵活性较差;属性重叠问题;基于知识的推荐可以将用户需求映射到产品;可以考虑非产品属性知识难以获取;推荐是静态的

[En]

Advantages and disadvantages of recommendation algorithm based on content recommendation results are intuitive and easy to explain; do not need domain knowledge sparse problem; new user problem; complex attributes are difficult to deal with; to have enough data to construct classifier collaborative filtering recommendation new interest discovery, do not need domain knowledge; with time to improve performance; recommendation personalization, a high degree of automation; can deal with complex unstructured object sparse problem Scalability problems; new user problems; quality depends on historical data sets; poor quality of recommendation at the beginning of the system; rule-based recommendation can find new points of interest; no domain knowledge rule extraction is difficult and time-consuming; product name synonym problem; low degree of personalization; based on utility recommendation without cold start and sparse problems; sensitive to changes in user preferences; can consider non-product characteristics users must enter utility function Recommendation is static and less flexible; attribute overlap problem; knowledge-based recommendation can map user requirements to the product; can consider that non-product attribute knowledge is difficult to obtain; recommendation is static

Original: https://blog.csdn.net/wyyang2/article/details/115368943
Author: sunny&
Title: 常用推荐算法

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/6482/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

最近整理资源【免费获取】:   👉 程序员最新必读书单  | 👏 互联网各方向面试题下载 | ✌️计算机核心资源汇总