如何评估推荐系统的健康状况？

2023年6月4日上午9:36 • 人工智能 • 阅读 106

AB测试

在线评估通常会结合AB测试

什么是AB测试

AB测试本质为对照实验，来源于医学的双盲测试，通过给两组病人不同的药物，来确定药物是否有效。

AB测试：将不同的算法/策略，在同一时间维度，分别在两组或者多组组成成分相同的用户群体内容进行线上测试，分析各组用户的行为指标，得到可以真正全流量上线的算法和策略

AB测试常见做法

核心：控制变量、分流测试、规则统一

控制变量

AB测试必须是单变量的，变量太多会产生干扰，很难找到各个变量对结果的影响程度。

分流测试

AB测试作为对照试验，自然要有试验组和对照组。通常会对用户进行分流

用户ID
设备号
浏览器cookie
约定生成的伪随机数，0，1大数定律

规则统一

在控制变量和分流测试的前提下，针对不同的流量，应制定相同的评价指标，才能得到准确的对比效果。

Original: https://www.cnblogs.com/oceaneyes-gzy/p/12334292.html
Author: OCEANEYES.GZY
Title: 如何评估推荐系统的健康状况？

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/566955/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

具有多个目标变量的回归模型(Regression Models with multiple target variables)

classification/Regression 机器学习分类器通常支持单个目标变量。在回归模型的情况下，目标是实值的，而在分类模型中，目标是二值或多值的。对于分类模型，具有多个…

人工智能 2023年6月17日
0078
AlloyDesigner 使用

前端开发视觉是很重要的一部分，所以视觉的还原度很重要，今天给大家介绍一个很好用的视觉精度调整插件 1.psd 用ps直接保存为jpg等图片格式 2.获取视觉图片，保存为原来的视觉稿…

人工智能 2023年6月6日
0061
常用的优化器合集

目录一、优化器二、各优化器 1、梯度下降法 1.1梯度下降（GD） 1.2、随机梯度下降（SGD） 1.3、小批量梯度下降法（MBGD） 1.4传统梯度优化的不足(BGD,SG…

人工智能 2023年7月26日
00333
不经意传输扩展(OTE)-不经意伪随机函数(OPRF)-隐私集合求交(PSI)

即上篇《Efficient Batched Oblivious PRF with Applications to Private Set Intersection》(CCS2016…

人工智能 2023年6月25日
00111
Anaconda如何安装库（包）？

博主的专业是地理信息，并不是编程这个专业的，但是地理信息这个专业就很难受，想学好这个专业，像做一些科研方面的工作，就必须用到编程的知识。并且平时老师也会留一些作业要用到代码来完成，…

人工智能 2023年7月30日
00154
实例分割: 一文读懂 E2EC (CVPR 2022)

论文：E2EC：An End-to-End Contour-based Method for High-Quality High-Speed Instance Segmentati…

人工智能 2023年7月12日
0058
34_Pandas对CSV文件内容的导出和添加（to_csv）

如果要将panda.DataFrame或pandas.Series数据导出为csv文件或将其添加到现有的csv文件中，请使用to_csv（）方法。由于分隔符可以更改，因此也可以将其…

人工智能 2023年7月8日
0093
BSV上的高效 zk-SNARK：技术解释

最近，我们在 sCrypt 中实现了 zk-SNARKs，并在 BSV 上运行它。更具体地说，我们实现了 Groth16 算法的验证器，它允许直接在链上验证零知识证明。本文深入探讨…

人工智能 2023年6月27日
0075
SETTLE约束算法中的坐标变换问题

技术背景在之前的两篇文章中，我们分别讲解了SETTLE算法的原理和基本实现和SETTLE约束算法的批量化处理。SETTLE约束算法在水分子体系中经常被用到，该约束算法具有速度快、…

人工智能 2023年6月4日
0080
Python pandas包读取excel文件教程

Python读取Excel文件教程现在，我们将演示如何使用Python语言读取Excel文件内容。或许你会觉得这样读取Excel文件内容是非常困难的，事实并非如此，我们将逐步实现…

人工智能 2023年7月15日
0053
pandas的DataFrame中出现多数据类型的检查(一列中有多个类型）

在pandas中，如果需要查看column的类型，一般使用 df.dtypes 方法，它将返回每个列的数据类型，但是如果涉及到多个类型，该方法只能返回一个类型，比如 frame =…

人工智能 2023年7月8日
0066
【深度学习】mmclassification mmcls 实战多标签分类任务教程，分类任务

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月30日
0062
中国智能座舱行业发展前景展望与投资战略规划研究报告2022年版

中国智能座舱行业发展前景展望与投资战略规划研究报告2022年版═━┈┈━══━┈┈━══━┈┈━══━ 【出版机构】: 中商经济研究网第一章智能座舱行业概述第一节智能座舱行…

人工智能 2023年6月11日
0058
C语言日记 34 析构函数

上一节的：例8-9构造函数重载。（其实应该放到 C语言日记 33 构造函数，但析构函数可以讲的内容太少了）源程序： #include using namespace std; …

人工智能 2023年6月29日
0060
数据分析师必备的六大技能，你都掌握了吗？

数据分析是对原始数据进行分析的过程，从中我们可以得出对公司有利的见解，这些见解对于驱动明智的商业决策至关重要。数据分析师所做的就是，把所有这些复杂的数据拼图拿出来重新组合，转化成你…

人工智能 2023年7月17日
0048
python复制dataframe_Python Pandas复制和修改datafram中的一些行

我觉得在熊猫身上没有什么特别好的方法。每当一个DataFrame包含一列列表，并且您想进行某种需要在列表上迭代的计算，您就必须为列中的每个项(即list)调用一次Python函数…

人工智能 2023年7月7日
0058

如何评估推荐系统的健康状况？

推荐系统的常见指标

用户角度

精准度

惊喜度

新颖性

多样性

平台角度

内容满意度

场景转化率

pv点击率（点击量/pv）

uv点击率（点击量/uv）

曝光点击率（点击量/曝光次数）

uv转化率（转化次数/点击量）

人均点击次数（点击量/点击uv数）

推荐系统的离线评估

准确度

分类问题

评分预测

排序问题

覆盖率

多样性

时效性

推荐系统的在线评估

触发推荐服务

稳定性

高并发

响应时间

产生行为

AB测试

什么是AB测试

AB测试常见做法

控制变量

分流测试

规则统一

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

如何评估推荐系统的健康状况？

推荐系统的常见指标

用户角度

精准度

惊喜度

新颖性

多样性

平台角度

内容满意度

场景转化率

pv点击率（点击量/pv）

uv点击率（点击量/uv）

曝光点击率（点击量/曝光次数）

uv转化率（转化次数/点击量）

人均点击次数（点击量/点击uv数）

推荐系统的离线评估

准确度

分类问题

评分预测

排序问题

覆盖率

多样性

时效性

推荐系统的在线评估

触发推荐服务

稳定性

高并发

响应时间

产生行为

AB测试

什么是AB测试

AB测试常见做法

控制变量

分流测试

规则统一

大家都在看