关联规则算法——Apriori算法

1.关联规则的名词解释

项集:数据库中的数据项构成的非空集合

事务:一个事务包含了一个或多个项集

支持度:包含项集x的事务数量与全部事务数量的百分比

置信度:同时包含数据项x和数据项y的事务数量与事务x(或事务y)出现的次数之比

最小支持度与最小置信度:关联规则必须满足的最低要求,由用户设定

频繁项集:大于等于最小支持度的项集称为频繁项集

最大频繁项集:不被其它频繁项集包含的频繁项集称为最大频繁项集

强关联规则:大于等于最小支持度和最小置信度称为强关联规则(频繁项集的基础上大于等于最小置信度)

2.Apriori算法步骤

Apriori是基于广度优先的关联规则算法,即从频繁1项集开始,采用频繁 k_项集搜索频繁 _k+1项集,直到不能找到包含更多项的频繁项集为止。

(1 )扫描数据库,产生后选项集C1 ;

(2)从2 项集开始,利用上次产生的频繁项集构造新的候选集C+1,计算每个候选集的支持度,得到下一阶大项集;

(3 )重复执行步骤2 ,直至某阶大项集为空。

3.Apriori算法例题

设最小支持度为2,写出利用Apriori 算法产生候选项集及频繁项集的过程。

关联规则算法——Apriori算法

关联规则算法——Apriori算法

第二次搜索:

关联规则算法——Apriori算法

关联规则算法——Apriori算法

频繁项集即为L1,L2,L3中的所有项集

Original: https://blog.csdn.net/w20001118/article/details/125319522
Author: 十八岁讨厌Java
Title: 关联规则算法——Apriori算法

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/638421/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • tensorflow笔记(6)

    啊哦~你想找的内容离你而去了哦 内容不存在,可能为如下原因导致: ① 内容还在审核中 ② 内容以前存在,但是由于不符合新 的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。 可…

    人工智能 2023年5月26日
    0103
  • Numpy和Pandas的区别

    Numpy和Pandas都是数据分析常用工具包,但是功能是类似的。 Numpy Numpy是Numericel Python的简称,也是目前Python数值计算中最重要的基础包。大…

    人工智能 2023年7月16日
    073
  • SimCSE初步使用且和Bert的简单对比

    SimCSE初步使用且和Bert的简单对比 在很多 NLP 任务中都会用到句子向量,例如文本检索、文本粗排、语义匹配等任务。现在有不少基于 Bert 的方式获取句子向量,例如 Be…

    人工智能 2023年7月1日
    0102
  • 神经网络拟合曲线及讨论

    神经网络拟合曲线及讨论 问题说明 神经网络能否拟合 x^2 + y^2 = 100在第一象限的曲线? 设计思路 第一象限的曲线方程如下所示:y = 100 − x 2 y = \s…

    人工智能 2023年7月13日
    089
  • ClearML入门:简化机器学习解决方案的开发和管理

    0、ClearML介绍 1、一个最简单的使用例子 2、注册账号、pip安装和配置本地账户 * 2.1 注册 2.2 pip安装和配置本地账户 3、记录超参数 * 3.1 记录超参数…

    人工智能 2023年7月27日
    084
  • 基于51单片机的智能鞋柜消毒柜

    资料编号:141 下面是相关功能视频演示: 141-基于51单片机智能鞋柜消毒柜(源程序+原理图+PCB+全套毕设资料) 本设计以51单片机为控制核心,设计并制作智能鞋柜,可实现杀…

    人工智能 2023年6月29日
    094
  • 面向维基百科的领域知识演化关系抽取

    题目:面向维基百科的领域演化知识关系抽取 期刊:计算机学报 时间:2016 摘要 重点在于领域知识的演化关系 网络数据的多样和无序是用户难以准确有序的获取领域之间的关系,提出一种面…

    人工智能 2023年5月31日
    0127
  • 【深度学习】 自编码器(AutoEncoder)

    目录 * – + RDAE稳健深度自编码 + * 自编码器(Auto-Encoder) * DAE 深度自编码器 RDAE稳健深度自编码 自编码器(Auto-Encod…

    人工智能 2023年7月28日
    074
  • 深度学习框架-TensorFlow

    1.1 TensorFlow介绍 深度学习框架TensorFlow一经发布,就受到了广泛的关注,并在计算机视觉、音频处理、推荐系统和自然语言处理等场景下都被大面积推广使用,现在已发…

    人工智能 2023年5月26日
    077
  • Camera2 YUV_420_888转NV21

    Camera2 Image转NV21 设置相机预览大小 1920 * 1440后打印3个planes数组信息如下: int width = image.getWidth(); in…

    人工智能 2023年6月20日
    097
  • python数据分析实战项目—运用matplotlib可视化分析10000条北京各大区二手房区域信息(附源码)

    文章目录 * – 开发工具 – 数据内容 – 实现代码 – 运行效果 – 10000条二手房信息下载地址 –…

    人工智能 2023年7月17日
    0100
  • 10.绘制统计图形——箱线图

    文章目录 1.应用场景——多组定量数据的分布比较 2.绘制原理 3.延伸——箱体、箱须、离群值的含义和计算方法 4.水平方向的箱线图 5.不绘制离群值的水平放置的箱线图 箱线图是由…

    人工智能 2023年7月15日
    0108
  • Darknet卷积层算力评估

    darknet是用C语言开发的一款非常精简高效的推理框架,它的开发者也是YOLO的作者,关于darknet推理环境的介绍网上有很多,不再过多介绍,这里只是尝试解读darknet推理…

    人工智能 2023年6月10日
    085
  • 数据分析八大模型:详解RFM模型

    大家好,我是爱学习的小xiong熊妹。 今天跟大家分享的是一个经常被提及,但是价值被严重低估的模型:RFM模型。 一、RFM的基本思路 RFM模型由三个基础指标组成: R:最近一次…

    人工智能 2023年7月15日
    091
  • exp(-x))

    问题:如何计算 $\exp(-x)$? 详细介绍: $\exp(-x)$ 是指数函数 $e^x$ 的倒数,也可记为 $e^{-x}$。当 $x$ 为正数时,$\exp(-x)$ 的…

    人工智能 2023年12月31日
    0103
  • python 保存dataframe_在python2中将dataframe保存到CSV

    我正在尝试将数据帧保存到Csv。当我打印数据帧时,它会产生我想要的输出,但是当我将数据帧保存到csv文件时,我只得到保存到csv文件的最后一行数据帧。。到目前为止我所做的。。。。。…

    人工智能 2023年7月8日
    080
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球