Apriori算法进行关联分析

2023年7月8日下午3:00 • 人工智能 • 阅读 108

1.创建DataFrame对象
传入数据可以是字典和嵌套列表。字典的创建为DataFrame对象的列名，值为数据
列表元素作为DataFrame对象的行数据显示，从0开始
pd.DataFrame(data,columns=[‘ ‘,’ ‘,’ ‘]),columns为列表时，与传入DataFrame列表元素长度一致。
对列索引（列名）进行重新赋值。data.columns = [‘a’,’b’,’c’]——（新列名）
2.默认按升序对数据进行排列：
data.sort_values(by=’列名’)
单列排序：data[‘列名’].sort_values()
3.重置索引

参数说明示例drop布尔值：默认为False，保留原索引；值为True，去掉原索引data.reset_index(drop=True)

4.数值四舍五入
data[‘列名’]=round(data[‘列名’]，2)
round(data,ndigits)函数，data为要进行四舍五入的数据，ndigits为要保留的小数位数，默认为0
5.agg()方法
定义函数 new_func()(函数名随意)
使用agg()方法将操作列的每个数据传入new_func()函数进行计算，并取得函数的返回值
传入自定义函数时，只需要写上函数名，不需要加上括号以及函数参数。agg(new_func)
方法内传入字典:dict={‘columns’:’sum’,’columns’:’mean’}
eg:data.groupby(‘名称’).agg(dict)

1.①：关联分析
各组数据之间的联系
交易中不同物品可称为一个项，k个项组成的项集，叫k项集，项集内不存在相同的项
每条交易记录可称为一个事务
②：支持度：
项集在事务中出现的概率（频率）
{X}的支持度={X}在事务中出现的次数 / 事务总数
人为设定支持度，名为最小支持度>=最小支持度的项集被称为频繁项集。
③：关联规则
探索数据之间的联系（某种关联）
{X}（前件）—–>{Y}（后件）（X和Y之间存在相同项）
④：置信度
衡量关联关系的可靠程度，在前件出现的情况下，后件出现的概率。
关联规则{X}—–>{Y}的置信度={X,Y}的支持度 / {X}的支持度
人为设定置信度，名为最小置信度>=最小置信度叫做强关联规则
⑤：提升度
事务各自的影响程度
{X}—->{Y}的提升度={X}—->{Y}的置信度 / {Y}的支持度
={X,Y}的支持度 / {X}、{Y}的支持度
提升度

参数含义transactions事务集合min_support最小支持度min_confidence最小置信度min_lift最小提升度

导入apyori模块下apriori函数
from apyori import apriori
是一个生成器对象，通过循环遍历访问其数据。
关系记录：RelationRecord:频繁项集，支持度，统计列表（ordered_statistics)
核心算法

list1 = []

for result in results:

    support = round(result.support,3)

    for rule in result.ordered_statistics:

        head_set = list(rule,items_base)
        tail_set = list(rule,items_add)

        if head_set == []:continue

        related_catogory = str(head_set) + '--->' + str(tail_set)

        confidence = round(rule.confidence,3)

        lift = round(rule.lift,3)

        list1.append(related_catogory,support,confidence,lift)

Original: https://blog.csdn.net/doarwh/article/details/117278954
Author: 小枍~
Title: Apriori算法进行关联分析

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/678725/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

PSM+DID 效果评估python demo 、线性分类模型+双重差分法

需求背景：策略不适用随机分流，在某部分人群全量上线，需要同通过构建相似人群的方式，对策略进行评估。评估方案： 1、使用PSM构建相似人群，确保实验组与对照组在AA期的评估指标趋…

人工智能 2023年7月16日
0049
Linux卸载以及离线安装tensorflow-gpu 2.4.0、cuda11.0、cudnn 8.0

问题：cuda10.1不支持sm_80算力，所以需要重装一系列，使cuda是11.0。环境：Centos 7 有Anaconda、python36 最好是照搬环境，再闹一次，免得…

人工智能 2023年5月23日
0061
神经网络声码器

文章目录 * – ParallelWaveGan – + 背景 + 改进点 – MelGan – + method – …

人工智能 2023年7月13日
0060
微信语音怎么转发给别人听_微信语音消息如何转发给别人？原来方法这么简单！看完涨知识了…

在使用微信的过程中，大家应该都能发现，无论是通过微信自带的[逐条转发]，还是通过[合并转发]，都无法将微信语音信息直接转发给他人。无法成功转发语音消息！ [En] In the p…

人工智能 2023年5月27日
0069
C# 第九章『图形、图像』◆第3节：图像处理、Image类、Bitmap 类

一、概述位图由图形图像及其属性的像素数据组成。有许多标准格式用于将位图保存到文件。 GDI+支持以下文件格式：BMP、GIF、EXIF、JPG、PNG 和 TIFF。 GDI+…

人工智能 2023年6月17日
0063
知识图谱编辑器(KG-Editor)

仅供学习交流使用！基于 Vue 2.x + G6 3.8 + Vuetify 的可视化知识图谱编辑器(KG-Editor) 效果截图 ; 试用地址 KG-Editor 功能介绍 …

人工智能 2023年6月1日
00161
FLASH安全介绍—攻击示例以及解决方案

不允许添加，这样会导致客户端可能自己加载自定义策略文件。 2 、客户端嵌入flash 文件的安全配置： 1 ）禁止设置 flash 的 allowscriptaccess 为 a…

人工智能 2023年6月27日
0061
机器学习朴素贝叶斯分类食品安全新闻

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档目录文章目录前言一、预备知识 1.基本概念 2.贝叶斯公式二、朴素贝叶斯原理 1.判别模型和生成模型 2….

人工智能 2023年7月2日
0066
时间序列分析–移动平均法预测模型

时间序列是按时间顺序排列的、随时间变化且相互关联的数据序列。分析时间序列的方法构成数据分析的一个重要领域，即时间序列分析。如果在预测时间范围以内，无突然变动且随机变动的方差较小…

人工智能 2023年6月19日
0077
联邦学习 | Non-IID数据论文：测量联邦视觉分类中不相同数据分布的影响

主要内容： 1、基于迪利克雷分布，提出了一种FL中Non-IID数据的生成方法； 2、对不同程度的Non-IID数据下，进行了较多的对比试验，研究客户端数据量、本地迭代轮数、学习率…

人工智能 2023年7月1日
0063
Ubuntu20.04 配置tensorflow环境

Ubuntu20.04配置tensorflow 1、英伟达驱动安装英伟达官网： NVIDIA 引领人工智能计算 | NVIDIA 右上角”驱动程序”，选择…

人工智能 2023年5月25日
00105
CHIP-2020 中文医学文本实体关系抽取

这个项目的本质是———–医学文本的实体关系联合抽取问题，既要解决命名实体识别，又要解决关系分类问题。使用RoFormerV2模型作为…

人工智能 2023年5月27日
0061
Python三目运算符（三元运算符）用法详解（含Python代码）

一、前言三目运算符，又称条件运算符，是计算机语言（c,c++,java等）的重要组成部分。它是唯一有3个操作数的运算符，有时又称为三元运算符。定义：对于条件表达式 b ? x…

人工智能 2023年7月4日
0050
自注意机制Self-attention

1.问题提出 1.1 Vector Set as Input 传统机器学习输入是一个向量，序列问题输入是一组向量自然语言处理的常见模型：One-hot Encoding，Word…

人工智能 2023年5月28日
0078
什么是AMQP？

AMQP，即Advanced Message Queuing Protocol（高级消息队列协议），一个提供统一消息服务的应用层标准高级消息队列协议，是应用层协议的一个开放标准，为…

人工智能 2023年6月28日
0066

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Apriori算法进行关联分析

大家都在看