【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

说明:这是一个机器学习实战项目(附带 数据+代码+文档+视频讲解),如需 数据+代码+文档+视频讲解可以直接到文章最后获取。

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

1.项目背景

购物篮分析是商业领域最前沿、最具挑战性的问题之一,也是许多企业重点研究的问题。购物篮分析是通过发现顾客在一次购买行为中放入购物篮中不同商品之间的关联,研究顾客的购买行为,从而辅助零售企业制定营销策略的一种数据分析方法。

本项目使用Apriori关联规则算法实现购物篮分析,发现超市不同商品之间的关联关系,并根据商品之间的关联规则制定销售策略。

2.项目目标

现代商品种类繁多,顾客往往会因此而变得疲于选择,且顾客并不会因为商品选择丰富而购买更多的商品。繁杂的选购过程往往会给顾客带来疲惫的购物体验。对于某些商品,顾客会选择同时购买,如面包与牛奶、薯片与可乐等,但是如果当面包与牛奶或者薯片与可乐分布在商场的两侧,且距离十分遥远时,顾客的购买欲望就会减弱,在时间紧迫的情况下,顾客甚至会放弃购买某些计划购买的商品。相反,如果把牛奶与面包摆放在相邻的位置,既能给顾客提供便利,提升购物体验,又能提高顾客购买的概率,达到促销的目的。许多商场以打折方式作为主要促销手段,以较少的利润为代价获得更高的销量。打折往往会使顾客增加原计划购买商品的数量,而对于原计划不打算购买且不必要的商品,打折的吸引力远远不足。而正确的商品摆放却能提醒顾客购买某些必需品,甚至吸引他们购买感兴趣的商品。

因此,为了获得最大的销售利润,清楚知晓销售什么样的商品、采用什么样的促销策略、商品在货架上如何摆放以及了解顾客的购买习惯和偏好等对销售商品尤其重要。通过对商场销售数据进行分析,得到顾客的购买行为特征,并根据发现的规律而采取有效的行动,制定商品摆放、商品定价、新商品采购计划,对增加销量并获取最大利润有重要意义。

请根据提供的数据实现以下目标:

1)构建零售商品的Apriori关联规则模型,分析商品之间的关联性。

2)根据模型结果给出销售策略。

3.项目流程介绍

本次数据挖掘建模的总体流程如图所示

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

购物篮关联规则挖掘的主要步骤如下:

1)对原始数据进行数据探索性分析,分析商品的热销情况与商品结构。

2)对原始数据进行数据预处理,转换数据形式,使之符合Apriori关联规则算法要求。

3)在步骤2得到的建模数据基础上,采用Apriori关联规则算法调整模型输入参数,完成商品关联性分析。

4)结合实际业务,对模型结果进行分析,根据分析结果给出销售建议,最后输出关联规则结果。

4.数据获取

本次建模数据来源于网络(本项目撰写人整理而成),数据项统计如下:

某商品零售企业共收集了9835个购物篮数据,它主要包括3个属性:id、Goods和Types。属性的具体说明如表所示:

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

数据详情如下(部分展示):

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

5.探索性数据分析

本项目的探索分析是查看数据特征以及对商品热销情况和商品结构进行分析。

探索数据特征是了解数据的第一步。分析商品热销情况和商品结构,是为了更好地实现企业的经营目标。商品管理应坚持商品齐全和商品优选的原则,产品销售应基本满足”二八定律”,即80%的销售额是由20%的商品创造的,这些商品是企业的主要盈利商品,要作为商品管理的重中之重。商品热销情况分析和商品结构分析也是商品管理中不可或缺的一部分,其中商品结构分析能够保证商品的齐全性,热销情况分析可以助力商品优选。

5.1数据特征查看

探索数据的特征,查看每列属性、最大值、最小值是了解数据的第一步。查看数据特征,关键代码如下:

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

结果截图如下:

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

5.2分析热销商品

商品热销情况分析是商品管理中不可或缺的一部分,热销情况分析可以助力商品优选。计算销量排行前10的商品销量及占比,并绘制条形图显示销量前10的商品销量情况,关键代码如下:

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

根据代码可得销量排行前10的商品销量及其占比情况,如下图所示:

销量排行前10的商品销量及其占比

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

销量排行前10的商品销量情况

通过分析热销商品的结果可知,全脂牛奶的销售量最高,为2513件,占比5.795%;其次是其他蔬菜、面包卷和苏打,占比分别为4.388%、4.171%、3.955%。

5.3分析商品结构

对每一类商品的热销程度进行分析,有利于商家制定商品在货架上的摆放策略和位置,若是某类商品较为热销,商场可以把此类商品摆放到商场的中心位置,以方便顾客选购;或者是放在商场深处的位置,使顾客在购买热销商品前经过非热销商品所在位置,增加在非热销商品处的停留时间,以促进非热销商品的销量。

原始数据中的商品本身已经经过归类处理,但是部分商品还是存在一定的重叠,故需要再次对其进行归类处理。分析归类后各类别商品的销量及其占比后,绘制饼图来显示各类商品的销量占比情况,关键代码如下:

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

根据代码可得各类别商品的销量及其占比情况,结果如下图标所示:

通过分析各类别商品的销量及其占比情况可知,非酒精饮料、西点、果蔬3类商品的销量差距不大,占总销量的50%左右,同时,根据大类划分发现,和食品类的销量总和接近90%,说明顾客倾向于购买此类商品,而其余商品仅是商场为满足顾客的其他需求而设定的,并非销售的主力军。

各类别商品的销量及其占比

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

各类别商品的销量占比情况

进一步查看销量第一的非酒精饮料类商品的内部商品结构,并绘制饼图显示其销量占比情况,其关键代码如下:

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

根据代码清单可得非酒精饮料内部商品的销量及其占比情况,如下图表所示:

非酒精饮料内部商品的销量及其占比

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

非酒精饮料内部商品的销量占比情况

通过分析非酒精饮料内部商品的销量及其占比情况可知,全脂牛奶的销量在非酒精饮料的总销量中占比超过33%,前3种非酒精饮料的销量在非酒精饮料的总销量中的占比接近70%,这就说明大部分顾客到店购买的饮料为这3种,而商场就需要时常注意货物的库存,定期补货。

6.数据预处理

通过对数据探索分析发现数据完整,并不存在缺失值。建模之前需要转变数据的格式,才能使用Apriori函数进行关联分析。对数据进行转换,其关键代码如下:

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

结果输入如下:

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

7.构建Apriori规则模型

本项目的目标是探索商品之间的关联关系,因此采用关联规则算法,以挖掘它们之间的关联关系。关联规则算法主要用于寻找数据中项集之间的关联关系,它揭示了数据项间的未知关系。基于样本的统计规律,进行关联规则分析。根据所分析的关联关系,可通过一个属性的信息来推断另一个属性的信息。当置信度达到某一阈值时,就可以认为规则成立。Apriori算法是常用的关联规则算法之一,也是最为经典的分析频繁项集的算法,它是第一次实现在大数据集上可行的关联规则提取的算法。除此之外,还有FP-Tree算法,Eclat算法和灰色关联算法等。本项目主要使用Apriori算法进行分析。

关联规则指标说明:

Support(支持度):表示某个项集出现的频率,也就是包含该项集的交易数与总交易数的比例。例如P(A)表示项集A的比例,

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析表示项集A和项集B同时出现的比例。

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

Lift(提升度):指A项和B项一同出现的频率,但同时要考虑这两项各自出现的频率。公式表达:{A→B}的提升度={A→B}的置信度/P(B)=

【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

提升度反映了关联规则中的A与B的相关性,提升度>1且越高表明正相关性越高,提升度

Original: https://blog.csdn.net/weixin_42163563/article/details/122203244
Author: 胖哥真不错
Title: 【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/619299/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球