rapidminer进行关联分析、分类预测、聚类分析

商品交叉销售关联分析

Step1:检查数据缺失值、异常值
Step2:约减数据集中属性

rapidminer进行关联分析、分类预测、聚类分析
; Step3:FP-Growth找到频繁项集

rapidminer进行关联分析、分类预测、聚类分析
Step4:产生关联规则

FF-Growth的min support = 0.9和create association rules min confidence = 0.9时的关联规则

rapidminer进行关联分析、分类预测、聚类分析
但是结论conclusion都是Health Profucts Division,说明健康类商品是人们的生活必需品,参考价值不大。

我们适当放宽min support = 0.5和min confidence = 0.6

rapidminer进行关联分析、分类预测、聚类分析
发现当Housewares Division,Novelty Gift Division存在时,Personal Electronics Division更容易被购买。support = 0.108

; 泰塔尼克号幸存者分类预测

step1:角色设定
step2:加入决策树操作符

rapidminer进行关联分析、分类预测、聚类分析
; step3:对测试数据集预测

rapidminer进行关联分析、分类预测、聚类分析
step4:交叉检验

rapidminer进行关联分析、分类预测、聚类分析
rapidminer进行关联分析、分类预测、聚类分析
confidence = 0.5时的class precision = 76.52%和83.33%。
rapidminer进行关联分析、分类预测、聚类分析
例如更改confidence = 0.1时,class precision = 75.07%和83.42%,相比之下confidence = 0.5的时候交叉检验效果更好一些。
rapidminer进行关联分析、分类预测、聚类分析
调整决策树操作符的criterion参数,其中gain_ratio参数模型得到的效果明显好于gini_index参数。

gini_index参数

rapidminer进行关联分析、分类预测、聚类分析
gain_ratio参数
rapidminer进行关联分析、分类预测、聚类分析

; Iris鸢尾花数据集聚类分析

step1:选择a1和a2属性
step2:添加K-means聚类操作符
step3:调整聚类个数,查看散点个数,人工评价聚类效果。

得到每个点的聚类结果

rapidminer进行关联分析、分类预测、聚类分析
可视化表示聚类分析

此处选择的聚类个数是3,即k = 3

rapidminer进行关联分析、分类预测、聚类分析
若选择聚类个数为5
rapidminer进行关联分析、分类预测、聚类分析
聚类分析 k = 5
rapidminer进行关联分析、分类预测、聚类分析

Original: https://blog.csdn.net/weixin_46530492/article/details/118495021
Author: Cachel wood
Title: rapidminer进行关联分析、分类预测、聚类分析

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/665466/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球