ZBLOG

题目:基于订单数据的关联规则挖掘 任务背景: 在这次任务中,你需要使用关联规则挖掘技术来分析一组订单数据。这些数据包括订单ID、产品名称、类别名称、类别描述、单价和数量。你的任务是找出在这些订单中哪些产品类别经常一起出现,并分析其支持度、置信度和提升度。 数据描述: 数据集包含以下列: • OrderID:订单编号 • ProductName:产品名称 • CategoryName:产品类别 • CategoryName_Description:类别描述 • Per_Price:单价...

下面是按照您提供的步骤实现的代码:

import pandas as pd
from apyori import apriori

# 读取Excel文件
df = pd.read_excel('订单数据.xlsx')

# 显示数据预览
print(df.head())

# 获取交易项集
transactions = df.groupby('OrderID')['CategoryName'].apply(list)

# 进行关联规则挖掘
min_support = 0.1 # 最小支持度
min_confidence = 0.5 # 最小置信度
min_lift = 1.2 # 最小提升度

results = list(apriori(transactions, min_support=min_support, min_confidence=min_confidence, min_lift=min_lift))

# 提取并显示关联规则
rules_data = []
for result in results:
    support = result.support
    for item in result.ordered_statistics:
        base_items = ', '.join(item.items_base)
        add_items = ', '.join(item.items_add)
        confidence = item.confidence
        lift = item.lift
        
        rules_data.append([base_items, add_items, support, confidence, lift])

rules_df = pd.DataFrame(rules_data, columns=['Base Items', 'Add Items', 'Support', 'Confidence', 'Lift'])
print(rules_df.tail(8))

请确保将代码中的订单数据.xlsx替换为实际的数据文件路径。此代码通过Apriori算法进行关联规则挖掘,并从结果中提取支持度、置信度、提升度等信息,存储在DataFrame中并显示最后8行结果。


内容由零声教学AI助手提供,问题来源于学员提问

本站部分文章来源于网络,版权归原作者所有,如有侵权请联系站长删除。
转载请注明出处:https://sdn.0voice.com/?id=4314

分享:
扫描分享到社交APP
上一篇
下一篇
发表列表
游客 游客
此处应有掌声~
评论列表

还没有评论,快来说点什么吧~

联系我们

在线咨询: 点击这里给我发消息

微信号:3007537140

上班时间: 10:30-22:30

关注我们
x

注册

已经有帐号?