ZBLOG

数据描述: 数据集包含以下列: • OrderID:订单编号 • ProductName:产品名称 • CategoryName:产品类别 • CategoryName_Description:类别描述 • Per_Price:单价 • Quantity:数量 代码步骤: 1. 导入必要的库: • pandas 用于数据处理。 • apyori 用于执行 Apriori 关联规则挖掘。 2. 读取 Excel 文件: • 使用 pd.read_excel 读取 Excel 文件,并将数...

以下是按照您提供的步骤编写的代码示例:

import pandas as pd
from apyori import apriori

# 读取 Excel 文件
df = pd.read_excel("your_file.xlsx")

# 显示数据预览
print(df.head())

# 获取交易项集
transactions = df.groupby("OrderID")["CategoryName"].apply(list)

# 进行关联规则挖掘
min_support = 0.1 # 最小支持度
min_confidence = 0.5 # 最小置信度
min_lift = 1.0 # 最小提升度

results = list(apriori(transactions, min_support=min_support, min_confidence=min_confidence, min_lift=min_lift))

# 提取并显示关联规则
rules_data = []
for result in results:
    support = result.support
    for item in result.items_ordered:
        base_items = ', '.join(item.base_items)
        add_items = ', '.join(item.added_items)
        confidence = item.confidence
        lift = item.lift
        
        rules_data.append([support, confidence, lift, base_items, add_items])

rules_df = pd.DataFrame(rules_data, columns=["Support", "Confidence", "Lift", "Base Items", "Added Items"])
print(rules_df.tail(8))

请确保将 "your_file.xlsx" 替换为您的实际文件路径。此代码将根据给定的最小支持度、置信度和提升度执行 Apriori 关联规则挖掘,并从结果中提取支持度、置信度、提升度、基础项和附加项,存储在 DataFrame 中并显示最后8行的结果。


内容由零声教学AI助手提供,问题来源于学员提问

本站部分文章来源于网络,版权归原作者所有,如有侵权请联系站长删除。
转载请注明出处:https://sdn.0voice.com/?id=4312

分享:
扫描分享到社交APP
上一篇
下一篇
发表列表
游客 游客
此处应有掌声~
评论列表

还没有评论,快来说点什么吧~

联系我们

在线咨询: 点击这里给我发消息

微信号:3007537140

上班时间: 10:30-22:30

关注我们
x

注册

已经有帐号?