project-wexler

📊 模型评估与结果展示

本页总结了模型训练过程中的评估指标、结果可视化方式,以及项目结论与优化建议。


🎯 评估指标设计与选型

推荐系统的评估不宜使用传统分类指标(如 accuracy),而应采用能反映推荐排序质量的指标。我们选用了:

✅ AUC(Area Under ROC Curve)


📈 模型结果摘要

使用 LightFM 模型在 Retailrocket 数据集上的训练与测试结果如下:

指标
AUC@Train 0.9985
AUC@Test 0.8280
训练周期 100 轮(单线程)

AUC 测试结果表明,该模型在用户历史行为上具有良好的排序能力,适合用作电商类商品推荐原型系统。


🖼 可视化分析

我们在 Notebook 中生成了两个关键图像,辅助理解模型预测质量与推荐表现:

AUC 得分比较图

展示了 LightFM 模型在训练集与测试集上的 AUC 表现,测试集结果达到 0.828,属于“良好”推荐效果区间。

AUC Scores


推荐质量分布图

展示了模型对部分用户推荐的物品数量与其真实正反馈数量之间的差异,验证推荐集中度与偏好覆盖率。

Recommendation Quality


✅ 项目总结与优化建议

当前成果

后续优化方向


本项目展示了如何基于公开数据集与 Python 工具链,从数据建模、算法实现到评估分析构建完整的推荐系统原型,适合作为业务落地前的快速验证方案。