本页总结了模型训练过程中的评估指标、结果可视化方式,以及项目结论与优化建议。
推荐系统的评估不宜使用传统分类指标(如 accuracy),而应采用能反映推荐排序质量的指标。我们选用了:
使用 LightFM 模型在 Retailrocket 数据集上的训练与测试结果如下:
指标 | 值 |
---|---|
AUC@Train | 0.9985 |
AUC@Test | 0.8280 |
训练周期 | 100 轮(单线程) |
AUC 测试结果表明,该模型在用户历史行为上具有良好的排序能力,适合用作电商类商品推荐原型系统。
我们在 Notebook 中生成了两个关键图像,辅助理解模型预测质量与推荐表现:
展示了 LightFM 模型在训练集与测试集上的 AUC 表现,测试集结果达到 0.828,属于“良好”推荐效果区间。
展示了模型对部分用户推荐的物品数量与其真实正反馈数量之间的差异,验证推荐集中度与偏好覆盖率。
本项目展示了如何基于公开数据集与 Python 工具链,从数据建模、算法实现到评估分析构建完整的推荐系统原型,适合作为业务落地前的快速验证方案。