河北东方学院
本科毕业论文(设计)中期检查报告
题目:基于Spark的新闻头条推荐系统设计
学院:人工智能学院
专业:数据科学与大数据技术
班级:大数据技术21-2
学生姓名:xx
学 号:xx
指导教师:闫建薇(副教授)
完成时间:2024年12月28日
一、工作任务的进展情况
(一)已完成的任务
1. 用户管理模块
已实现用户注册与登录功能,并建立角色权限管理体系,确保管理员与普通用户可根据各自权限访问相应的系统资源,保障系统的安全性和操作规范性。
2. 数据查看模块
完成了空调销售数据的浏览及检索功能开发,支持按时间区间、销售区域、产品型号等多个维度进行查询与分析,提升数据使用的灵活性与效率。[此处为图片1]
3. 数据处理与分析模块
使用Pandas对空调销售相关数据进行了清洗和预处理,有效处理了缺失值与异常值问题,提取关键特征,显著提高数据质量,为后续建模与分析提供可靠基础。[此处为图片2]
二、工作中遇到的问题及改进措施
1. K-Means算法聚类效果优化
初期聚类结果存在类别边界模糊、簇间重叠现象。通过调整聚类数量K值,并采用更合理的初始中心点选择方法(如K-Means++),提升了聚类的准确性和分离度。
2. 数据可视化响应速度提升
面对前端图表加载延迟问题,优化了后端数据读取逻辑与传输结构,减少冗余计算,压缩数据量并异步加载,显著缩短渲染时间,改善用户体验。[此处为图片3]
三、下一步工作计划
(一)未完成的工作
1. 预测模块优化
将进一步深化K-Means在销售趋势分析中的应用,结合时间序列模型,增强预测结果的稳定性与精确性,提升系统对未来销售走势的判断能力。
2. 可视化分析模块开发
基于Echarts框架,构建多样化的数据展示形式,包括但不限于销售趋势折线图、区域分布饼图、销量热力图等,使数据分析更加直观易懂。
3. 后台管理功能完善
持续完善后台管理系统功能,实现对空调销售数据的增删改查一体化操作,强化权限控制机制,确保数据操作的安全性、合规性与可追溯性。
学生签名:
日期:2024年1月5日
指导教师意见:
该生在前期工作中完成了用户管理、数据查看与处理等核心模块的设计与实现,整体进展符合预期。但在算法应用深度与系统性能优化方面仍有提升空间。建议进一步加强对Spark框架在分布式推荐场景下的调优实践,注重模型实时性与扩展性。同时应加快可视化模块的集成进度,确保各模块之间的数据联动顺畅。后续需重点完成推荐逻辑的构建与测试,合理安排时间节点,保证论文撰写与系统开发同步推进。
指导教师签名:
2024年1月6日
系/教研室意见:
本课题选题具有实际应用价值,研究方向明确,技术路线合理。目前阶段任务完成情况良好,阶段性成果较为扎实。建议在后期加强系统整体集成测试,注重文档规范化整理,确保最终成果完整且具备可演示性。
负责人签名:
2024年1月8日


雷达卡


京公网安备 11010802022788号







