hive电影数据分析 Springboot协同过滤-余弦函数推荐系统 爬虫2万+数据 大屏数据展示 + [手把手视频教程 和 开发文档]
【功能介绍】
1. java爬取【豆瓣电影】网站中电影数据, 保存为data.csv文件, 数据量2万+
2. data.csv上传到hadoop集群环境
3. MR 数据清洗data.csv
4.Hive汇总处理, 将Hive处理的结果数据保存到本地Mysql数据库中
5. Springboot+Vue+Echarts+MySQL 显示数据分析结果
数据维度分别为【热门电影类型】【电影简介词云】【各国家电影数量】【电影评分排名】【各年份上映电影数】
【电影类型评分均值】【电影评论热度排名】
【运行环境】 Idea JDK Maven XShell VM虚拟机 Mysql
【技术栈】 springboot vue echarts Hadoop Hive MarReduce mysql
【亮点功能】
1.Springboot+Vue+Element-UI+Mysql前后端分离
2.Echarts图表统计数据, 直观展示数据情况
3.发表评论后,用户可以回复评论, 回复的评论可以被再次回复, 一级评论可以添加图片附件
4.推荐电影列表展示,推荐电影根据 协同过滤-余弦函数 进行推荐
5.数据导出和导入(文件格式为excel)
6.数据库优化: 使用 唯一索引, 联合索引, 外键关联, 视图,存储过程,函数,触发器
7.开发本项目过程中遇到的问题以及解决方法(视频形式阐述)
【技术栈】
1.后端开发语言java,框架Springboot, 开发工具IDEA
2.前端技术vue, html, css, 开发工具IDEA或者VSCODE
3.数据库使用mysql, 后端使用mybatis操作mysql, mybaits手写sql语句, 数据库表数量>10张
4.JWT验证身份并授权, 自定义注解, 拦截器, 切面, 前后端分离跨域访问
5.Element-UI, axios数据通讯交互, vue消息总线, flex样式布局, router路由
wangEditor富文本编辑器, Echarts图表统计数据
6.localStorage浏览器缓存存储用户信息 , 前端后端用户可同时在同一浏览器登录
7.数据库优化: 使用 唯一索引, 联合索引, 外键关联, 视图,存储过程,函数,触发器