微博舆情挖掘需求分析

微博舆情挖掘需求分析

目录
1、项目需求是什么
2、项目需求的任务
3、项目需求的作用
4、项目需求的评估方法
5、本项目需求说明书

详情
1、项目需求是什么
做什么事情( 宏观描述)
为什么要做(讲清楚原因和价值)
从业务逻辑角度,讲清楚要如何做(微观细节说明,产出prd文档,即Product Requirement Document)
明确阶段目标(里程碑)和验收标准(干成什么样子算ok)
风险控制与过程管理

2、项目需求的任务
产出prd文档,即Product Requirement Document
prd演示
精准广告人群定向项目(魔方)
天亮舆情监控系统

3、项目需求的作用
准确勾勒和描绘用户的问题
便于需求方、用户、开发者三方沟通交流
开发人员工作的基础和依据
确认测试和验收的依据
产品和开发互相撕逼的依据
产品和开发互相撕逼的依据
产品和开发互相撕逼的依据

4、项目需求的评估方法
是否有价值
是否有可执行性
是否能解决项目的立项需求
人员与进度按排是否合适
验收标准是否合理

5、本项目需求说明书
做什么事情
给定一批微博博文数据,构建到hive数据仓库中,挖掘出数据的热点关键词,并能在web页面中显示。
为什么要做
迅速捕捉社交网络内热词,可以作为新闻素材、视频推荐、商品推荐等依据。
从业务逻辑角度,讲清楚要如何做
给定具有时间连续性的微博文章不低于100万条即可,实际给出2.2亿条。(csv格式)

1.将文本文件导入到hive的指定微博内容表中
2.通过nlp分词处理,将一条一条的博文拆解成一个一个的词序列(Term Sequene)。
3.对词序列中的全部元素做词频统计(Term Frequence Statistic)
4.对词统统计结果做倒排输出,得到舆情热词
5.将数据推送到mysql指定数据表中
6.搭建java web项目,在前端页面中调用后端的数据接口,将数据返回到前端中。
7.在前端调用绘图插件,将舆情热词用比较炫的方式显示出来。
8.明确阶段目标(里程碑)和验收标准(干成什么样子算ok)
9.风险控制与过程管理

你可能感兴趣的:(项目)