基于Java协同算法实现的仿今日头条资讯网站设计

目 录
摘 要 I
ABSTRACT II
目 录 III
第一章 前言 1
1.1 课题背景 1
1.2 课题目的与意义 1
1.3 本文研究的内容 2
1.4 论文结构简介 2
第二章 算法介绍 3
2.1 算法背景 3
2.2 算法分类及原理 3
2.2.1 以用户为基础的协同过滤 4
2.2.2 以物品为基础的协同过滤 4
2.3 算法优缺点 4
2.3.1 以用户为基础的协同过滤的优缺点: 4
2.3.2 以物品为基础的协同过滤的优缺点: 5
2.4 算法适用场景 5
2.5 本章小结 5
第三章 系统需求 7
3.1 可行性分析 7
3.1.1 经济可行性分析 7
3.1.2 技术可行性分析 7
3.1.3 社会可行性分析 8
3.1.4 操作可行性分析 8
3.2 用户需求说明 9
3.3 用户界面需求 10
3.4 管理需求说明 11
3.5 系统数据模型分析 11
3.6 系统数据流图 12
3.7 本章小结 14
第四章 系统概要设计 15
4.1 模块设计 15
4.1.1 模块划分 15
4.1.2 功能模块图 15
4.2 数据库设计 16
4.2.1 数据库物理模型图 16
4.2.2 数据库存储结构 17
4.3 本章小结 18
第五章 系统实现与测试 19
5.1 系统实现说明 19
5.2 代码结构 19
5.2.1 代码结构介绍 19
5.2.2 代码结构图 20
5.3 系统实现 20
5.3.1 推荐功能的实现 20
5.3.2 爬虫的实现 22
5.4 系统测试 25
5.4.1 测试的目的与内容 25
5.4.2 具体测试说明 25
5.4.3 测试登录 26
5.4.4 测试爬虫数据存储 27
5.4.5 测试资讯相关功能 28
5.4.6 测试推荐功能 32
5.4.7 测试结论 34
5.5 本章小结 34
结 论 35
参考文献 37
致 谢 39
附录A:全文图表索引 41
附录B:部分核心代码 43
3.2用户需求说明
为了开发出真正满足用户需求的软件产品,首先必须知道用户的需求。对软件需求的深入理解是软件开发工作获得成功的前提条件,不论人们把设计和编码工作做得如何出色,不能真正满足用户需求的程序只会令用户失望,给开发者带来烦恼。[1]
需求是用户为了解决现有问题,所提出的改善措施或改进建议,它是用户期望的一个准确描述。实现需求的过程中,就是通过实现软件功能,使其满足用户期望,达成用户目标。以下主要从三个方面对用户的需求进行说明:
1、门户类网站访问量巨大
在这个资讯爆发的年代,人们为了解决遇到的问题,或是为了获取新的信息来满足自我发展,需要经常在网络中搜索资讯或者浏览资讯。“有问题谷歌一下”或是“有问题百度一下”是IT技术以及中国民间所流行的两句俚语,百度甚至将其作为推广宣传的标语,这足以体现资讯搜索在现今社会中的重要性。搜索是用户以主动的方式从网络中获取想要的资讯,与其相对的被动获取则是各类资讯门户网站,这些网站通过人工的方式进行资讯的发布以及展示,是用户获取资讯的主要手段之一。有些门户网站因为它们的名称朗朗上口或是因为其优质的内容,已经成了人们生活中了解社会、行业或是为了自我提高而必不可少的一部分。
据统计,搜索类网站中谷歌旗下的域名google.com独立访客(UV)月平均访问量达15亿,google.com(谷歌搜索,主要负责搜索)该域名占比67.85%,约10亿;百度旗下的baidu.com域名独立访客月平均访问量达3亿,baidu.com(百度搜索,同谷歌)该域名占比74.17%,约2亿,zhidao.baidu.com(百度知道,百度旗下的问答平台)占比31。04%,约9000万,baike.baidu.com(百度百科,百度旗下的网络百科全书平台)占比19.98%,约6000万。新闻类网站中新浪旗下的sina.com.cn域名独立访客月平均访问量达1.2亿,其新闻网站域名news.sina.com.cn占比34.02%,约4000万;腾讯旗下的qq.com域名月平均访问量达2亿,旗下新闻网站域名news.qq.com占比14.41%,约2800万。
以上这些信息体现出,现今社会人们对于资讯的获取是极度渴望的。
2、科技技术发展迅速
随着人们在科学道路上的不断发展,科技技术水平不断提升,计算机已经从最开始的占地170平方米的庞然大物,缩小到了只有巴掌大小的智能手机,可以说是经历的巨大的改变。并且,随着网络技术的发展,及互联网概念的提出,人们获取资讯的方式极为便利,成本也得到了降低。人们回到家中,遇到了问题可以用PC打开如谷歌或者百度这样的搜索网站,键入自己遇到的问题或想要获取的资讯,随后将会得到“可能是自己想要的结果”,但由于这个互联网的发展,这个“可能的结果”通常都能解决用户的问题,或是用户想要的;而对于那些专注于一个领域,或是关注社会发展的用户,在网站持续运营的情况下,可以随时访问各类门户网站,获取社会最新动态、行业最新资讯或是领域内最新的研究成果;而出行在外,随着wifi的普及,人们可以使用笔记本电脑或是平板电脑查阅资讯,即使在不满足这些情况的条件下,人们的智能手机还能使用蜂窝网络连入互联网浏览资讯。
以上信息体现出,人们获取资讯的方式多样,成本较低,不受时间地域限制。
3、推荐功能的必要性
无论是上面提到的搜索还是门户网站,都是需要用户主动去网络世界中获取,用户以该种形式获取资讯时,不能保证资讯的完整性,可能有些资讯是用户需要的关键点,但因为一些原因用户未能获取到的话,将有可能给用户带来极大的阻碍。这些原因可能是用户关键字的不准确表达造成的搜索结果不匹配;网页布局影响造成的用户没看到、时间影响造成资讯显示排序过于后面;人为对展示结果的影响等。为了解决这些潜在因素影响下,用户未能看到一些信息的问题,资讯推荐是一种有效且必要的措施,它能主动为用户推荐一些信息,消除用户主动获取时所隐含的部分劣势,弥补用户被动获取资讯的不足。
3.3用户界面需求
1、界面设计风格
现在市面上的新闻网站有很多,这些新闻网站的内容丰富全面,是用户获取讯息的重要途径。但是这些网站在用户体验上存在不足,包含的页面元素过多,容易给用户造成选择困难;另外页面布局排版及广告等对用户浏览造成视觉影响。本课题的网站的页面设计主要借鉴今日头条的页面样式来设计,以减少页面内容来突出显示用户感兴趣的资讯信息。
2、交互设计
根据《用户体验要素》、以及《DON’T THINK》提出的思想,让用户看得舒服,看得明白,用得舒服为原则,使用户在与网站进行交互操作时,感到舒适及舒心。
看得明白:能看懂文字的意思,产品的组成和结构,产品运转方式。
看得舒服:能知道从何看起,找到想到的东西,能看懂布局,能分清视觉化差异的意思。
用得舒服:敲键盘,移动鼠标,鼠标单击、双击和拖动,切换输入方式,导航的点击次数。
3、界面要求
考虑大龄用户、页面元素以及对计算机尚不熟悉的人群,网页操作的学习成本应该降低,网页的复杂度也不应太高。
3.4管理需求说明
本课题系统基于协同算法的资讯网站,整个Web系统跟资讯息息相关,从资讯的获取、资讯的展示、资讯敏感词等各方面都有管理的需求。以下将对这三个方面进行说明。
1、资讯管理
资讯数据是个非常大数据集,其标题以及内容的数据量都是非常占用内存的,一两条可能看不出来,当数据量多起来的时候,那么存储量将会非常巨大,即使这样本Web系统还采用数据库的原因是这样能够方便对资讯的管理。本课题Web系统在资讯存储方面采用了数据库进行储存,那么后台管理模块中,需要能对数据库中的资讯进行管理。其中包括数据库中资讯信息的查看、资讯的删除。网站资讯数据来源于爬虫,所以资讯管理功能中将不包括资讯信息的添加以及资讯信息的修改。
2、敏感词管理
根据相关政策,或是为了网站健康良好的发展,需要对一些词汇进行设置,在网站显示或是其它功能中禁用这些词汇,这类词汇称作敏感词汇。敏感词汇可能是一些脏话、带有政治倾向、暴力倾向、不健康色彩的词语。本课题系统中用户可以自行查找资讯,在搜索时将会对搜索的关键词进行过滤,本文转载自http://www.biyezuopin.vip/onews.asp?id=15072如果出现敏感词列表中的词汇,将会对用户进行提示“当前搜索中可能包含敏感词汇,请重新搜索!”。所以为了网站的持续发展,需要对敏感词进行管理,包括敏感词的添加、敏感词的查看以及敏感词的删除。遂网站后台模块需要有能对敏感词进行管理的模块。
3、爬虫管理
本课题Web系统中的资讯来源为爬虫获取,那么将会涉及到爬虫的一些相关操作,如:爬虫的启动、爬虫的停止、爬虫抓取链接的设置。那么爬虫管理功能对后台管理来说,也是必不可少的一部分。
4、用户信息管理
本课题Web系统涉及到用户的注册与登录,用户数据采用数据库存储,所以用户信息管理也将会是后台管理中的一部分。

<%@ page contentType="text/html;charset=utf-8" language="java"%>

	
		<%
			String path = request.getContextPath();
		%>
		
		数据搜索

		
		


		
		
		
		
		
	

	
登录

欢迎您的搜索

搜索历史

基于Java协同算法实现的仿今日头条资讯网站设计_第1张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第2张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第3张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第4张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第5张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第6张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第7张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第8张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第9张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第10张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第11张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第12张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第13张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第14张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第15张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第16张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第17张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第18张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第19张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第20张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第21张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第22张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第23张图片
基于Java协同算法实现的仿今日头条资讯网站设计_第24张图片

你可能感兴趣的:(Java,协同算法,仿今日头条,新闻资讯网站,毕业设计)