文章由本人原创,如需转载,请注明转载出处!本文地址:
http://blog.csdn.net/xxd851116/archive/2009/06/24/4293239.aspx
第一次做项目需要生成静态页面,网上很多大牛对将网页生成静态页面有很多异议。说一下我的看法。
不外乎有以下因素:
1、从页面加载时间来看:静态页面不需要与数据库建立连接,尤其是访问数据量较大的页面,这种页面大多要查很多结果集,因此建立连接次数就增多了,时间不可观,而静态页面则省去了这些时间。
2、从便于搜索引擎抓取的角度来讲:搜索引擎更喜欢静态的网页,静态网页与动态网页相比,搜索引擎更喜欢静的,更便于抓取,搜索引擎SEO排名更容易提高,一些大门户站页面大多都采用静态或伪静态网页来显示,更便于搜索引擎抓取与排名。
3、从安全性来看:静态网页不宜遭到黑客攻击,因为黑客不知道你的网站的后台、网站采用程序、数据库的地址。
4、从稳定性来看:哪天数据库服务器挂了,动态网页就拜拜了!而要运行一个静态网页的发布服务器,相信大家都知道配置不是太高也行的吧?呵呵。
因此,我认为,生成静态页面具有可行性。
那么怎么把动态网页的代码生成静态网页呢?又存在哪呢?原理其实很简单。
1、利用Freemark模板生成静态页面,网上搜一下大把大把的代码随你挑,我就不在这里啰嗦了。
我很讨厌这种方式,因为对于一个数据量较大的页面来讲工作量太大,要写模板,语法又比较怪异,不流行!
2、也是我偶尔想起来的。用Java中URLConnection抓取某个URL网页源码(这是原理核心)生成html文件,就是这么简单!就是这么Easy!
代码奉上!
1)、以下是捕捉网页源码程序:
import java.io.BufferedReader; import java.io.File; import java.io.IOException; import java.io.InputStreamReader; import java.net.MalformedURLException; import java.net.URL; import java.net.URLConnection; import java.util.regex.Matcher; import java.util.regex.Pattern; import org.apache.commons.io.FileUtils; import org.apache.commons.lang.StringUtils; /** * @author Xing,XiuDong */ public class HTMLGenerator { public static final String generate(final String url) { if (StringUtils.isBlank(url)) { return null; } Pattern pattern = Pattern.compile("(http://|https://){1}[//w//.//-/:]+"); Matcher matcher = pattern.matcher(url); if (!matcher.find()) { return null; } StringBuffer sb = new StringBuffer(); try { URL _url = new URL(url); URLConnection urlConnection = _url.openConnection(); BufferedReader in = new BufferedReader(new InputStreamReader(urlConnection.getInputStream())); String inputLine; while ((inputLine = in.readLine()) != null) { sb.append(inputLine); } } catch (MalformedURLException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } return sb.toString(); } /** * Test Code * Target : http://www.google.cn/ */ public static void main(String[] args) throws IOException { String src = HTMLGenerator.generate("http://www.google.cn/"); File file = new File("C:" + File.separator + "index.html"); FileUtils.writeStringToFile(file, src, "UTF-8"); } }
2)、将源码写入Html文件,这个需要根据用户的需求了,我根据我项目中遇到的情况写了以下代码:(附测试程序:http://www.google.cn/)
/** * generite html source code * * @author Xing,XiuDong * @date 2009.06.22 * @param request * @param url * @param toWebRoot * @param encoding * @throws IOException */ public void genHtml(HttpServletRequest request, String url, boolean toWebRoot, String encoding) throws IOException { if (null == url) { url = request.getRequestURL().toString(); } String contextPath = request.getContextPath(); String seq = StringUtils.substring(String.valueOf(new Date().getTime()), -6); String ctxPath = super.getServlet().getServletContext().getRealPath(File.separator); if (!ctxPath.endsWith(File.separator)) { ctxPath += File.separator; } String filePath = StringUtils.substringAfter(url, contextPath); filePath = filePath.replaceAll("//.(do|jsp|html|shtml)$", ".html"); String savePath = ""; String autoCreatedDateDir = ""; if (!toWebRoot) { savePath = StringUtils.join(new String[] { "files", "history", "" }, File.separator); String[] folderPatterns = new String[] { "yyyy", "MM", "dd", "" }; autoCreatedDateDir = DateFormatUtils.format(new Date(), StringUtils.join(folderPatterns, File.separator)); filePath = StringUtils.substringBefore(filePath, ".html") + "-" + seq + ".html"; } File file = new File(ctxPath + savePath + autoCreatedDateDir + filePath); FileUtils.writeStringToFile(file, HTMLGenerator.generate(url), encoding); }