【精华】Java项目生成静态页面

需转载,请注明转载出处!本文地址:

http://blog.csdn.net/xxd851116/archive/2009/06/24/4293239.aspx

第一次做项目需要生成静态页面,网上很多大牛对将网页生成静态页面有很多异议。说一下我的看法。

不外乎有以下因素:
1、从页面加载时间来看:静态页面不需要与数据库建立连接,尤其是访问数据量较大的页面,这种页面大多要查很多结果集,因此建立连接次数就增多了,时间不可观,而静态页面则省去了这些时间。
2、从便于搜索引擎抓取的角度来讲:搜索引擎更喜欢静态的网页,静态网页与动态网页相比,搜索引擎更喜欢静的,更便于抓取,搜索引擎SEO排名更容易提高,一些大门户站页面大多都采用静态或伪静态网页来显示,更便于搜索引擎抓取与排名。
3、从安全性来看:静态网页不宜遭到黑客攻击,因为黑客不知道你的网站的后台、网站采用程序、数据库的地址。
4、从稳定性来看:哪天数据库服务器挂了,动态网页就拜拜了!而要运行一个静态网页的发布服务器,相信大家都知道配置不是太高也行的吧?呵呵。

因此,我认为,生成静态页面具有可行性。

那么怎么把动态网页的代码生成静态网页呢?又存在哪呢?原理其实很简单。
1、利用Freemark模板生成静态页面,网上搜一下大把大把的代码随你挑,我就不在这里啰嗦了。
我很讨厌这种方式,因为对于一个数据量较大的页面来讲工作量太大,要写模板,语法又比较怪异,不流行!
2、也是我偶尔想起来的。用Java中URLConnection抓取某个URL网页源码(这是原理核心)生成html文件,就是这么简单!就是这么Easy!

代码奉上!

1)、以下是捕捉网页源码程序:

view plaincopy to clipboardprint?
import java.io.BufferedReader;  
import java.io.File;  
import java.io.IOException;  
import java.io.InputStreamReader;  
import java.net.MalformedURLException;  
import java.net.URL;  
import java.net.URLConnection;  
import java.util.regex.Matcher;  
import java.util.regex.Pattern;  
 
import org.apache.commons.io.FileUtils;  
import org.apache.commons.lang.StringUtils;  
 
/** 
* @author Xing,XiuDong 
*/ 
public class HTMLGenerator {  
 
    public static final String generate(final String url) {  
        if (StringUtils.isBlank(url)) {  
            return null;  
        }  
 
        Pattern pattern = Pattern.compile("(http://|https://){1}[\\w\\.\\-/:]+");  
        Matcher matcher = pattern.matcher(url);  
        if (!matcher.find()) {  
            return null;  
        }  
 
        StringBuffer sb = new StringBuffer();  
 
        try {  
            URL _url = new URL(url);  
            URLConnection urlConnection = _url.openConnection();  
            BufferedReader in = new BufferedReader(new InputStreamReader(urlConnection.getInputStream()));  
 
            String inputLine;  
            while ((inputLine = in.readLine()) != null) {  
                sb.append(inputLine);  
            }  
        } catch (MalformedURLException e) {  
            e.printStackTrace();  
        } catch (IOException e) {  
            e.printStackTrace();  
        }  
 
        return sb.toString();  
    }  
 
    /** 
     * Test Code 
     * Target : http://www.google.cn/ 
     */ 
    public static void main(String[] args) throws IOException {  
        String src = HTMLGenerator.generate("http://www.google.cn/");  
 
        File file = new File("C:" + File.separator + "index.html");  
        FileUtils.writeStringToFile(file, src, "UTF-8");  
    }  
 

import java.io.BufferedReader;
import java.io.File;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLConnection;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

import org.apache.commons.io.FileUtils;
import org.apache.commons.lang.StringUtils;

/**
* @author Xing,XiuDong
*/
public class HTMLGenerator {

public static final String generate(final String url) {
if (StringUtils.isBlank(url)) {
return null;
}

Pattern pattern = Pattern.compile("(http://|https://){1}[\\w\\.\\-/:]+");
Matcher matcher = pattern.matcher(url);
if (!matcher.find()) {
return null;
}

StringBuffer sb = new StringBuffer();

try {
URL _url = new URL(url);
URLConnection urlConnection = _url.openConnection();
BufferedReader in = new BufferedReader(new InputStreamReader(urlConnection.getInputStream()));

String inputLine;
while ((inputLine = in.readLine()) != null) {
sb.append(inputLine);
}
} catch (MalformedURLException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}

return sb.toString();
}

/**
* Test Code
* Target : http://www.google.cn/
*/
public static void main(String[] args) throws IOException {
String src = HTMLGenerator.generate("http://www.google.cn/");

File file = new File("C:" + File.separator + "index.html");
FileUtils.writeStringToFile(file, src, "UTF-8");
}

}

2)、将源码写入Html文件,这个需要根据用户的需求了,我根据我项目中遇到的情况写了以下代码:(附测试程序:http://www.google.cn/)

view plaincopy to clipboardprint?
/** 
* generite html source code 
*  
* @author Xing,XiuDong 
* @date 2009.06.22 
* @param request 
* @param url 
* @param toWebRoot 
* @param encoding 
* @throws IOException 
*/ 
public void genHtml(HttpServletRequest request, String url, boolean toWebRoot, String encoding) throws IOException {  
 
    if (null == url) {  
        url = request.getRequestURL().toString();  
    }  
 
    String contextPath = request.getContextPath();  
    String seq = StringUtils.substring(String.valueOf(new Date().getTime()), -6);  
 
    String ctxPath = super.getServlet().getServletContext().getRealPath(File.separator);  
    if (!ctxPath.endsWith(File.separator)) {  
        ctxPath += File.separator;  
    }  
 
    String filePath = StringUtils.substringAfter(url, contextPath);  
    filePath = filePath.replaceAll("\\.(do|jsp|html|shtml)$", ".html");  
 
    String savePath = "";  
    String autoCreatedDateDir = "";  
    if (!toWebRoot) {  
        savePath = StringUtils.join(new String[] { "files", "history", "" }, File.separator);  
 
        String[] folderPatterns = new String[] { "yyyy", "MM", "dd", "" };  
        autoCreatedDateDir = DateFormatUtils.format(new Date(), StringUtils.join(folderPatterns, File.separator));  
 
        filePath = StringUtils.substringBefore(filePath, ".html") + "-" + seq + ".html";  
    }  
 
    File file = new File(ctxPath + savePath + autoCreatedDateDir + filePath);  
    FileUtils.writeStringToFile(file, HTMLGenerator.generate(url), encoding);  

/**
* generite html source code
*
* @author Xing,XiuDong
* @date 2009.06.22
* @param request
* @param url
* @param toWebRoot
* @param encoding
* @throws IOException
*/
public void genHtml(HttpServletRequest request, String url, boolean toWebRoot, String encoding) throws IOException {

if (null == url) {
url = request.getRequestURL().toString();
}

String contextPath = request.getContextPath();
String seq = StringUtils.substring(String.valueOf(new Date().getTime()), -6);

String ctxPath = super.getServlet().getServletContext().getRealPath(File.separator);
if (!ctxPath.endsWith(File.separator)) {
ctxPath += File.separator;
}

String filePath = StringUtils.substringAfter(url, contextPath);
filePath = filePath.replaceAll("\\.(do|jsp|html|shtml)$", ".html");

String savePath = "";
String autoCreatedDateDir = "";
if (!toWebRoot) {
savePath = StringUtils.join(new String[] { "files", "history", "" }, File.separator);

String[] folderPatterns = new String[] { "yyyy", "MM", "dd", "" };
autoCreatedDateDir = DateFormatUtils.format(new Date(), StringUtils.join(folderPatterns, File.separator));

filePath = StringUtils.substringBefore(filePath, ".html") + "-" + seq + ".html";
}

File file = new File(ctxPath + savePath + autoCreatedDateDir + filePath);
FileUtils.writeStringToFile(file, HTMLGenerator.generate(url), encoding);
}

发表于 @ 2009年06月24

你可能感兴趣的:(java,apache,.net,搜索引擎,Google)