前言 : 因为只学过J2SE部分,对JAVA网络编程也不甚了解,所以学习在JAVA操作HTTP协议时碰到很多问题.翻译这篇文章只是为了加深理解,如有不当,还望指出.
原文地址: http://java.sun.com/developer/JDCTechTips/2005/tt0913.html
在JAVA平台,访问URL资源是通过一系列协议处理器(protocol handler)来实现的.URL的起始部分指定了URL使用的协议.比如某个URL是以file:开头的,这表明这个URL资源是保存在本地文件系统的.J2SE5.0定义了几个必须实现的协议:http,https,file,jar.
作为http协议处理器实现的一部分,J2SE5.0增加了一个CookieHandler.这个类提供了一些用于管理cookies的接口.Cookie是保存在浏览器缓存中的一小块数据.当你访问一个网站然后再次访问的时候,这个cookie数据用于鉴别你的身份.Cookies能够用于保存信息,譬如一个在线商店用于保存以购商品信息.Cookie可以是短期的,为一个单独的web事务保存数据,直到关闭浏览器;也可以是长期的,保存数据一个星期或一年.
在J2SE5中并没有设置默认的CookieHandler.不过你可以注册一个Handler以便程序能够保存cookies并且在http连接的时候得到这些cookies.
回到CookieHandler这个类,这是个具有两组相关联方法的抽象类.第一组方法让你能得到当前已经设置的Handler或设置你自己的Handler:
* getDefault()
* setDefault(CookieHandler)
对于安装了安全管理器的应用来说,得到或设置handler需要特别的权限.通过设置handler为null可以清除当前设置的handler.正如之前提到的,没有设置默认的handler.
第二组方法允许你从一个你维持的cookie缓存得到cookies,或将cookies保存到这个cookie缓存.
* get(URI uri,Map<String,List<String>>requestHeaders)
* put(URI uri,Map<String,List<String>>responseHeaders)
get()方法从cookie缓存中的到之前保存的cookie并保存到requestHeaders中.put()方法从response headers 中提取cookies并保存到cookie缓存.
这看起来很简单,事实创建一个handler确实如此.但定义cookie缓存需要做更多的事情.作为示范,我们写一个自己的CookieHandler,cookie缓存以及一个测试程序.这里是测试程序的雏形:[注 1]
java 代码
import java.io.*; import java.net.*; import java.util.*; public class Fetch { public static void main(String args[]) throws Exception { if (args.length == 0 ) { System.err.println("URL missing" ); System.exit(-1 ); } String urlString = args[0 ]; CookieHandler.setDefault(new ListCookieHandler()); URL url = new URL(urlString); URLConnection connection = url.openConnection(); Object obj = connection.getContent(); url = new URL(urlString); connection = url.openConnection(); obj = connection.getContent(); } }
这个程序首先建立并安装了一个ListCookieHandler类(这个类的定义将在后面给出).然后打开了一个到URL(由命令行参数给出)的连接,并且读取其内容.再次打开另一个到URL的连接,并读取相同的内容.当第一次读取连接内容时,响应中包含的cookies将会被保存,第二次连接请求中就会包含这些保存的cookies.
下面我们来看这些是如何通过URLConnection类实现的.在建立了一个表示网络资源的URL后,我们可以用URLConnection来得到与该网站通信的输入流与输出流.
String urlString = ...;
URL url = new URL(urlString);
URLConnection connection = url.openConnection();
InputStream is = connection.getInputStream();
// .. read content from stream
这个连接中的信息可能有一部分是属于报文头,这与所用的协议有关.我们可以通过URLConnection来得到这些报文头消息,这个类提供了一些能提取报文头信息的方法,包括:
* getHeaderFields() - Gets a Map of available fields.
* getHeaderField(String name) - Gets header fields by name.
* getHeaderFieldDate(String name, long default) - Gets the header field as a date.
* getHeaderFieldInt(String name, int default) - Gets the header field as a number.
* getHeaderFieldKey(int n) or getHeaderField(int n) - Gets the header field by position.
作为一个示例,下面的程序将指定URL的所有报文头消息列出:
java 代码
import java.net.*; import java.util.*; public class ListHeaders { public static void main(String args[]) throws Exception { if (args.length == 0 ) { System.err.println("URL missing" ); } String urlString = args[0 ]; URL url = new URL(urlString); URLConnection connection = url.openConnection(); Map<String,List<String>> headerFields = connection.getHeaderFields(); Set<String> set = headerFields.keySet(); Iterator itor = set.iterator(); while (itor.hasNext()) { String key = itor.next(); System.out.println("Key: " + key + " / " + headerFields.get(key)); } } }
这个程序用一个URL作为参数(比如:http://java.sun.com),然后将从该网站返回的所有报文头消息列出,每一个报头用如下格式显示:
Key: <key> / [<value>]
如果你输入:
>> java ListHeaders http://java.sun.com
你将会看到与下面类似的输出:
Key: Set-Cookie / [SUN_ID=192.168.0.1:269421125489956; EXPIRES=Wednesday, 31- Dec-2025 23:59:59 GMT; DOMAIN=.sun.com; PATH=/]
Key: Set-cookie / [JSESSIONID=688047FA45065E07D8792CF650B8F0EA;Path=/]
Key: null / [HTTP/1.1 200 OK]
Key: Transfer-encoding / [chunked]
Key: Date / [Wed, 31 Aug 2005 12:05:56 GMT]
Key: Server / [Sun-ONE-Web-Server/6.1]
Key: Content-type / [text/html;charset=ISO-8859-1]
这些输出只包含URL的报头,并没有包括这个URL指向的HTML页面.你可能注意到这些输出信息里面包含了这个URL站点所用的web服务器以及其日期时间.同意可以看到里面包含了两行Set-Cookie,这就是报头里面携带的cookies.这些cookie能够保存下来,然后在下一次请求的时候被发送.
下面我们来建立一个CookieHandler,我们得实现CookieHandler的两个抽象方法:get()与put():
* public void put( URI uri, Map<String, List<String>> responseHeaders) throws IOException
* public Map<String, List<String>> get(URI uri, Map<String, List<String>> requestHeaders) throws IOException
其中put()方法将所有报头中的cookies保存到一个缓存中.为了实现put()方法,首先要从responseHeaders中得到"Set-Cookie"对应的List.
List<String> setCookieList =
responseHeaders.get("Set-Cookie");
当你得到cookies对应的List,将List中所有的值保存下来.如果这个cookie已经存在,就将已保存的替换掉:
java 代码
if (setCookieList != null ) { for (String item : setCookieList) { Cookie cookie = new Cookie(uri, item); for (Cookie existingCookie : cache) { ... } System.out.println("Adding to cache: " + cookie); cache.add(cookie); } }
这里的"cache"可以是一个数据库或者是一个Collections Framework中的List.其中的Cookie类将在下面定义.从本质上说,这些就是put()方法所要做的事:对于响应报头中每一个cookie,这个方法将cookie保存到缓存中.
而get()方法做的是相反的事情:将缓存中所有与URI匹配cookie添加到请求报头中,如果存在多个cookie,则建立一个用','分隔的列表.方法get()返回一个Map,而且用一个包含已有报文头的map作为参数,你应该将cookie缓存与之相匹配的cookie添加这个map里面去,但是这个Map是只读的,所以你应该首先新建另一个map,并将参数map中的内容复制过去,然后再将cookie添加进去,最后返回一个只读的map.
[注 2]
为了实现get()方法,首先要从cookie缓存中查找与URI相匹配的cookie,然后删除那些已经过期的cookie:
java 代码
StringBuilder cookies = new StringBuilder(); for (Cookie cookie : cache) { if (cookie.hasExpired()) { cache.remove(cookie); } else if (cookie.matches(uri)) { if (cookies.length() > 0 ) { cookies.append(", " ); } cookies.append(cookie.toString()); } }
这里简单说明一下Cookie类,上面代码中用到了Coookie类的两个方法:hasExpired()和matches().hasExpired()方法用于表明这个cookie是否已经过期;而matches()方法用于检验这个cookie与某个URI是否匹配.
get()方法余下部分将上面的StringBuilder中的文本添加到一个Map中,与之对应的key为"Cookie"
java 代码
Map<String, List<String>> cookieMap = new HashMap<String, List<String>>(requestHeaders); if (cookies.length() > 0 ) { List<String> list = Collections.singletonList(cookies.toString()); cookieMap.put("Cookie" , list); } return Collections.unmodifiableMap(cookieMap);
下面是CookieHandler的完整实现,里面添加了一些输出语句用于观察运行时刻的信息:
java 代码
import java.io.*; import java.net.*; import java.util.*; public class ListCookieHandler extends CookieHandler { private List<Cookie> cache = new LinkedList<Cookie>(); public void put( URI uri, Map<String, List<String>> responseHeaders) throws IOException { System.out.println("Cache: " + cache); List<String> setCookieList = responseHeaders.get("Set-Cookie" ); if (setCookieList != null ) { for (String item : setCookieList) { Cookie cookie = new Cookie(uri, item); for (Cookie existingCookie : cache) { if ((cookie.getURI().equals( existingCookie.getURI())) && (cookie.getName().equals( existingCookie.getName()))) { cache.remove(existingCookie); break ; } } System.out.println("Adding to cache: " + cookie); cache.add(cookie); } } } public Map<String, List<String>> get( URI uri, Map<String, List<String>> requestHeaders) throws IOException { StringBuilder cookies = new StringBuilder(); for (Cookie cookie : cache) { if (cookie.hasExpired()) { cache.remove(cookie); } else if (cookie.matches(uri)) { if (cookies.length() > 0 ) { cookies.append(", " ); } cookies.append(cookie.toString()); } } Map<String, List<String>> cookieMap = new HashMap<String, List<String>>(requestHeaders); if (cookies.length() > 0 ) { List<String> list = Collections.singletonList(cookies.toString()); cookieMap.put("Cookie" , list); } System.out.println("Cookies: " + cookieMap); return Collections.unmodifiableMap(cookieMap); } }
到这里,我们的工作只剩下Cookie类的实现了.这个工作的重头戏在其构造函数部分,你需要从URI以及报文头里面解析出所需要的信息.其中的cookie有效日期信息的格式是确定的,但其它信息对不同的网站有不同的格式.不过这也没有什么困难的,只需要把cookie路径,有效日期,域名这些信息保存下来就是了.
java 代码
public Cookie(URI uri, String header) { String attributes[] = header.split(";" ); String nameValue = attributes[0 ].trim(); this .uri = uri; this .name = nameValue.substring( 0 , nameValue.indexOf('=')); this .value = nameValue.substring(nameValue.indexOf('=')+ 1 ); this .path = "/" ; this .domain = uri.getHost(); for ( int i= 1 ; i < attributes.length; i++) { nameValue = attributes[i].trim(); int equals = nameValue.indexOf('='); if (equals == - 1 ) { continue ; } String name = nameValue.substring(0 , equals); String value = nameValue.substring(equals+1 ); if (name.equalsIgnoreCase( "domain" )) { String uriDomain = uri.getHost(); if (uriDomain.equals(value)) { this .domain = value; } else { if (!value.startsWith( "." )) { value = "." + value; } uriDomain = uriDomain.substring(uriDomain.indexOf('.' )); if (!uriDomain.equals(value)) { throw new IllegalArgumentException( "Trying to set foreign cookie" ); } this .domain = value; } } else if (name.equalsIgnoreCase( "path" )) { this .path = value; } else if (name.equalsIgnoreCase( "expires" )) { try { this .expires = expiresFormat1.parse(value); } catch (ParseException e) { try { this .expires = expiresFormat2.parse(value); } catch (ParseException e2) { throw new IllegalArgumentException( "Bad date format in header: " + value); } } } }
Cookie类的其它方法只需要返回这些信息,或者检查有效日期就OK了:
java 代码
public boolean hasExpired() { if (expires == null ) { return false ; } Date now = new Date(); return now.after(expires); } public String toString() { StringBuilder result = new StringBuilder(name); result.append("=" ); result.append(value); return result.toString(); }
对于一个已经过期的cookie,其matchs方法总是返回false:
public boolean matches(URI uri) {
if (hasExpired()) {
return false;
}
String path = uri.getPath();
if (path == null) {
path = "/";
}
return path.startsWith(this.path);
}
注意:Cookie规范中要求同时检查域名以及路径,为了简单起见,我们这里只检查了路径.
这里是Cookie的完整定义:
java 代码
- import java.net.*;
- import java.text.*;
- import java.util.*;
-
- public class Cookie {
-
- String name;
- String value;
- URI uri;
- String domain;
- Date expires;
- String path;
-
- private static DateFormat expiresFormat1
- = new SimpleDateFormat( "E, dd MMM yyyy k:m:s 'GMT'" , Locale.US);
-
- private static DateFormat expiresFormat2
- = new SimpleDateFormat( "E, dd-MMM-yyyy k:m:s 'GMT'" , Locale.US);
-
-
-
-
-
-
-
-
- public Cookie(URI uri, String header) {
- String attributes[] = header.split(";" );
- String nameValue = attributes[0 ].trim();
- this .uri = uri;
- this .name =
- nameValue.substring(0 , nameValue.indexOf('='));
- this .value =
- nameValue.substring(nameValue.indexOf('=')+1 );
- this .path = "/" ;
- this .domain = uri.getHost();
-
- for ( int i= 1 ; i < attributes.length; i++) {
- nameValue = attributes[i].trim();
- int equals = nameValue.indexOf('=');
- if (equals == - 1 ) {
- continue ;
- }
- String name = nameValue.substring(0 , equals);
- String value = nameValue.substring(equals+1 );
- if (name.equalsIgnoreCase( "domain" )) {
- String uriDomain = uri.getHost();
- if (uriDomain.equals(value)) {
- this .domain = value;
- } else {
- if (!value.startsWith( "." )) {
- value = "." + value;
- }
- uriDomain = uriDomain.substring(
- uriDomain.indexOf('.' ));
- if (!uriDomain.equals(value)) {
- throw new IllegalArgumentException(
- "Trying to set foreign cookie" );
- }