HttpClient4.x进行Get/Post请求并使用ResponseHandler处理响应

查看原文请移步http://www.yshjava.cn/post/420.html

HTTPClient4之后,基本重写了3的所有代码,使得API用起来更显简单有力,最简单的例子体现在get/post请求以及请求响应结果的处理上。3的时候,需要自己处理响应流,无论是网页编码识别还是代码处理等各方面,非常不便,4之后使用ResponseHandler可以非常方便和简洁地处理上述问题。
如下代码演示了如何使用响应处理器(ResponseHandler)来处理HTTP响应。这是执行HTTP请求和处理HTTP响应的推荐方式。这种做法使调用者将注意力集中在处理HTTP响应内容的过程中,并委派任务释放HttpClient所占用的系统资源。ResponseHandler能够保证在任何情况下都会将底层的HTTP连接释放回连接管理器。

 

以Get方式请求目标网页并使用ResponseHandler处理响应:

 

package cn.ysh.studio.crawler.httpclient;

import org.apache.http.client.HttpClient;
import org.apache.http.client.ResponseHandler;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.BasicResponseHandler;
import org.apache.http.impl.client.DefaultHttpClient;

/**
 * 以Get方式提交请求并使用ResponseHandler简化响应结果的处理
 *
 * @author www.yshjava.cn
 */
public class GetTest {

    public static void main(String[] args) throws Exception {
        //目标页面
        String url = "http://www.yshjava.cn";
        //创建一个默认的HttpClient
        HttpClient httpclient = new DefaultHttpClient();
        try {
            //以get方式请求网页http://www.yshjava.cn
            HttpGet httpget = new HttpGet(url);
            //打印请求地址
            System.out.println("executing request " + httpget.getURI());
            //创建响应处理器处理服务器响应内容
            ResponseHandler<String> responseHandler = new BasicResponseHandler();
            //执行请求并获取结果
            String responseBody = httpclient.execute(httpget, responseHandler);
            System.out.println("----------------------------------------");
            System.out.println(responseBody);
            System.out.println("----------------------------------------");
        } finally {
            // 当不再需要HttpClient实例时,关闭连接管理器以确保释放所有占用的系统资源
            httpclient.getConnectionManager().shutdown();
        }

    }
}

 

以Post方式带参数请求目标网页并使用ResponseHandler处理响应:

package cn.ysh.studio.crawler.httpclient;

import java.util.ArrayList;
import java.util.List;

import org.apache.http.NameValuePair;
import org.apache.http.client.HttpClient;
import org.apache.http.client.ResponseHandler;
import org.apache.http.client.entity.UrlEncodedFormEntity;
import org.apache.http.client.methods.HttpPost;
import org.apache.http.impl.client.BasicResponseHandler;
import org.apache.http.impl.client.DefaultHttpClient;
import org.apache.http.message.BasicNameValuePair;

/**
 * 以Post方式提交请求并使用ResponseHandler简化响应结果的处理
 *
 * @author www.yshjava.cn
 */
public class PostTest {

    public static void main(String[] args) throws Exception {
        //目标页面
        String url = "http://www.yshjava.cn";
        //创建一个默认的HttpClient
        HttpClient httpclient = new DefaultHttpClient();
        try {
            //以post方式请求网页http://www.yshjava.cn
            HttpPost httppost = new HttpPost(url);
            //添加HTTP POST参数
            List <NameValuePair> nvps = new ArrayList <NameValuePair>();
            nvps.add(new BasicNameValuePair("username", "www.yshjava.cn"));
            nvps.add(new BasicNameValuePair("password", "yshjava"));

			//将POST参数以UTF-8编码并包装成表单实体对象
            httppost.setEntity(new UrlEncodedFormEntity(nvps, "UTF-8"));
            //打印请求地址
            System.out.println("executing request " + httppost.getRequestLine().getUri());
            //创建响应处理器处理服务器响应内容
            ResponseHandler<String> responseHandler = new BasicResponseHandler();
            //执行请求并获取结果
            String responseBody = httpclient.execute(httppost, responseHandler);
            System.out.println("----------------------------------------");
            System.out.println(responseBody);
            System.out.println("----------------------------------------");
        } finally {
            // 当不再需要HttpClient实例时,关闭连接管理器以确保释放所有占用的系统资源
            httpclient.getConnectionManager().shutdown();
        }

    }
}

 

原创文章,转载请注明出处http://www.yshjava.cn/post/420.html

 

你可能感兴趣的:(httpclient,网络爬虫,网页抓取,网络蜘蛛)