如何用 Java 爬取表单数据?

要爬取表单数据,需要模拟HTTP请求,并将表单数据作为请求参数发送到网站服务器。Java中有许多库可以用来发送HTTP请求,例如Apache HttpClient、OkHttp等。

以下是使用Apache HttpClient库发送POST请求并带有表单数据的示例代码:

import org.apache.http.HttpEntity;
import org.apache.http.HttpResponse;
import org.apache.http.NameValuePair;
import org.apache.http.client.HttpClient;
import org.apache.http.client.entity.UrlEncodedFormEntity;
import org.apache.http.client.methods.HttpPost;
import org.apache.http.impl.client.HttpClientBuilder;
import org.apache.http.message.BasicNameValuePair;
import org.apache.http.util.EntityUtils;

import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

public class FormSubmitExample {
    public static void main(String[] args) throws IOException {
        HttpClient httpClient = HttpClientBuilder.create().build();
        HttpPost httpPost = new HttpPost("http://example.com/submit-form");

        // Add form data
        List params = new ArrayList<>();
        params.add(new BasicNameValuePair("name", "John Doe"));
        params.add(new BasicNameValuePair("email", "[email protected]"));
        params.add(new BasicNameValuePair("message", "Hello, world!"));
        httpPost.setEntity(new UrlEncodedFormEntity(params));

        // Execute the request and get the response
        HttpResponse response = httpClient.execute(httpPost);
        HttpEntity entity = response.getEntity();
        String responseString = EntityUtils.toString(entity, "UTF-8");
        System.out.println(responseString);
    }
}

在上面的示例中,我们首先创建了一个HttpClient对象,然后创建了一个HttpPost对象并设置了要提交表单数据的URL。然后,我们创建了一个List对象并向其添加了表单字段和值。接下来,我们将这个List对象编码为URL编码的表单实体,并将其设置为HttpPost对象的实体。最后,我们执行请求并获取响应,并从响应实体中提取响应字符串。

你需要根据具体的网站和表单字段进行修改。可以在请求头中查找有关表单字段和值的信息,然后使用上述示例代码将其提交到服务器。

你可能感兴趣的:(java,开发语言)