java 爬网页

import java.io.InputStream;
import java.net.URL;
import java.util.Arrays;

import org.apache.commons.io.IOUtils;
import org.apache.commons.lang.StringUtils;

public class Test {

	public static void main(String[] args) {
		try {
			URL url = new URL("http://www.biquge.la/book/67/");
			InputStream input = url.openStream();
			String str = IOUtils.toString(input, "gbk");
			String[] arr=StringUtils.substringsBetween(str,"<dd>", "</dd>");
			System.out.println(Arrays.toString(arr));
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
}

你可能感兴趣的:(java 爬网页)